Archiefinstellingen als het Nationaal Archief en het Noord-Hollands Archief voeren projecten uit met handschriftherkenningstechnieken (HTR). Hiervoor wordt een grote hoeveelheid scans en de transcripties aangeboden aan de computer die hierdoor handschriften leert. De algoritmes worden steeds beter, meer dan 90% van alle karakters wordt door de computer juist getranscribeerd.
De archiefinstellingen hebben deze handschriftherkenning losgelaten op diverse (gescande) archieven, waaronder VOC-documenten (Nationaal Archief) en notariële akten (Noord-Hollands Archief). Het resultaat is dat de computer al deze bronnen heeft getranscribeerd, zeg maar "van plaatjes naar tekst" gebracht. En al deze tekst kun je doorzoeken!
Open Archieven heeft al deze door de computer via handschriftherkenning gemaakte transcripties doorzoekbaar gemaakt. Met deze zoekfunctie kunt u de bronnen "full-text" doorzoeken. Dus geef een naam, beroep of plaats op als zoekterm en doorzoek in één keer de volledige transcripties van 2,4 miljoen scans.
JP Ouweltjes - 16 mar 2021 - 14:16 (laatst bijgewerkt 16 mar 2021 — 14:18 door auteur)
Dat is weer een mooie sprong voorwaarts!
Het zou wel nuttig zijn als er intelligente sorteer-opties zouden worden toegevoegd, want de zoekresultaten staan nu volledig door elkaar, zonder enige logica