OCR

Algemeen
OCR (Optical Character Recognition) is een vertaalslag van pixels naar tekst. Dit maakt het mogelijk om archiefstukken doorzoekbaar te maken.

Miljoenen pagina's worden na de digitalisering onderworpen aan een OCR-behandeling. Hiervoor beschikt GMS over een hoogvolume OCR-applicatie welke op basis van geavanceerde detectie- en verificatiemethoden in staat is om een kwalitatief hoogwaardige output te realiseren.

Filtering
Het filteren van specifieke data uit archiefstukken biedt de mogelijkheid om geheel automatisch gegevens te 'ontleden'. De filtering van data is realiseerbaar middels maatwerk software of reeds bestaande software. De data kan vervolgens worden ontsloten in databases of gedefinieerd worden als metadata in een bestand.

Voordelen
OCR heeft vele voordelen. Belangrijkste voordeel is de doorzoekbaarheid van grote archiefcollecties. Niet alleen de gezochte informatie is snel beschikbaar maar tevens kan aanverwante informatie opgespoord worden.

Specialisme
Grote aantallen en hoge kwaliteit zijn vaak twee issues die de bottleneck vormen voor het OCR-en van bestanden. Professionele software in combinatie met 'enterprise-level' hardware zijn nodig om hoogvolume OCR in te kunnen zetten. Een goed OCR resultaat hangt dus af van goede input(scans) en professionele hard- en software.  

Klik hier voor de bestandsformaten welke kunnen worden gegenereerd middels OCR