Wanneer je een papieren document scant om een pdf-document te maken, moet je bijzonder voorzichtig zijn.

  • • Het originele document kan nog steeds in jouw computer zitten. Het is dan raadzaam om deze versie online te zetten of het bestand in pdf-formaat te exporteren vanuit jouw tekstverwerkingsprogramma.
  • • Als het document een handtekening of een officiële stempel nodig heeft, kun je niet anders dan het document scannen. Zorg ervoor dat het pdf-bestand doorzoekbaar* is gemaakt met behulp van de optie "OCR" die beschikbaar is op uw kantoorscanner/multifunctioneel kopieerapparaat.

Wat is OCR?

Optical Character Recognition (OCR) is een programma dat letters, cijfers en andere tekens in een tekst als beeld herkent en als tekst opslaat.

* Een doorzoekbaar pdf-bestand is een bestand dat eruit ziet als een gescand document (inclusief eventuele stempels en handgeschreven handtekeningen), maar dat leesbaar is door spraakherkenningssoftware.

Doel?

Deze verborgen tekst kan door een gebruiker worden gekopieerd in een formaat naar keuze, maar kan ook worden gelezen door een schermlezer voor blinde gebruikers.

Goed om weten

Pdf-bestanden die door dit proces toegankelijk worden gemaakt, zijn niet zo toegankelijk als documenten die uit Word worden geëxporteerd:

  • Informatie over titels en tekstbeschrijvingen zijn niet meer beschikbaar (leesbaar door assistentiesoftware) in een gescand document.
  • Het is mogelijk om in te zoomen op een pdf-document, maar de letters zijn niet scherp als de pdf niet van voldoende kwaliteit is en als de tekstomloopfunctie (de manier waarop Word de tekst om een afbeelding of vorm zal plaatsen) niet werkt.

Voorbeeld van een OCR

Het meest vervelende probleem is dat tekstherkenning (OCR) niet altijd van goede kwaliteit is bij een pdf-bestand. Degene die in de scanner/printersoftware is geïntegreerd is vaak van mindere kwaliteit.

Om te controleren of de tekstherkenning geslaagd is, selecteer je (met Ctrl A) de tekst (in de verborgen tekst) en plak je deze (met Ctrl V) in een nieuw tekstbestand. Helaas zul je niet in staat zijn om de fouten te corrigeren als je geen gespecialiseerde software hebt.

Als je regelmatig documenten online publiceert, is het zinvol om te investeren in betere software of om te overwegen de documenten (ook) in een ander formaat aan te bieden.