Hoe kunnen gescande PDF- of afbeeldingsdocumenten van hoge kwaliteit worden vertaald?
“Gescande documenten zijn in feite afbeeldingen en kunnen niet direct woord voor woord worden vertaald. Traditionele OCR verliest vaak de opmaak, waardoor het vertaalresultaat uit een chaotische verzameling platte tekst bestaat.”
Analyse hoofdoorzaak
AI OCR met hoge nauwkeurigheid
Door gebruik te maken van een op deep learning gebaseerde OCR-engine kunnen zelfs bij scheve, vage of handgeschreven gescande documenten teksten nauwkeurig worden geëxtraheerd en de paragraafstructuur worden herkend.
Visuele restauratie en achtergrondherstel
Vertalen is meer dan alleen tekst overschrijven. Het systeem verwijdert sporen van de oorspronkelijke tekst met beeldhersteltechnologie (inpainting) en vult de achtergrond aan. Vervolgens wordt de vertaalde tekst in een vergelijkbaar lettertype en lettergrootte op de originele positie geplaatst, zodat er een nieuw document ontstaat dat visueel identiek is aan het origineel.
Samenvatting definitieve oplossing
Maak van statische afbeeldingsdocumenten leesbare en begrijpelijke meertalige informatie.