“Gescande documenten zijn in feite afbeeldingen en kunnen niet direct woord voor woord worden vertaald. Traditionele OCR verliest vaak de opmaak, waardoor het vertaalresultaat uit een chaotische verzameling platte tekst bestaat.”

Analyse hoofdoorzaak

AI OCR met hoge nauwkeurigheid

Door gebruik te maken van een op deep learning gebaseerde OCR-engine kunnen zelfs bij scheve, vage of handgeschreven gescande documenten teksten nauwkeurig worden geëxtraheerd en de paragraafstructuur worden herkend.

Visuele restauratie en achtergrondherstel

Vertalen is meer dan alleen tekst overschrijven. Het systeem verwijdert sporen van de oorspronkelijke tekst met beeldhersteltechnologie (inpainting) en vult de achtergrond aan. Vervolgens wordt de vertaalde tekst in een vergelijkbaar lettertype en lettergrootte op de originele positie geplaatst, zodat er een nieuw document ontstaat dat visueel identiek is aan het origineel.

Samenvatting definitieve oplossing

Maak van statische afbeeldingsdocumenten leesbare en begrijpelijke meertalige informatie.