Hvordan oversette skannede PDF- eller bildedokumenter med høy kvalitet?
“Skannede dokumenter er i hovedsak bilder og kan ikke oversettes direkte ved å velge tekst. Tradisjonell OCR mister ofte oppsettet, noe som fører til at oversettelsesresultatet blir en ustrukturert tekstmasse.”
Analyse av grunnleggende årsak
Høy-presisjons AI OCR
Ved å benytte en dyplæringsbasert OCR-motor kan tekst og avsnittsstruktur nøyaktig hentes ut selv fra skannede dokumenter som er skjeve, uklare eller håndskrevne.
Visuell gjengivelse og bakgrunnsreparasjon
Oversettelse er mer enn bare å dekke til tekst. Systemet benytter bildebehandlingsteknologi (Inpainting) for å fjerne spor av originalteksten og fylle inn bakgrunnen, og deretter «tegnes» oversettelsen tilbake på plass med lignende skrifttype og størrelse. Slik skapes et nytt dokument som visuelt samsvarer med originalen.
Oppsummering av endelig løsning
Gjør statiske bildedokumenter om til lesbare og forståelige flerspråklige ressurser.