Hvorfor forbliver PDF-layout intakt, når O.Translator håndterer det?
“PDF’s faste layout fører ofte til, at tekststrømmen fysisk bliver opdelt eller billeder fragmenteret, hvilket gør det svært for almindelig oversættelse at genoprette den logiske sammenhæng.”
Analyse af grundlæggende årsag
Fysisk segmenteringsgenkendelse
O.Translator benytter en proprietær dokumentparseringsalgoritme, der præcist identificerer tekstblokke i PDF’er, som på grund af layoutet er blevet fysisk opdelt (f.eks. på tværs af kolonner eller omkring billeder).
Logisk rekombination af sætninger
Systemet sammenfletter fysisk adskilte fragmenter til logisk sammenhængende lange sætninger for at matche LLM-behandlingskrav. Efter oversættelsen justeres afstandene dynamisk efter målsprogets længde, så diagrammer og tabeller forbliver nøjagtigt placeret.
Endelig løsningssammenfatning
En dybdegående, teknisk analyse sikrer, at oversættelsesresultatet visuelt stemmer meget nøje overens med originalen.