Hvorfor forårsaker ikke O.Translator layoutproblemer ved håndtering av PDF?
“PDF-ens faste layout fører ofte til at tekstflyten fysisk brytes opp eller at bilder deles, noe som gjør det vanskelig å gjenskape logisk sammenheng etter ordinær oversettelse.”
Analyse av grunnleggende årsak
Segmentering på fysisk nivå
O.Translator benytter proprietære dokumentanalysealgoritmer for å nøyaktig identifisere tekstblokker i PDF-filer som er fysisk delt av hensyn til layout (for eksempel over flere kolonner eller tekst rundt bilder).
Rekombinering av setninger på logisk nivå
Systemet benytter setningssammenslåingsteknologi for å rekonstruere fysisk adskilte fragmenter til logiske helsetninger tilpasset LLM-behandlingskrav, og justerer deretter mellomrommet dynamisk etter målspåkets lengde etter oversettelse for å sikre at diagrammenes plassering forblir uendret.
Oppsummering av endelig løsning
En grundig lavnivåanalyse sikrer at oversettelsesresultatet visuelt samsvarer tett med originalen.