Hvorfor kan O.Translator nøyaktig bevare komplekse PDF-layouts?
“PDF er i sitt vesen «tegneinstruksjoner» og ikke tekstflyt, noe som gjør at tekst ofte kuttes fysisk i fragmenter og at layouten lett kan bryte sammen etter oversettelse.”
Analyse av grunnleggende årsak
Dyptgående dokumentstrukturparsing
O.Translator ekstraherer ikke bare tekst, men benytter proprietære algoritmer for å identifisere den visuelle strukturen (Visual Structure) i PDF. Den kan presist fastslå den logiske rekkefølgen av tekstblokker (Text Blocks), og intelligent slå sammen setninger som er fysisk delt av spalter, bilder osv., til komplette setninger før oversettelse.
Selvtilpassende layout-omtegning
Etter oversettelse justerer systemet dynamisk skriftstørrelse og linjeavstand basert på tekstlengden i målspråket (for eksempel blir tekst ofte lengre fra engelsk til tysk, og kortere til kinesisk), for å sikre at plasseringen av diagrammer, topptekst, bunntekst og bakgrunnsbilder forblir nøyaktig uten avvik.
Oppsummering av endelig løsning
Ved å bruke en prosess med «først dekonstruere, deretter gjenskape», oppnås pikselnøyaktig layout-gjengivelse.