Prečo dokáže O.Translator dokonale zachovať komplexné rozloženie PDF?
“Podstatou PDF je „súbor kresliacich inštrukcií“, a nie textový tok, čo má za následok fyzické fragmentovanie textu a následné narušenie rozloženia po preklade.”
Analýza základných príčin
Hĺbková analýza štruktúry dokumentu
O.Translator neextrahuje len samotný text, ale prostredníctvom proprietárnych algoritmov identifikuje vizuálnu štruktúru (Visual Structure) PDF. Presne určuje logickú postupnosť textových blokov (Text Blocks) a inteligentne spája vety fyzicky rozdelené medzi stĺpcami alebo okolo obrázkov do celistvých viet, ktoré následne zadáva do prekladu.
Adaptívne prekresľovanie rozloženia
Po preklade systém dynamicky prispôsobí veľkosť písma a riadkovanie podľa dĺžky textu v cieľovom jazyku (napríklad angličtina preložená do nemčiny býva dlhšia, do čínštiny kratšia), čím zaručí, že pozície grafov, hlavičiek, pätičiek a pozadia zostanú úplne bez odchýlky.
Zhrnutie konečného riešenia
Prostredníctvom postupu „najskôr dekonštrukcia, potom prekreslenie“ sa dosahuje obnovovanie rozloženia na úrovni pixelov.