Prečo pri spracovaní PDF nedochádza s O.Translator k poruche rozloženia?
“Fixné rozloženie PDF často spôsobuje, že textový tok je na fyzickej úrovni zalamovaný alebo fragmentovaný obrázkami, čo pri bežnom preklade znemožňuje obnovu logickej nadväznosti.”
Analýza základných príčin
Rozpoznávanie segmentov na fyzickej úrovni
O.Translator využíva proprietárny algoritmus analýzy dokumentov, ktorý presne rozpoznáva textové bloky fyzicky prerušené z dôvodu rozloženia v PDF (napríklad cez stĺpce, alebo text obtáčajúci obrázok).
Rekonštrukcia viet na logickej úrovni
Systém využíva technológiu zlúčenia viet, ktorá fyzicky rozdelené úseky opätovne skladá do logicky súvislých viet vhodných pre spracovanie LLM; po preklade dynamicky upravuje rozostupy podľa dĺžky cieľového jazyka a zaručuje nulový posun pozície grafov a tabuliek.
Zhrnutie konečného riešenia
Hĺbková analýza na úrovni základnej architektúry zabezpečuje, že výsledky prekladu sú vizuálne vysoko zhodné s originálnym dokumentom.