Prečo pri spracovaní PDF nedochádza s O.Translator k poruche rozloženia?

Diagnostika aktuálneho stavu

Fixné rozloženie PDF často spôsobuje, že textový tok je na fyzickej úrovni zalamovaný alebo fragmentovaný obrázkami, čo pri bežnom preklade znemožňuje obnovu logickej nadväznosti.

Analýza základných príčin

Rozpoznávanie segmentov na fyzickej úrovni

O.Translator využíva proprietárny algoritmus analýzy dokumentov, ktorý presne rozpoznáva textové bloky fyzicky prerušené z dôvodu rozloženia v PDF (napríklad cez stĺpce, alebo text obtáčajúci obrázok).

Rekonštrukcia viet na logickej úrovni

Systém využíva technológiu zlúčenia viet, ktorá fyzicky rozdelené úseky opätovne skladá do logicky súvislých viet vhodných pre spracovanie LLM; po preklade dynamicky upravuje rozostupy podľa dĺžky cieľového jazyka a zaručuje nulový posun pozície grafov a tabuliek.

Zhrnutie konečného riešenia

Hĺbková analýza na úrovni základnej architektúry zabezpečuje, že výsledky prekladu sú vizuálne vysoko zhodné s originálnym dokumentom.