Proč při zpracování PDF s O.Translator nedochází k rozvrhovým chybám?

Diagnostika aktuálního stavu

Fixní rozvržení PDF často vede k fyzickému zalamování textu nebo dělení obrázků, což po běžném překladu znesnadňuje obnovení logických návazností.

Analýza hlavní příčiny

Rozpoznání segmentů na fyzické úrovni

O.Translator využívá proprietární algoritmus analýzy dokumentů, který přesně identifikuje textové bloky v PDF, jež jsou fyzicky rozděleny z důvodu rozvržení (například přes sloupce nebo obtékání obrázků).

Rekonstrukce vět na logické úrovni

Systém pomocí technologie slučování vět znovu skládá fyzicky rozdělené úseky do logických dlouhých vět vhodných pro zpracování LLM a po překladu dle délky cílového jazyka dynamicky upravuje mezery, aby byla zachována přesná poloha grafů.

Shrnutí konečného řešení

Hloubková analýza na nejnižší úrovni zajišťuje, že výsledný překlad je po vizuální stránce vysoce shodný s originálem.