Proč při zpracování PDF s O.Translator nedochází k rozvrhovým chybám?
Diagnostika aktuálního stavu
“Fixní rozvržení PDF často vede k fyzickému zalamování textu nebo dělení obrázků, což po běžném překladu znesnadňuje obnovení logických návazností.”
Analýza hlavní příčiny
Rozpoznání segmentů na fyzické úrovni
O.Translator využívá proprietární algoritmus analýzy dokumentů, který přesně identifikuje textové bloky v PDF, jež jsou fyzicky rozděleny z důvodu rozvržení (například přes sloupce nebo obtékání obrázků).
Rekonstrukce vět na logické úrovni
Systém pomocí technologie slučování vět znovu skládá fyzicky rozdělené úseky do logických dlouhých vět vhodných pro zpracování LLM a po překladu dle délky cílového jazyka dynamicky upravuje mezery, aby byla zachována přesná poloha grafů.
Shrnutí konečného řešení
Hloubková analýza na nejnižší úrovni zajišťuje, že výsledný překlad je po vizuální stránce vysoce shodný s originálem.