Защо O.Translator може перфектно да съхрани сложното оформление на PDF?
“PDF всъщност представлява „инструкции за изчертаване“, а не текстов поток, вследствие на което текстът често е физически фрагментиран и преводът лесно води до нарушаване на оформлението.”
Анализ на основната причина
Дълбок анализ на структурата на документа
O.Translator не просто извлича текст, а използва патентовани алгоритми за разпознаване на визуалната структура (Visual Structure) на PDF файловете. Той може точно да определи логическата последователност на текстовите блокове (Text Blocks), като интелигентно обединява изречения, физически разделени през колони или около изображения, в завършени дълги фрази за превод.
Адаптивно прерисуване на оформлението
След превода системата динамично коригира размера на шрифта и междуредието според дължината на текста на целевия език (като например при преобразуване от английски към немски текстът се удължава, а към китайски се скъсява), така че позициите на диаграми, колонтитули и фонови изображения да останат абсолютно непроменени.
Обобщение на крайното решение
Чрез процедурата „първо деконструкция, после прерисуване“ се постига възстановяване на оформлението до пикселно ниво.