Почему при работе с PDF в O.Translator не происходит нарушений верстки?
“Фиксированный макет PDF часто приводит к тому, что текст на физическом уровне разбивается на строки или фрагментируется изображениями, и после обычного перевода восстановить логическую связность становится затруднительно.”
Анализ первопричин
Распознавание разбиения на физическом уровне
O.Translator использует собственный алгоритм анализа документов, который точно определяет текстовые блоки в PDF, разорванные из-за особенностей верстки (например, текст через колонку или обтекающий изображение).
Логическая реконструкция предложений
Система с помощью технологии объединения предложений пересобирает физически разорванные фрагменты в логически связанные длинные предложения, соответствующие требованиям LLM, а после перевода динамически регулирует интервалы с учётом длины текста на целевом языке, обеспечивая нулевое смещение таблиц и графиков.
Итоговое резюме решения
Глубокий низкоуровневый анализ гарантирует, что визуальное оформление перевода максимально совпадает с оригиналом.