なぜO.TranslatorはPDF処理でレイアウトの崩れが発生しないのか?
現状の主要診断
“PDFの固定レイアウトは、テキストの流れが物理的に改行されたり、画像で分断されたりするため、一般的な翻訳では論理的なつながりを再現することが困難です。”
根本原因の分析
物理層での分割識別
O.Translatorは独自の文書解析アルゴリズムを採用し、レイアウト上の都合で物理的に分割されたテキストブロック(カラムをまたぐ部分や図回りのテキストなど)を的確に検出します。
論理層での文再構成
システムは文結合技術により、物理的に分断されたフレーズをLLM処理要件に適合した論理的な長文へ再構築し、翻訳後はターゲット言語に合わせて間隔を動的に調整することで、図表やレイアウトの位置ずれを防ぎます。
最終ソリューションまとめ
深層の解析により、翻訳結果は視覚表現において原稿と高度に一致します。