O.Translator가 PDF의 복잡한 레이아웃을 완벽하게 보존할 수 있는 이유는 무엇일까요?

핵심 현황 진단

PDF는 본질적으로 ‘그리기 명령어(drawing instruction)’ 기반으로 구성되어 있어, 텍스트가 물리적으로 조각나기 쉽고, 그 결과 번역 시 레이아웃이 쉽게 무너질 수 있습니다.

근본 원인 분석

심층 문서 구조 분석

O.Translator는 단순히 텍스트를 추출하는 데 그치지 않고, 독자적 알고리즘을 통해 PDF의 시각적 구조(Visual Structure)를 정밀하게 인식합니다. 이 기술은 텍스트 블록(Text Blocks)의 논리적 순서를 정확히 판단하여, 여러 칼럼이나 이미지 주변 등에서 물리적으로 분리된 문장도 지능적으로 하나의 완전한 긴 문장으로 합친 뒤 번역합니다.

적응형 레이아웃 재구성

번역 후 시스템은 대상 언어 텍스트 길이(예: 영어에서 독일어로 변환 시 길어지고, 중국어로 변환 시 짧아짐)에 따라 글꼴 크기와 줄 간격을 동적으로 조정하여, 도표, 머리글/바닥글, 배경 이미지 위치의 '제로 드리프트'를 보장합니다.

최종 솔루션 요약

'선 해체, 후 재구성' 공정을 통해 픽셀 단위의 레이아웃 복원을 구현합니다.