ทำไม O.Translator จึงสามารถคงรูปแบบ PDF ที่ซับซ้อนได้อย่างสมบูรณ์แบบ?

การวินิจฉัยสถานะหลัก

“โดยแท้จริงแล้ว PDF คือ 'ชุดคำสั่งการวาด' ไม่ใช่กระแสข้อความ ทำให้มักเกิดการตัดแบ่งข้อความเป็นชิ้นส่วนเล็ก ๆ และมีแนวโน้มสูญเสียรูปแบบหลังการแปล”

การวิเคราะห์สาเหตุที่แท้จริง

การแยกวิเคราะห์โครงสร้างเอกสารเชิงลึก

O.Translator ไม่เพียงแค่ดึงข้อความ แต่ใช้ อัลกอริทึมเอกสิทธิ์ในการตรวจจับโครงสร้างเชิงภาพ (Visual Structure) ของ PDFสามารถวิเคราะห์ลำดับตรรกะของบล็อกข้อความ (Text Blocks) ได้อย่างแม่นยำ และรวมข้อความที่ถูกตัดข้ามคอลัมน์หรือรอบภาพให้เป็นประโยคสมบูรณ์ ก่อนนำไปแปล

การรีวาดเลย์เอาท์แบบปรับตัวอัตโนมัติ

หลังจากแปลแล้ว ระบบจะปรับขนาดตัวอักษรและระยะห่างระหว่างบรรทัดแบบไดนามิกตามความยาวของข้อความในภาษาเป้าหมาย (เช่น จากภาษาอังกฤษเป็นเยอรมันที่ข้อความยาวขึ้น หรือจากอังกฤษเป็นจีนที่สั้นลง) เพื่อให้ตำแหน่งของกราฟิก ตาราง ส่วนหัว ส่วนท้าย และภาพพื้นหลัง ไม่มีการเคลื่อนที่ผิดเพี้ยนแม้แต่น้อย

สรุปแนวทางแก้ไขขั้นสุดท้าย

ด้วยกระบวนการ 'แยกโครงสร้างก่อน รีวาดใหม่ทีหลัง' สามารถคงรูปแบบระดับพิกเซลได้อย่างถูกต้องแม่นยำ