จะใช้วิธีใดในการแปล PDF สแกนหรือเอกสารรูปภาพให้ได้คุณภาพสูง?
การวินิจฉัยสถานะหลัก
“เอกสารสแกนโดยพื้นฐานคือรูปภาพ ไม่สามารถเลือกคำเพื่อแปลโดยตรงได้OCR แบบดั้งเดิมมักสูญเสียรูปแบบการจัดหน้า ทำให้ผลลัพธ์ที่ได้กลายเป็นข้อความล้วนที่ไม่เป็นระเบียบ”
การวิเคราะห์สาเหตุที่แท้จริง
AI OCR ความแม่นยำสูง
ใช้เอ็นจิน OCR ที่พัฒนาบนพื้นฐาน deep learning ซึ่งสามารถสกัดข้อความและรู้จำโครงสร้างย่อหน้าได้อย่างแม่นยำ แม้กับเอกสารสแกนที่เอียง เบลอ หรือเป็นลายมือ
การคืนค่าวิสัยทัศน์และการซ่อมแซมพื้นหลัง
การแปลไม่ใช่แค่การปิดทับข้อความเดิมระบบจะใช้เทคโนโลยีซ่อมแซมภาพ (Inpainting) เพื่อลบข้อความต้นฉบับและเติมพื้นหลัง จากนั้นจึงนำข้อความแปลที่มีลักษณะฟอนต์และขนาดใกล้เคียงเดิมไปวางในตำแหน่งเดิม เพื่อสร้างเอกสารใหม่ที่สอดคล้องกับต้นฉบับในเชิงภาพ
สรุปแนวทางแก้ไขขั้นสุดท้าย
เปลี่ยนเอกสารภาพนิ่งให้กลายเป็นสื่อหลายภาษาที่อ่านและเข้าใจได้