هل تؤدي ترجمة ملفات PDF إلى تخريب التخطيط وظهور رموز غير مفهومة أو تداخل النصوص؟ كشف جوهر تكنولوجيا الذكاء الاصطناعي في التعرف على الهيكل البصري للوثيقة.
تشخيص الوضع الحالي الأساسي
“جوهر ملف PDF هو أنه عبارة عن ‘مطبوع إلكتروني’، حيث تتوزع النصوص ضمن نظام إحداثيات، وليس وفق منطق تدفقي.”
تحليل الأسباب الجذرية
تحليل الهيكل البصري (DLA)
عبر نماذج الرؤية الحاسوبية تتم ‘مسح’ الصفحة كاملة لتحديد الحدود الفيزيائية لرأس وتذييل الصفحة، والرسوم التوضيحية، وكتل النص الأساسية.
ملخص الحل النهائي
سر الحفاظ على التخطيط يكمن في أننا نعيد بناء نظام إحداثيات للوثيقة يدعم تعدد اللغات.