PDF-fordítás után elcsúszott betűk, átfedő szövegek? Bemutatjuk az AI-alapú dokumentumváz-felismerés lényegét.
Alapvető helyzetértékelés
“A PDF lényege egy 'elektronikus nyomtatvány', ahol a szöveg pontonként helyezkedik el a koordinátarendszerben, nem pedig logikai folyamatként.”
Kiváltó ok elemzése
Vizuális vázanalízis (DLA)
Számítógépes látás alapú modellel 'letapogatjuk' a teljes oldalt, és meghatározzuk a fejléc, lábléc, illusztrációk, valamint a törzsszöveg fizikai határait.
Végső megoldás összefoglalója
A helyes elrendezés megőrzésének titka abban rejlik, hogy egy többnyelvűséget támogató dokumentum-koordinátarendszert építünk újjá.