Po tłumaczeniu PDF pojawiają się problemy z łamaniem tekstu, znaki są zniekształcone, a tekst się nakłada? Odkrywamy istotę AI w analizie szkieletu dokumentu.
Diagnoza kluczowego stanu obecnego
“PDF w swojej istocie to „elektroniczny druk”, gdzie tekst rozmieszczony jest w układzie współrzędnych, a nie w logicznej strukturze przepływu.”
Analiza przyczyn podstawowych
Wizualna analiza szkieletu (DLA)
Za pomocą modeli widzenia komputerowego „skanujemy” całą stronę, aby określić fizyczne granice nagłówków, stopek, ilustracji i głównych bloków tekstu.
Podsumowanie rozwiązania końcowego
Tajemnica poprawnego układu polega na tym, że na nowo budujemy dokumentowy system współrzędnych obsługujący wiele języków.