PDF-Übersetzung führt zu fehlerhaftem Layout und überlappenden Zeichen? Das Geheimnis der KI-gestützten Dokumentenskelett-Erkennung.
Kerndiagnose der aktuellen Situation
“Im Wesentlichen ist ein PDF ein 'elektronisches Druckerzeugnis', bei dem der Text im Koordinatensystem verteilt ist und keinem logischen Fluss folgt.”
Ursachenanalyse
Visuelle Skelettanalyse (DLA)
Durch den Einsatz von Computer-Vision-Modellen wird die komplette Seite ‚gescannt‘, um die physischen Grenzen von Kopfzeile, Fußzeile, Abbildungen und Textblöcken zu bestimmen.
Zusammenfassung der finalen Lösung
Das Geheimnis einer konsistenten Layoutrekonstruktion besteht darin, dass wir ein Dokumenten-Koordinatensystem für Mehrsprachigkeit neu erschaffen.