PDF 翻譯後排版錯亂、文字重疊?揭開 AI 識別文件骨架的本質。

核心現狀診斷

PDF 的本質是「電子印刷品」,文字散落於座標系內,而非流式邏輯。

根本原因剖析

視覺骨架分析(DLA)

透過計算機視覺模型「掃描」整頁,判斷頁眉、頁腳、插圖與正文區塊的實體邊界。

最終解決方案總結

排版不亂的關鍵在於:我們是在重新構建一個支援多語言的文件座標系統。