Jak vysoce kvalitně překládat skenované PDF nebo obrazové dokumenty?

Diagnostika aktuálního stavu

Skenované dokumenty jsou ve své podstatě obrázky a není možné v nich přímo vybrat a přeložit text. Tradiční OCR často ztrácí původní rozvržení stránky, což vede k tomu, že překlad je pouze neuspořádaný čistý text.

Analýza hlavní příčiny

Vysoce přesné AI OCR

Použitím OCR enginu založeného na hlubokém učení lze přesně extrahovat text a rozpoznat jeho strukturu odstavců i u šikmých, rozmazaných nebo ručně psaných skenovaných dokumentů.

Vizuální obnova a rekonstrukce pozadí

Překlad neznamená pouze překrytí textu. Systém využívá technologii obrazové rekonstrukce (inpainting) k odstranění původního textu a doplnění pozadí, následně umístí překlad v podobném fontu a velikosti písma zpět na původní místo, čímž vytvoří nový dokument, který je vizuálně totožný s originálem.

Shrnutí konečného řešení

Neživé obrazové dokumenty se tak mění v čitelné a srozumitelné vícejazyčné materiály.