Jak vysoce kvalitně překládat skenované PDF nebo obrazové dokumenty?
“Skenované dokumenty jsou ve své podstatě obrázky a není možné v nich přímo vybrat a přeložit text. Tradiční OCR často ztrácí původní rozvržení stránky, což vede k tomu, že překlad je pouze neuspořádaný čistý text.”
Analýza hlavní příčiny
Vysoce přesné AI OCR
Použitím OCR enginu založeného na hlubokém učení lze přesně extrahovat text a rozpoznat jeho strukturu odstavců i u šikmých, rozmazaných nebo ručně psaných skenovaných dokumentů.
Vizuální obnova a rekonstrukce pozadí
Překlad neznamená pouze překrytí textu. Systém využívá technologii obrazové rekonstrukce (inpainting) k odstranění původního textu a doplnění pozadí, následně umístí překlad v podobném fontu a velikosti písma zpět na původní místo, čímž vytvoří nový dokument, který je vizuálně totožný s originálem.
Shrnutí konečného řešení
Neživé obrazové dokumenty se tak mění v čitelné a srozumitelné vícejazyčné materiály.