Ako môže dátový analytik prekladať CSV/TSV dataset bez narušenia štruktúry stĺpcov?
“Pri priamom preklade CSV súborov často dochádza k neúmyselnému odstráneniu alebo prekladu čiarok (oddeľovačov), čo spôsobuje posun údajov v stĺpcoch a znemožňuje import do Excelu alebo databázy.”
Analýza základných príčin
Absolútna ochrana oddeľovačov
Systém striktne rozlišuje medzi obsahom dát a štruktúrnymi znakmi. Či už ide o čiarky (CSV) alebo tabulátory (TSV), sú označované ako needitovateľné prvky, čím sa zabezpečí, že počet stĺpcov vo výslednom preklade bude presne zodpovedať pôvodnému súboru.
Inteligentné zmrazenie hlavičky tabuľky
Automatická identifikácia prvého riadku ako hlavičky (Header). Používateľ si môže zvoliť, že nebude prekladať názvy polí v hlavičke (aby sa nenarušilo mapovanie do databázy), ale preloží iba obsah pod hlavičkou, alebo zvoliť preklad celého súboru.
Netextové dáta sa preskočia
Inteligentne identifikuje a preskakuje ID, SKU, URL, čisto číselné hodnoty a dátumové formáty, pričom prekladá len opisný text, aby sa čo najviac zachovala použiteľnosť pôvodných údajov.
Zhrnutie konečného riešenia
Uľahčuje a zrýchľuje viacjazyčné čistenie a analýzu dát s bezproblémovou integráciou do BI nástrojov.