co je kvalita dat? Vysvětluje, Co se Kvality Údajů Vlastně Znamená,

Pokud pracujete s daty, pravděpodobně jste slyšeli termín více než pár krát, ale co je kvalita dat? Víte, co to vlastně znamená A co analytici kvality dat dělají? Pokud ne, tento článek je pro vás.

nemusí to být tak populární módní slovo jako velká data,ale je to často používaný termín ve světě dat. Analytici dat rádi všem připomínají, že kvalita je nezbytná pro odvození hodnoty z dat.

Ale ne vždy mít čas, aby ji definovat nebo poskytovat real-svět příklady typů problémů, které kvalitu dat nástroje správná. Tak se na to podíváme.

co je kvalita dat? Definice

základní definice je tato: kvalita dat je schopnost dané datové sady sloužit zamýšlenému účelu.

jinak řečeno, pokud máte vysoce kvalitní data, vaše data jsou schopna poskytnout vhled, který doufáte, že se z toho dostanete. Naopak, pokud jsou vaše data nekvalitní, je ve vašich datech problém, který vám zabrání používat data k tomu, co doufáte, že s nimi dosáhnete.

příklady

pro další ilustraci definice se podívejme na několik příkladů výzev v reálném světě.

Představte si, že máme datovou sadu, která se skládá ze jmen a adres. Data, jako je tato, pravděpodobně obsahují některé chyby z různých důvodů – jednoduchých i komplikovaných.

Jednoduché příčiny chyb dat jsou jména a adresy, které byly zadány nesprávně, nebo adresu informace, které se změnilo od té doby byly shromážděny.

v datové sadě mohou existovat další složitější problémy. Jedním z nich jsou záznamy, které jsou nejednoznačné kvůli neúplným informacím. Například, jeden záznam může být adresa pro pana. Smith, který žije ve městě „Londýn,“ bez specifikované země. To je problém, protože nevíme, zda Londýn, ve kterém pan. Smith bydlí v Londýně, Anglie, Londýn, Ontario nebo jedno z dalších desítek měst po celém světě s názvem Londýn. Pokud nepoužíváte nástroj pro kvalitu dat k nápravě této nejednoznačnosti, budete mít potíže s použitím sady dat k dosažení pana Smitha.

jako další příklad komplexního problému zvažte problém zdánlivě redundantních adres v datové sadě. Řekněme, že máme v naší databázi několik záznamů pro lidi jménem pan Smith, kteří bydlí na hlavní ulici 123. To by mohlo být výsledkem jednoduchého dvojitého zápisu: možná byla data pro pana Smitha zadána více než jednou omylem.

další možností je, že existuje více milenců – otec a syn, možná-pobývajících na stejné adrese. Nebo možná máme co do činění s záznamy pro zcela nesouvisející muže, kteří mají shodou okolností stejné příjmení a bydlí na hlavní ulici 123, ale v různých městech. Bez korekce je v datovém souboru, jako je tento, příliš mnoho nejednoznačností, aby se na data mohli spolehnout pro účely marketingu nebo vztahů se zákazníky.

Přečtěte si náš eBook

4 způsoby měření kvality dat

podívejte se, jak vypadá hodnocení kvality v praxi. Recenze čtyř klíčových metrik mohou organizace využít k měření kvality svých dat

Číst

řešení problémů

Jeden způsob, jak opravit problémy s kvalitou, jako jsou tyto, je, aby výzkum každé rozpor nebo nejasnost a opravit ji ručně. To by však trvalo obrovské množství času. Ve velkém měřítku to není praktické.

mnohem časově a nákladově efektivnějším přístupem je použití automatizovaných nástrojů, které mohou identifikovat, interpretovat a opravovat problémy s daty bez lidského vedení. V případě datové sady složené ze jmen a adres, mohou to udělat korelací dat s jinými datovými soubory, aby zachytily chyby, nebo pomocí prediktivní analýzy k vyplnění mezer.

nikdy nekončící bitva

Protože kvalita dat je definována sada dat je schopnost sloužit daného úkolu, jeho přesná povaha a vlastnosti se bude lišit případ od případu. To, co jedna organizace vnímá jako vysoce kvalitní data, by mohlo být v očích jiné organizace nesmysl.

pochopení toho, jak se kvalita dat mění na základě kontextu, je důležité, protože to znamená, že to není něco, co můžete jednoduše získat a udržet. Můžete ji mít dnes, ale zítra ji ztratíte, pokud se vaše cíle změní a vaše data v současném stavu je již nemohou splnit.

takže považujte kvalitu dat za nekonečnou bitvu. Je to něco, co musíte být neustále pracujeme na zlepšení, aby zajistily, že vaše data je připravena splnit úkoly podle toho, co hodit na něj.

Pomocí Přesně důvěřovat vaše data

Jako organizace osvobodit data z tradiční sila v celém podniku a centralizovat je v datových jezer pro high-powered analytics, data governance je stále nejvyšší prioritou, a to zejména ve vysoce regulovaných odvětvích, jako je bankovnictví, pojišťovnictví, finanční služby a zdravotní péči. Právě v kombinaci napájení vysoce výkonných integrace dat software, aby rychle a efektivně přístup k datům z libovolného zdroje a vložte jej do datového jezera, zatímco pomocí datové kvality nástroje na profil, který data.

jak dobrá je kvalita vašich dat? Zjistěte si přečtením naší e-knihy: 4 způsoby měření kvality dat

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.

Previous post Získat Podporu
Next post Oceněný Uzené Hovězí Hrudí – Grillocracy