mikä on Lähtötiedon laatu? Selitämme, mitä tiedon laatu itse asiassa tarkoittaa

jos työskentelet datan kanssa, Olet luultavasti kuullut termin useammin kuin muutaman kerran, mutta mitä on tiedon laatu? Tiedätkö, mitä se oikeastaan tarkoittaa, ja mitä tietojen laatu analyytikot tekevät? Jos ei, tämä artikkeli on sinulle.

se ei ehkä ole aivan yhtä suosittu buzzword kuin big data, mutta se on usein käytetty termi datamaailmassa. Data-analyytikot haluavat muistuttaa, että laadun saaminen on tärkeää, jotta datasta saadaan arvoa.

mutta ne eivät aina vie aikaa sen määrittelyyn tai tarjoa reaalimaailman esimerkkejä siitä, millaisia ongelmia tiedon laatutyökalut korjaavat. Katsotaanpa.

mikä on tietojen laatu? Määritelmä

perusmääritelmä on tämä: tietojen laatu on tietyn tietoaineiston kyky palvella suunniteltua tarkoitusta.

toisin sanoen, jos sinulla on korkealaatuista dataa, tietosi pystyvät tuottamaan sen oivalluksen, jonka toivot siitä saavasi. Kääntäen, jos tietosi ovat huonolaatuisia, on ongelma tietosi, joka estää sinua käyttämästä tietoja tehdä mitä haluat saavuttaa sillä.

esimerkkejä

määritelmän havainnollistamiseksi tarkastellaan muutamia esimerkkejä reaalimaailman haasteista.

Kuvittele, että meillä on tietokokonaisuus, joka koostuu nimistä ja osoitteista. Tällaiset tiedot sisältävät todennäköisesti virheitä eri syistä – sekä yksinkertaisista että monimutkaisista.

yksinkertaisia syitä tietovirheisiin ovat väärin syötetyt nimet ja osoitteet tai niiden keräämisen jälkeen muuttuneet osoitetiedot.

aineistossa voi olla muita, monimutkaisempia ongelmia. Yksi on merkinnät, jotka ovat epäselviä puutteellisten tietojen vuoksi. Esimerkiksi, yksi merkintä voisi olla osoite Mr. Smith, joka asuu kaupungissa ”Lontoo”, jossa ei ole maa määritelty. Tämä on ongelma, koska emme tiedä, onko Lontoo, jossa Mr. Smith asuu on Lontoo, Englanti, Lontoo, Ontario tai yksi muista tusina-tai-niin kaupungit ympäri maailmaa nimetty Lontoo. Ellet käytä tietojen laatua työkalu korjata tätä epäselvyyttä, sinun on vaikea käyttää tietoja asettaa tavoittaa Mr. Smith.

toisena esimerkkinä monimutkaisesta ongelmasta voidaan tarkastella tietoaineistossa näennäisesti turhia osoitteita. Sanotaan, että Tietokannassamme on useita merkintöjä herra Smith-nimisistä henkilöistä, jotka asuvat osoitteessa 123 Main Street. Tämä voi olla seurausta yksinkertaisesta kaksoismerkinnästä: ehkä Herra Smithin tiedot syötettiin useammin kuin kerran vahingossa.

toinen mahdollisuus on, että samassa osoitteessa asuu useita Misters Smithejä – isä ja poika, ehkä. Tai ehkä olemme tekemisissä sellaisten miesten kanssa, joilla on sama sukunimi ja jotka asuvat Main Street 123: ssa, mutta eri kaupungeissa. Ilman korjausta tällaisessa tietokokonaisuudessa on liikaa epäselvyyttä, jotta tietoja voitaisiin käyttää markkinointi-tai asiakassuhdetarkoituksiin.

Lue eBook

4 Ways to Measure Data Quality

katso, miltä laadun arviointi näyttää käytännössä. Tutustu neljään keskeiseen mittariin, joita organisaatiot voivat käyttää mittaamaan tietojensa laatua

Lue

ongelmien korjaaminen

yksi tapa korjata tämänkaltaisia laatuongelmia on tutkia jokainen epäjohdonmukaisuus tai epäselvyys ja korjata se manuaalisesti. Se veisi kuitenkin valtavasti aikaa. Se ei ole käytännöllistä suuressa mittakaavassa.

paljon aikaa ja kustannustehokkaampaa on käyttää automatisoituja työkaluja, joilla voidaan tunnistaa, tulkita ja korjata dataongelmia ilman ihmisen ohjausta. Jos tietokokonaisuus koostuu nimistä ja osoitteista, ne voivat tehdä tämän korreloimalla tiedot muiden tietokokonaisuuksien kanssa virheiden havaitsemiseksi tai käyttämällä ennakoivaa analytiikkaa aukkojen täyttämiseksi.

päättymätön taistelu

koska tiedon laatu määritellään tietoaineiston kyvyksi palvella tiettyä tehtävää, sen tarkka luonne ja Ominaisuudet vaihtelevat tapauskohtaisesti. Se, mitä yksi organisaatio pitää laadukkaana datana, voi olla roskaa toisen organisaation silmissä.

on tärkeää ymmärtää, miten tietojen laatu muuttuu asiayhteyden perusteella, koska se tarkoittaa, että tietoja ei voi vain hankkia ja säilyttää. Sinulla voi olla se tänään, mutta menettää sen huomenna, jos tavoitteet muuttuvat ja tietosi nykyisessä tilassa ei voi enää täyttää niitä.

joten ajatelkaa datan laatua loputtomana taisteluna. Se on jotain sinun täytyy olla jatkuvasti työtä ja parantaa, jotta tietosi on valmis vastaamaan kumpi tehtäviä heittää sitä.

käyttämällä tarkasti tietojesi luottamista

kun organisaatiot vapauttavat tietoja perinteisistä siiloista koko yrityksessä ja keskittävät ne datajärviin tehokasta Analytiikkaa varten, datan hallinnasta on tulossa ensisijainen prioriteetti erityisesti hyvin säännellyillä toimialoilla, kuten pankki -, vakuutus -, rahoitus-ja terveydenhuoltoalalla. Juuri on yhdistetty teho korkean suorituskyvyn tietojen integrointi ohjelmisto nopeasti ja tehokkaasti käyttää dataa mistä tahansa lähteestä ja ladata sen datajärveen, samalla kun tietojen laadun työkaluja profiloida tiedot.

kuinka hyvä on tietojesi laatu? Lue lukemalla eBook: 4 tapoja mitata tietojen laatua

Vastaa

Sähköpostiosoitettasi ei julkaista.

Previous post Get Support
Next post Palkittu savustettu Naudanrinta-Grillocracy