5 Tietojen Rakeisuusvirhettä, jotka voivat maksaa

big datan aikakaudella haasteena ei ole enää saada tarpeeksi dataa, vaan oikean datan selvittäminen. Aiemmassa artikkelissa keskityin vaihtoehtoisten tietojen arvoon, joka on elintärkeä liiketoiminnallinen voimavara. Vaihtoehtoisten tietojen hyödyistäkin väärä datan rakeisuus voi kuitenkin heikentää datalähtöisen hallinnan ROI-arvoa.

”olemme niin pakkomielteisiä datasta, että unohdamme, miten sitä tulkitaan”. – Danah Boyd, johtava tutkija Microsoft Research

joten kuinka tarkasti sinun pitäisi tarkastella tietojasi? Koska väärän datan rakeisuus voi maksaa enemmän kuin tajuatkaan.

yksinkertaisesti sanottuna datan rakeisuudella tarkoitetaan tietojemme yksityiskohtaisuutta. Mitä rakeisempia tietoja, sitä enemmän tietoa sisältyy tiettyyn datapisteeseen. Mittaamalla vuosittain liiketoimet kaikissa myymälöissä maan olisi alhainen rakeisuus, koska tietäisit hyvin vähän siitä, milloin ja missä asiakkaat tekevät näitä ostoksia. Yksittäisten kauppojen tapahtumien mittaaminen toisella olisi sen sijaan uskomattoman suuri rakeisuus.

ihanteellinen datan rakeisuus riippuu siitä, millaista analyysiä tehdään. Jos etsit kulutuskäyttäytymisen malleja vuosikymmenten varrelta, matala rakeisuus lienee kunnossa. Automatisoidaksesi myymälätäydennyksen tarvitset kuitenkin paljon rakeisempaa tietoa.

Artem Beliaikinin kuvaama Unsplash

kun valitsee väärän rakeisuuden analyysiinsä, päätyy epätarkempaan ja vähemmän hyödylliseen älykkyyteen. Mieti, miten sotkuinen viikoittainen myymälätäydennys vain vuosittaisiin järjestelmänlaajuisiin tietoihin perustuen olisi! Voit jatkuvasti kokea sekä ylimääräinen varastossa ja varastot, koonnut valtavia kustannuksia ja korkea jätettä prosessissa. Missä tahansa analyysissä väärällä tietojen rakeisuudella voi olla yhtä vakavia seurauksia tehokkuuteesi ja tulokseesi.

joten käytätkö oikeaa tietojen rakeisuutta liiketoimintatiedossasi? Tässä viisi yleistä — ja kallista-tietojen rakeisuusvirhettä.

useiden yritysten kehityssuuntien ryhmittely yhdeksi kuvioksi (kun tiedot eivät ole tarpeeksi rakeisia).

Business intelligencen on oltava selkeä ja suoraviivainen ollakseen toimintakelpoinen, mutta joskus yksinkertaisuuteen pyrkiessään ihmiset eivät sukella tarpeeksi syvälle dataan. Se on sääli, sillä jäät paitsi arvokkaista oivalluksista. Kun tietojen rakeisuus on liian alhainen, näet vain suuria kuvioita, jotka nousevat pintaan. Saatat missata kriittistä dataa.

liian monissa tapauksissa se, että tietoja ei tarkastella riittävän tarkasti, johtaa siihen, että erilaiset suuntaukset tiivistyvät yhdeksi tulokseksi. Yritykset, jotka tekevät tämän virheen, päätyvät epätasaisiin tuloksiin. Heillä on todennäköisemmin arvaamattomia ja äärimmäisiä poikkeamia, jotka eivät sovi yleiseen kaavaan — koska tämä kuvio ei heijasta todellisuutta.

tämä on yleinen ongelma monissa perinteisissä toimitusketjun ennustejärjestelmissä. He eivät pysty käsittelemään rakeisuuden tasoa, joka tarvitaan ennustamaan SKU-tason kysyntää yksittäisissä myymälöissä, mikä tarkoittaa, että yksi myymälä voi käsitellä sekä ylikuormitusta ja varastojen samanaikaisesti. Tekoälyn avulla toimivat automatisoidut järjestelmät pystyvät käsittelemään datan oikean segmentoinnin vaatimaa monimutkaisuutta, mikä on yksi syy siihen, että nämä parantavat toimitusketjun tehokkuutta. Riittävä tietojen rakeisuus on kriittistä tarkemman liiketoimintatiedon kannalta.

tekijän kuva (CC attribuutiolla)

eksyminen tietojen ilman painopistettä (kun tiedot ovat liian rakeisia).

Oletko koskaan vahingossa zoomannut aivan liian kauas karttaan verkossa? Se on niin turhauttavaa! Mitään hyödyllistä tietoa ei saa selville, koska asiayhteyttä ei ole. Sitä tapahtuu myös datassa.

jos tietosi ovat liian rakeisia, eksyt; et pysty keskittymään tarpeeksi löytääksesi hyödyllisen kuvion kaikista ylimääräisistä tiedoista. On houkuttelevaa tuntea enemmän yksityiskohtia on aina parempi, kun se tulee tietoja, mutta liian paljon yksityiskohtia voi tehdä tietosi lähes hyödytön. Monet johtajat kohtaavat niin paljon tietoa löytää itsensä jähmettynyt analyysi halvaantuminen. Päädyt epäluotettaviin suosituksiin, liiketoimintayhteyden puutteeseen ja turhiin sekaannuksiin.

Denise Jansin Kuva Unsplashista

liian rakeinen data on tekoälyn ennustamisessa erityisen kallis virhe. Data saattaa huijata algoritmin osoittamaan, että sillä on tarpeeksi dataa tulevaisuuden oletusten tekemiseen, mikä ei ole nykyteknologialla mahdollista. Esimerkiksi hankintaketjutyössäni Evolla on vielä mahdotonta ennustaa päivittäistä SKU – myyntiä. Virhemarginaalisi on liian suuri ollakseen hyödyllinen. Tällainen rakeisuuden taso heikentää tavoitteita ja vähentää ROI: ta.

aikamuuttujien rakeisuutta ei valita tarkoituksellisesti.

yleisimmät tietojen rakeisuusvirheet liittyvät aikaväleihin eli muuttujien mittaamiseen tunneittain, päivittäin, viikoittain, vuosittain jne. pohja. Ajallisia rakeisuusvirheitä tapahtuu usein mukavuuden vuoksi. Useimmilla yrityksillä on normaalit tavat ilmoittaa ajastetut muuttujat. Tuntuu kuin se vaatisi liikaa vaivaa muuttaa niitä, joten he eivät. mutta tämä harvoin on ihanteellinen rakeisuus käsitellä ongelma analysoidaan.

kun punnitaan järjestelmäsi Raportointitavan muuttamisen kustannuksia verrattuna jatkuvasti puutteellisen liiketoimintatiedon hankkimisen kustannuksiin, hyödyt oikean rakeisuusrekisterin tarkoituksellisesta valinnasta. Ajan rakeisuudesta riippuen tunnistat samoista tiedoista hyvin erilaisia oivalluksia. Otetaan esimerkiksi kausivaihtelutrendit vähittäiskaupassa. Tarkasteltaessa liiketoimia yhden päivän aikana voi tehdä vuodenaikojen trendit näkymättömiksi tai ainakin sisältää niin paljon tietoa, että kuviot ovat vain valkoista kohinaa, kun taas kuukausittaiset tiedot jakavat erillisen sekvenssin, jota voit itse käyttää. Jos tavalliset KPI: t jättävät kuukausiraportoinnin väliin siirtyäkseen suoraan neljännesvuosiraportointiin, menetät arvokkaita tietoja, jotka tekevät ennusteista tarkempia. Rakeisuutta ei voi ottaa nimellisarvosta, jos haluaa parhaan älykkyyden.

päivittäinen kausaalisuus (lähde: http://r-tutorials.com/r-exercises-41-50-working-time-series-data/)

vuosittainen kausiluonteisuus (lähde: https://commons.wikimedia.org/)

yli-tai alisuorittamalla mallisi siihen pisteeseen, että näkemäsi kuviot ovat merkityksettömiä.

TEKOÄLYMALLIEN on yleistettävä hyvin olemassa olevasta ja tulevasta aineistosta, jotta voidaan antaa hyödyllisiä suosituksia. Pohjimmiltaan hyvä malli voisi tarkastella näitä tietoja:

tekijän kuva (CC attribuutiolla)

ja olettaa tämä toimiva malli perustuu tietoihin:

tekijän kuva (CC attribuutiolla)

kuvio ei ehkä täysin edusta dataa, mutta se tekee hyvää työtä ennustaen tyypillistä käyttäytymistä uhraamatta liikaa älykkyyttä.

jos ei ole oikeaa datarakeisuutta, voi kuitenkin päätyä väärään malliin. Kuten aiemmin puhuimme, liian rakeinen data voi aiheuttaa melua, joka tekee kuvion löytämisestä vaikeaa. Jos algoritmi jatkuvasti kouluttaa tämän meluisa yksityiskohtaisesti tasolla, se tuottaa melua puolestaan. Päädyt malliksi, joka näyttää tältä:

tekijän kuva (CC attribuutiolla)

kutsumme tätä mallisi yliampumiseksi. Jokaisella datapisteellä on niin suuri vaikutus, että malli ei voi enää yleistää hyödyllisesti. Alun perin suuren rakeisuuden aiheuttamat ongelmat suurennetaan ja niistä tehdään mallissa pysyvä ongelma.

liian alhainen datarakeisuus voi myös aiheuttaa pitkäaikaista vahinkoa mallillesi. Algoritmilla on oltava riittävästi tietoa kaavojen löytämiseksi. Algoritmit, jotka on koulutettu käyttämällä dataa ilman riittävää rakeisuutta, jäävät kaipaamaan kriittisiä kuvioita. Kun algoritmi on siirtynyt harjoitusvaiheen yli, se ei edelleenkään tunnista samanlaisia kuvioita. Päädyt malliksi, joka näyttää tältä:

tekijän kuva (CC attribuutiolla)

tämä on mallin alimitoitusta. Algoritmi on lähellä tehdä oikeat ennusteet, mutta ne eivät koskaan ole niin tarkkoja kuin ne olisivat voineet olla. Kuten ylimittaus, se on alkuperäisen rakeisuusongelman suurennus.

kun luot analyysille mallia, oikea rakeisuus tulee eksponentiaalisesti tärkeämmäksi kuin kun käytössä on vakaa algoritmi. Tästä syystä monet yritykset haluavat ulkoistaa tämän osan prosessista asiantuntijoille. Se on liian herkkä ja kallis vaihe virheille.

oikaistaan virheellisen tiedon rakeisuus kokonaan.

ehkä kallein tietojen rakeisuusvirhe vain keskittyy niin paljon optimoimaan tällä hetkellä mittaamiesi KPI: iden rakeisuutta, ettet huomaa niiden olevan täysin vääriä KPI: Itä. Pyrimme saavuttamaan oikeat tiedot rakeisuus ei optimoida mitään erityistä KPI suorituskykyä, vaan tunnistaa malleja tietoja, jotka tuottavat toiminnallisia ja arvokkaita oivalluksia. Jos haluat parantaa esimerkiksi liikevaihtoa, saatat heikentää menestystäsi tarkastelemalla vain hinnoittelun kuvioita. Asiaan liittyy muitakin tekijöitä.

ota esimerkki kollegaltani. Uusi EVO-asiakas halusi lisätä myyntiä, ja toimitusketjun työkalujen ensitesti osoitti 10% parannusta alle kahdessa viikossa. Toimitusjohtajamme oli yli innoissaan näistä ennennäkemättömistä tuloksista, mutta hänen yllätyksekseen toimitusketjun johtaja ei ollut vaikuttunut. Hänen ensisijainen KPI oli tuotteiden saatavuus, ja mukaan sisäisiä numeroita, joka ei ollut koskaan muuttunut. Hänen keskittyä parantamaan tietyn KPI tuli kustannuksella tunnistaa arvokkaita oivalluksia muista tiedoista.

uuden toimitusketjujärjestelmän testaus (kuva Fabrizio Fantini)

tuotteen saatavuus testin jälkeen (Fabrizio Fantini image, CC with attribution)

riippumatta siitä, mitattiinko KPI tarkasti, keskittyen täysin sen suorituskyvyn muuttamiseen, tämä johtaja ei nähnyt arvoa uudessa lähestymistavassa. Hän oli fiksu mies, joka toimi hyvässä uskossa, mutta tiedot johtivat häntä harhaan — uskomattoman yleinen mutta kallis virhe. Oikea tietojen rakeisuus on tärkeää, mutta se ei voi olla tavoite sinänsä. Tekoälystä saatavan tuoton maksimoimiseksi pitää katsoa kokonaiskuvaa. Sillä, kuinka tarkasti katsot tietojasi, ei ole väliä, jos sinulla ei ole oikeita tietoja.

”yleinen harhaluulo datalähtöisessä johtamisessa on väärän datan käyttäminen oikeaan kysymykseen vastaamiseen”. – Fabrizio Fantini, Evo: n perustaja ja toimitusjohtaja

oikean datan rakeisuuden edut

tietojen rakeisuudessa ei ole taikaluotia. Sinun täytyy valita se huolellisesti ja tarkoituksellisesti välttää näitä ja muita harvinaisempia virheitä. Ainoa tapa maksimoida tietojen tuotto on tarkastella sitä kriittisesti-yleensä asiantuntija data scientist ’ s apua. Et todennäköisesti saa rakeisuutta heti ensimmäisellä yrittämällä, joten sinun täytyy testata ja säätää, kunnes se on täydellinen.

se on kuitenkin vaivan arvoista. Kun katsot tarkkaan, mutta et liian tarkasti, tietosi takaavat optimaalisen liiketoimintatietouden. Segmentoitu ja oikein analysoitu data muuttuu kilpailueduksi, johon voit luottaa.

Vastaa

Sähköpostiosoitettasi ei julkaista.

Previous post kohonneen PSA: n syitä on nujerrussyövän lisäksi useita.
Next post Mitä eroa on'hiiltyneellä ja palaneella?