assosiaatio ei ole sama kuin syy-yhteys. Sanotaan vielä kerran: assosiaatio ei ole sama asia kuin syy-yhteys!

formaatti: tekstit

,

verkkosivut

,

Language/s: Englanti

,

kohdeyleisö: itseohjautuva oppiminen

|

perustutkinto

|

Lyhyt kuvaus:

tässä artikkelissa kerrotaan, milloin korrelaatio tai yhteys on sekoitettu syy-yhteyteen.

käsitellyt keskeiset käsitteet:

  • 1-3 assosiaatio ei ole sama kuin syy

yksityiskohdat

valitettavasti, vaikka kuinka sanoisit sen, näet silti otsikoita kuten:

  • pornon katselu kutistaa aivoja
  • nukkuminen valo päällä lisää lihavuuden riskiä
  • tarkoituksen taju ”lisää elinvuosia”.

kaikki edellä mainitut väitteet ovat perusteettomia, perustuen todistusaineistoon, johon tarinat itse perustuivat. Nämä perusteettomat väitteet ovat syntyneet, koska ihmiset ovat sekoittaneet assosiaation (korrelaation) syy-seuraussuhteeseen.

auttaaksemme selittämään tätä ilmiötä ja ymmärtämään, miksi on tärkeää, ettei sitä johdeta harhaan, olemme koonneet pienen resurssikokoelman.

Katso video

Sattumaliitot

Justin Vigen on luonut nerokkaan nettisivun nimeltä Spurious Correlations. Hän troolaa tietokokonaisuuksia ja täsmää parametreihin, kunnes löytää assosiaation. Esimerkiksi alla olevassa kaaviossa hän osoittaa, että Yhdysvalloissa henkeä kohti lasketun mozzarellajuuston kulutuksen ja rakennustekniikan tohtorintutkintojen määrän välillä on vahva yhteys.

 juustojen graafi vs. tekniikka

voin haz juustopalkit?

korrelaatiokerroin on mitta siitä, kuinka läheisesti kaksi muuttujaa liittyvät toisiinsa. Hyvä esimerkki yhdessäolosta on pituus ja paino – pidemmät ihmiset ovat yleensä painavampia. Mitä lähempänä korrelaatiokerroin on lukua 1,sitä lähempänä muuttujia on. Yllä olevassa esimerkissä korrelaatiokerroin on 0,95, mikä viittaa voimakkaaseen assosiaatioon.

tilastolliset korrelaatiotestit ovat kuitenkin ”sokeita”: ne kertovat vain lukujen kaavasta. He eivät sano mitään mahdollisista syy-seuraussuhteista tai muista tekijöistä, joista emme tiedä.

Justinin esiin nostama ongelma on se, että mitä enemmän troolaamme dataa, sitä enemmän kuvioita näemme niissä. Ja mitä enemmän pyydystämme kuvioita, sitä todennäköisempää on, että löytämämme kuviot heijastavat sattumia.

tämä voi olla hyvä niin kauan kuin vertaamme selvästi toisiinsa liittymättömiä muuttujia, kuten uima-altaaseen hukkumiskuolemat vs. Nicolas Cagen esittämien elokuvien määrä (korrelaatio 0,66) tai Yhdysvaltain öljyn tuonti Norjasta vs. junien tappamat kuljettajat (0,95).

mutta entä jos löydämme sattuman yhteyden kahden muuttujan välille, joilla vain sattuu olemaan uskottava yhteys? Ajatellaan, että juuston syöminen aiheuttaa painajaisia. Tämä saattaa saada sinut heittelehtimään ja kääntymään ja sotkeutumaan lakanoihisi. Ehkä sitten nouset istumaan, kiljut, putoat sängystä ja katkaiset niskasi, koska raajasi ovat sotkeentuneet etkä pysty katkaisemaan kaatumistasi.

kaavio, joka osoittaa vastaavuuden juuston kulutuksen henkeä kohti ja niiden ihmisten määrän, jotka kuolivat juuttumalla lakanoihin

korrelaatiokerroin = 0,94. Älä väitä, ettemme varoittaneet sinua!

jos tuo esimerkki on sinulle liian hölmö, miten käy tietokonepelien aiheuttaman hysterian? Tiedotusvälineissä kerrotaan usein väkivaltaisten tietokonepelien pelaamisesta mahdollisesti aiheutuvista haitoista. Äskettäin muuan oikeuslääkäri Englannissa mainitsi tietokonepelin Call of Duty olevan yksi tekijä”kolmessa tai neljässä teini-ikäisten kuolemien tutkinnassa”. Tämän ei kuitenkaan pitäisi olla yllättävää: sinun olisi vaikea löytää teini, joka ei ole pelannut väkivaltaisia tietokonepelejä lähimenneisyydessä.

tämä taipumus ei rajoitu vain harvinaisiin tapahtumiin. Big Data esimerkiksi troolaa massiivisia tietokokonaisuuksia, jotka etsivät kuvioita. Näemme usein väitteitä tämän lähestymistavan mahdollisista hyödyistä terveydenhuollon tutkimuksessa. Seurausten pitäisi olla selviä-se aiheuttaa väistämättä valtavia määriä väärennettyjä korrelaatioita. Ja ” uskominen ”on liian usein”näkemistä”.

liiallinen riippuvuus korrelaatiosta luo todellisen riskin, että uskomme kahden ilmiön välillä olevan Kausaalinen yhteys, kun se voisi olla vain sattumaa. Se ei ole riski, vaan väistämätön.

pilapiirros retrospektiivisen analyysin vaaroista

klikkaa sarjakuvaa lukeaksesi koko artikkelin

prospektiivinen, ei retrospektiivinen

tämän vuoksi systemaattiset katsaukset vaativat määrittelemään kiinnostavat muuttujat ennen aineiston analysointia. Tämä ” prospektiivinen ”(vastakohtana” retrospektiivinen”) lähestymistapa on paljon epätodennäköisempää suistua raiteiltaan sattumalta korrelaatioita.

sama sääntö pätee hoitojen reiluihin testeihin. Tutkimusprotokollassa on määriteltävä selkeästi ennen tutkimusta, mitä suhteita tutkitaan.

jos tutkijat lähtevät etsimään korrelaatioita kokeilun jälkeen, he tulevat todennäköisesti tekemään harhaanjohtavia havaintoja.

tätä käsitellään kattavasti tuoreessa tilastollisesti hauskassa blogissa ”jos aluksi et onnistu, älä lähde etsimään vauvoja kylpyvedestä”

testaamattomia teorioita ja toiveajattelun voimaa

”Etsi niin löydät” (Matt. 7: 7).

kukaan ei halua ajatella tuhlaavansa aikaansa, Uuden testamentin kronikoitsijat, lääkärit ja tutkijat mukaan lukien. On aina kiusaus olettaa, että jos ryhdyt toimiin ja toivottu lopputulos seuraa siitä, niin sen on täytynyt olla sinun tekosi, joka aiheutti sen.

tupakoinnin alkuaikoina sen katsottiin hyödyttävän kaikkia terveyshyötyjä. Kuten huomaamme toisaalla, skotlantilainen Jaakko VI käsitteli asiaa ”tupakan vastapainona”. Ihmiset vilustuivat, ihmiset polttivat tupakkaa, he paranivat, siksi he uskoivat tupakan parantaneen heidät.

parantiko tupakka heidät? Vai olisivatko ne kuitenkin parantuneet? Se, mihin uskomme, voi hyvinkin riippua siitä, mitä odotamme (tai haluamme) uskovamme.

tämä käy hienosti ilmi erinomaisesta xkcd-verkkosarjakuvasta:

korrelaatio ei ole syy-yhteys

uskomme, että Testihoitojen lukeminen saa sinut arvioimaan paremmin väitteitä hoidoista, mutta emme voi olla varmoja ennen kuin joku tekee satunnaistetun tutkimuksen siitä.

sillä välin, lähettäkää meille valaisevia esimerkkejä, joiden avulla ihmiset voivat kertoa korrelaation ja syy-yhteyden eron.

Paljon kiitoksia Matt Penfoldille ja Robin Massartille.

  • pornon katsominen liittyy miehen aivojen kutistumiseen. NHS Choices 30th May 2014
  • pornon katselu kutistaa aivoja: tutkijat löytävät ensimmäisen mahdollisen yhteyden pornografian katselun ja fyysisen haitan välillä. Daily Mail, 30. toukokuuta 2014
  • onko kevyessä huoneessa nukkuminen yhteydessä lihavuuteen? NHS Choices, 30th May 2014
  • Sleeping with light on increases risk of obesity. The Daily Telegraph, May 30 2014
  • ihmiset, joilla on tarkoitus elämässä ’elävät pidempään’, tutkimus neuvoo. NHS Choices, 14th May 2014
  • tarkoituksen taju ”lisää vuosia elämään”. BBC News, May 14 2014
  • harhaluuloja. Accessed 2nd June 2014
  • Call of Duty and suicide: should parents be concerned? The Guardian, 28th May 2014
  • Kayyali B, Knott D and van Kuiken S. The big-data revolution in US health care: Accelerating value and innovation. McKinsey & Co, huhtikuu 2013
  • Shah S, Horne A ja Capellá J. Hyvät tiedot eivät takaa hyviä päätöksiä. Harvard Business Review, huhtikuu 2012
  • Bastian H. If at first you don ’t succeed, don’ t go looking for babies in the bathwater, tilastollisesti hauska, 16th March 2014.

Vastaa

Sähköpostiosoitettasi ei julkaista.

Previous post The basement membrane as a structured surface-role in vascular health and disease / Journal of Cell Science
Next post blogikirjoitus