Format: Tekster
Nettsteder
Språk / s: engelsk
Målgruppe: selvstyrt læring
Undergraduate
Kort Beskrivelse:
denne artikkelen forklarer hvordan du kan fortelle når korrelasjon eller tilknytning har blitt forvirret med årsakssammenheng.
Nøkkelbegreper adressert:
- 1-3 Forening er ikke det samme som årsakssammenheng
Detaljer
Dessverre, uansett hvor mange ganger du sier det, vil du fortsatt se overskrifter som:
- Å Se porno krymper hjernen
- Å Sove med lyset på øker risikoen for fedme
- følelse av hensikt ‘legger år til livet’.
Alle de ovennevnte påstandene er ubegrunnede, basert på bevisene historiene selv var basert på. Disse ubegrunnede påstandene har oppstått fordi folk har forvirret forening (korrelasjon) med årsakssammenheng.
så, i et forsøk på å hjelpe deg med å forklare dette fenomenet, og forstå hvorfor det er viktig å ikke bli villedet av det, har vi satt sammen en liten samling av ressurser.
Se videoen
Sjanseforeninger
Justin Vigen har skapt en strålende nettside kalt Falske Korrelasjoner. Han tråler datasett og matcher parametere til han kommer opp med en forening. For eksempel, i grafen nedenfor, viser han en sterk sammenheng mellom per capita forbruk av mozzarellaost i Usa og antall doktorgrader tildelt i ingeniørfag.
jeg kan haz ost dragere?
samvirkeforholdet er et mål på hvor tett to variabler er forbundet. Et godt eksempel på forening er høyde og vekt – høyere folk har en tendens til å være tyngre. Jo nærmere korrelasjonen co-effektiv er å 1, jo nærmere variablene er forbundet. I eksemplet ovenfor er korrelasjonskoeffisienten 0,95, noe som tyder på en sterk forening.
statistiske tester av korrelasjon er imidlertid «blinde»: de forteller deg bare om tallmønsteret. De sier ingenting om mulige årsakssammenheng, eller andre faktorer vi ikke vet om.
Problemet Som Justin fremhever er at jo mer vi tråler data, jo flere mønstre vil vi se i dem. Og jo mer vi tråler etter mønstre, jo mer sannsynlig er det at mønstrene vi finner bare vil gjenspeile tilfeldighetsforeninger.
dette kan være greit så lenge vi sammenligner klart ikke-relaterte variabler, for Eksempel dødsfall ved drukning i et svømmebasseng vs antall filmer med Nicolas Cage (korrelasjon 0.66), ELLER AMERIKANSK oljeimport fra Norge vs Drivere drept av tog (0.95).
men hva om vi finner en tilfeldig sammenheng mellom to variabler som bare tilfeldigvis har en plausibel forbindelse? La oss si at vi tror at å spise ost gir deg mareritt. Dette kan få deg til å kaste og slå, og bli viklet inn i sengetøyene dine. Kanskje da sitter du opp, skriker, faller ut av sengen og brekker nakken fordi lemmer er sammenflettet og du kan ikke bryte høsten din.
Korrelasjon co-effektiv = 0,94. Ikke si at vi ikke advarte deg!
hvis dette eksemplet er for dumt for deg, hva med hysteriet over dataspill? Vi ser ofte medierapporter om potensiell skade fra å spille voldelige dataspill. Nylig, en coroner i England sitert dataspillet Call of Duty som en faktor i «tre eller fire inquests i dødsfall av tenåringer». Dette bør imidlertid ikke være overraskende: du vil bli hardt presset for å finne en tenåring som ikke har spilt voldelige dataspill i nyere tid.
denne tendensen er ikke begrenset til sjeldne hendelser. Store Data, for eksempel, tråler massive datasett på jakt etter mønstre. Vi ser ofte påstander om de potensielle fordelene med denne tilnærmingen i helsevesenet forskning. Implikasjonene bør være klare – det vil uunngåelig kaste opp et stort antall falske korrelasjoner. Og «Tro» er for ofte «Å Se».
For mye avhengighet av korrelasjon skaper en reell risiko for at vi vil tro at det er en årsakssammenheng mellom to fenomener når Det bare kan være sjanse. Faktisk er det ikke en risiko, det er uunngåelig.
Klikk på tegneserien for å lese hele artikkelen
Prospektiv, ikke retrospektiv
dette er grunnen til at systematiske oversikter insisterer på å definere variablene av interesse i forkant av å gjennomføre dataanalysen. Denne» prospektive «(i motsetning til» retrospektiv») tilnærmingen er langt mindre sannsynlig å bli sporet av tilfeldige korrelasjoner.
samme regel gjelder for rettferdige tester av behandlinger. Protokollen for en rettssak må definere klart, i forkant av studien, hvilke relasjoner som skal undersøkes.
hvis forskerne leter etter sammenhenger etter at forsøket er kjørt, vil de trolig komme opp med misvisende funn.
Dette er omfattende dekket i Den Siste Statistisk Morsomme bloggen «Hvis du først ikke lykkes, ikke se etter babyer i badevannet»
Uprøvde teorier og kraften til ønsketenkning
«Let, så skal dere finne» (Matteus 7:7).
Ingen liker å tro at de kaster bort tiden sin, Nytestamentlige kronikører, leger og forskere inkludert. Det er alltid en fristelse å anta at hvis du tar noen handling og et ønsket resultat følger det, må det ha vært din handling som førte til det.
i de tidlige dagene av tobakksrøyking ble alle slags helsemessige fordeler tilskrevet det. Som vi noterer andre Steder, James VI Of Scotland var over dette i sin «Counterblaste To Tobacco». Folk ble forkjølet, folk røykte tobakk, de ble bedre, derfor trodde de at tobakken hadde kurert dem.
var det tobakken som helbredet dem? Eller hadde de blitt bedre uansett? Hvilken vi tror kan veldig godt avhenge av hva vi forventer (eller vil) tro.
dette er pent illustrert i den utmerkede xkcd web tegneserien:
vi tror at lesing Av Testbehandlinger vil gjøre deg bedre til å vurdere påstander om behandlinger, men vi kan ikke være sikre før noen gjør en randomisert studie på den.
I Mellomtiden, vennligst send oss dine lærerike eksempler for å hjelpe folk å fortelle forskjellen mellom korrelasjon og årsakssammenheng.
Mange takk Til Matt Penfold Og Robin Massart.
- Ser på porno assosiert med mannlig hjernekrymping. NHS Choices 30th May 2014
- Vise porno krymper hjernen: Forskere finner første mulige kobling mellom å se pornografi og fysisk skade. Daily Mail, 30. Mai 2014
- sover i et lyst rom knyttet til fedme? NHS Choices, 30th Mai 2014
- Sove med lys på øker risikoen for fedme. The Daily Telegraph, 30. Mai 2014
- Mennesker med hensikt i livet ‘lever lenger’, anbefaler studien. NHS Choices, 14. Mai 2014
- følelse av hensikt ‘legger år til livet’. BBC News, Mai 14 2014
- Falske Korrelasjoner. Tilgang 2. juni 2014
- Call of Duty og selvmord: bør foreldre være bekymret? The Guardian,28th Mai 2014
- Kayyali B, Knott D og van Kuiken s. den store datarevolusjonen I AMERIKANSK helsevesen: Akselererende verdi og innovasjon. McKinsey & Co, April 2013
- Shah S, Horne A Og Capellá J. Gode data vil ikke garantere gode beslutninger. Harvard Business Review, April 2012
- Bastian H. Hvis først du ikke lykkes, ikke gå på jakt etter babyer i badevannet, Statistisk Morsomt, 16 Mars 2014.