formátum: szövegek
weboldalak
Nyelv / s: Angol
célközönség: önálló tanulás
egyetemi hallgatók
Rövid leírás:
ez a cikk elmagyarázza, hogyan lehet megmondani, ha a korrelációt vagy asszociációt összekeverik az okozati összefüggéssel.
kiemelt fogalmak:
- 1-3 az asszociáció nem ugyanaz, mint az okozati összefüggés
Részletek
sajnos, nem számít, hányszor mondod, akkor is látni fogja a címsorokat, mint például:
- a pornó nézése összezsugorítja az agyat
- bekapcsolt lámpával aludni növeli az elhízás kockázatát
- a céltudatosság ‘éveket ad az élethez’.
a fenti állítások mindegyike megalapozatlan, azon bizonyítékok alapján, amelyeken maguk a történetek alapultak. Ezek az alaptalan állítások azért merültek fel, mert az emberek összetévesztették az asszociációt (korrelációt) az okozati összefüggéssel.
Tehát annak érdekében, hogy segítsen megmagyarázni ezt a jelenséget, és megérteni, miért fontos, hogy ne tévesszen meg, összeállítottunk egy kis gyűjteményt.
nézze meg a videót
véletlen egyesületek
Justin Vigen létrehozott egy ragyogó weboldalt, a hamis korrelációk néven. Az adathalmazokat és a paramétereket méri, amíg ki nem jön egy asszociáció. Például az alábbi grafikonon erős összefüggést mutat az Egyesült Államokban a mozzarella sajt egy főre jutó fogyasztása és az építőmérnöki doktori fokozatok száma között.
tudok haz sajt tartók?
a koefficiens korreláció annak mértéke, hogy két változó milyen szorosan kapcsolódik egymáshoz. Az asszociáció jó példája a magasság és a súly – a magasabb emberek általában nehezebbek. Minél közelebb van a koefficiens korreláció 1-hez,annál közelebb vannak a változók. A fenti példában a korrelációs együttható 0,95, ami erős összefüggésre utal.
a korreláció statisztikai tesztjei azonban “vakok”: csak a számok mintájáról szólnak. Egyáltalán nem mondanak semmit a lehetséges ok-okozati összefüggésekről, vagy más tényezőkről, amelyekről nem tudunk.
a Justin által kiemelt probléma az, hogy minél több vonóhálós adatot találunk, annál több mintát fogunk látni bennük. Minél többet vonóhálózunk a minták után, annál valószínűbb, hogy a talált minták egyszerűen a véletlen asszociációkat tükrözik.
ez rendben lehet mindaddig, amíg összehasonlítjuk az egyértelműen független változókat, például az úszómedencébe fulladás okozta haláleseteket a Nicolas Cage-t bemutató filmek számával (korreláció 0,66), vagy az Egyesült Államok Norvégiából származó olajimportját a vonatok által megölt sofőrökkel (0,95).
de mi van, ha találunk egy véletlen asszociációt két változó között, amelyeknek csak valószínű kapcsolata van? Tegyük fel, hogy úgy gondoljuk, hogy a sajt fogyasztása rémálmokat okoz. Ez arra késztethet, hogy forgolódj, és belegabalyodj az ágyneműdbe. Talán akkor felülsz, sikítasz, kiesel az ágyból és eltöröd a nyakad, mert a végtagjaid össze vannak kuszulva, és nem tudod megtörni az esésedet.
korreláció koefficiens = 0,94. Ne mondd, hogy nem figyelmeztettünk!
ha ez a példa túl ostoba az Ön számára, mi a helyzet a számítógépes játékok hisztériájával? Gyakran látunk médiajelentéseket az erőszakos számítógépes játékok esetleges káros hatásairól. A közelmúltban egy angliai halottkém a Call of Duty számítógépes játékot idézte a “tinédzserek halálával kapcsolatos három vagy négy vizsgálat”tényezőjeként. Ez azonban nem lehet meglepő: nehéz lenne olyan tinédzsert találni, aki a közelmúltban nem játszott erőszakos számítógépes játékokat.
ez a tendencia nem korlátozódik a ritka eseményekre. Nagy adatok, például, vonóhálók hatalmas adatkészletek mintákat keresve. Gyakran látunk állításokat e megközelítés lehetséges előnyeiről az egészségügyi kutatásban. A következményeknek világosnak kell lenniük – elkerülhetetlenül hatalmas számú hamis összefüggést vet fel. A ” hinni “pedig túl gyakran”látni”.
a korrelációra való túlzott támaszkodás valódi kockázatot jelent, hogy elhisszük, hogy ok-okozati összefüggés van két jelenség között, amikor ez csak véletlen lehet. Valójában ez nem kockázat, elkerülhetetlen.
kattintson a rajzfilmre a teljes cikk elolvasásához
prospektív, nem retrospektív
ezért a szisztematikus áttekintések ragaszkodnak az érdeklődésre számot tartó változók meghatározásához az adatelemzés elvégzése előtt. Ezt a ” prospektív “megközelítést (szemben a” retrospektív ” megközelítéssel) sokkal kevésbé valószínű, hogy a véletlen összefüggések kisiklanak.
ugyanez a szabály vonatkozik a kezelések tisztességes tesztelésére is. A próba protokolljának egyértelműen meg kell határoznia, a vizsgálat előtt, mely kapcsolatokat kell megvizsgálni.
ha a kutatók a vizsgálat lefolytatása után összefüggéseket keresnek, valószínűleg félrevezető eredményekkel fognak előállni.
ezt átfogóan tárgyalja a legújabb statisztikailag vicces blog “ha először nem sikerül, ne menj csecsemőket keresni a fürdővízben”
nem tesztelt elméletek és a vágyálom ereje
“Keressetek és találtok” (Máté 7:7).
senki sem szereti azt gondolni, hogy csak az idejét vesztegeti, beleértve az újszövetségi krónikásokat, orvosokat és kutatókat is. Mindig van egy kísértés azt feltételezni, hogy ha valamilyen intézkedést teszel, és a kívánt eredmény követi azt, akkor biztosan a te cselekedeted okozta.
a dohányzás korai napjaiban mindenféle egészségügyi előnyt tulajdonítottak neki. Jakab skót volt az egész az ő “Counterblaste Dohány”. Az emberek megfáztak, az emberek dohányoztak, jobban lettek, ezért azt hitték, hogy a dohány meggyógyította őket.
a dohány gyógyította meg őket? Vagy amúgy is jobbak lettek volna? Az, hogy melyikben hiszünk, nagyon jól függ attól, hogy mit várunk (vagy akarunk) hinni.
ezt szépen illusztrálja a kiváló xkcd webes képregény:
úgy gondoljuk, hogy a tesztelési kezelések olvasása jobban értékeli a kezelésekkel kapcsolatos állításokat, de nem lehetünk biztosak abban, amíg valaki nem végez randomizált vizsgálatot rajta.
közben kérjük, küldje el nekünk tanulságos példáit, hogy segítsen az embereknek megkülönböztetni a korrelációt és az okozati összefüggést.
köszönet Matt Penfoldnak és Robin Massartnak.
- pornót nézni a férfi agy zsugorodásával jár. NHS Choices 30th May 2014
- a pornó megtekintése zsugorítja az agyat: a kutatók megtalálják az első lehetséges kapcsolatot a pornográfia megtekintése és a fizikai sérülés között. Daily Mail, május 30 2014
- alszik egy világos szobában kapcsolódik az elhízás? NHS Choices, 30th May 2014
- alvás fény növeli az elhízás kockázatát. A Daily Telegraph, május 30 2014
- az életcélú emberek hosszabb ideig élnek, tanulmány tanácsolja. NHS Choices, 14th May 2014
- céltudatosság ‘éveket ad az élethez’. BBC News, május 14 2014
- hamis összefüggések. Accessed 2nd June 2014
- Call of Duty és öngyilkosság: a szülőknek aggódniuk kell? The Guardian, 28th May 2014
- Kayyali B, Knott D és van Kuiken S. a nagy adatforradalom az amerikai egészségügyben: gyorsuló érték és innováció. McKinsey & Co, 2013. április
- Shah S., Horne A. és Capell. A jó adatok nem garantálják a jó döntéseket. Harvard Business Review, április 2012
- Bastian H. ha először nem sikerül, ne keressen csecsemőket a fürdővízben, statisztikailag vicces, 16th március 2014.