Format: texte
site-uri
limba/s: engleză
publicul țintă: auto-regizat de învățare
Undergraduate
scurtă descriere:
acest articol explică cum să-i spuneți când corelație sau asociere a fost confundat cu cauzalitate.
concepte cheie abordate:
- 1-3 Asociația nu este la fel ca cauzalitate
detalii
din păcate, nu contează cât de multe ori ai spune, veți vedea în continuare titluri de genul:
- vizionarea porno micșorează creierul
- dormitul cu lumina aprinsă crește riscul de obezitate
- simțul scopului ‘adaugă ani la viață’.
toate afirmațiile de mai sus sunt nefondate, pe baza dovezilor pe care s-au bazat poveștile în sine. Aceste afirmații nefondate au apărut deoarece oamenii au confundat asocierea (corelația) cu cauzalitatea.
deci, într-un efort de a vă ajuta să explicați acest fenomen și să înțelegeți de ce este important să nu fiți induși în eroare de acesta, am creat o mică colecție de resurse.
Urmăriți videoclipul
asociații întâmplătoare
Justin Vigen a creat un site genial numit corelații false. El trage seturi de date și se potrivește cu parametrii până când vine cu o asociere. De exemplu, în graficul de mai jos, el arată o asociere puternică între consumul pe cap de locuitor de brânză mozzarella în Statele Unite și numărul de doctorate acordate în inginerie civilă.
pot haz grinzi de brânză?
corelația co-eficientă este o măsură a cât de strâns sunt asociate două variabile. Un bun exemplu de asociere este înălțimea și greutatea – oamenii mai înalți tind să fie mai grei. Cu cât corelația este mai aproape de 1, cu atât variabilele sunt mai apropiate. În exemplul de mai sus, coeficientul de corelație este de 0,95, sugerând o asociere puternică.
cu toate acestea, testele statistice ale corelației sunt „oarbe”: vă spun doar despre modelul numerelor. Ei nu spun nimic despre posibile relații cauzale sau despre alți factori despre care nu știm.
problema pe care Justin o evidențiază este că, cu cât vom trage mai multe date, cu atât vom vedea mai multe modele în ele. Și cu cât căutăm mai multe modele, cu atât este mai probabil ca modelele pe care le găsim să reflecte pur și simplu asociațiile întâmplătoare.
acest lucru ar putea fi bine atâta timp cât comparăm variabile clar independente, cum ar fi decesele prin înec într-o piscină vs Numărul de filme cu Nicolas Cage (corelație 0,66) sau importurile de petrol din SUA din Norvegia vs șoferii uciși de trenuri (0,95).
dar dacă găsim o asociere întâmplătoare între două variabile care se întâmplă să aibă o legătură plauzibilă? Să presupunem că credem că consumul de brânză vă oferă coșmaruri. Acest lucru te-ar putea face să arunci și să te întorci și să te încurci în cearșafurile tale. Poate atunci te ridici, țipi, cazi din pat și îți rupi gâtul pentru că membrele tale sunt încurcate și nu-ți poți rupe căderea.
corelație co-eficientă = 0,94. Nu spune că nu te-am avertizat!
dacă acest exemplu este prea prostesc pentru tine, Ce zici de isteria jocurilor pe calculator? Adesea vedem rapoarte media despre potențialele daune cauzate de jocurile violente pe calculator. Recent, un medic legist din Anglia a citat jocul pe calculator Call of Duty ca factor în „trei sau patru anchete privind moartea adolescenților”. Cu toate acestea, acest lucru nu ar trebui să fie surprinzător: ați fi greu împins să găsiți un adolescent care nu a jucat jocuri violente pe calculator în trecutul recent.
această tendință nu se limitează la evenimente rare. Date mari, de exemplu, traulează seturi de date masive care caută modele. Vedem adesea afirmații despre beneficiile potențiale ale acestei abordări în cercetarea în domeniul sănătății. Implicațiile ar trebui să fie clare – inevitabil va genera un număr imens de corelații false. Și ” a crede „este prea des”a vedea”.
prea multă dependență de corelație creează un risc real că vom crede că există o legătură cauzală între două fenomene atunci când ar putea fi doar întâmplare. De fapt, nu este un risc, este inevitabil.
Faceți clic pe desen animat pentru a citi articolul complet
prospectiv, nu retrospectiv
acesta este motivul pentru care recenziile sistematice insistă asupra definirii variabilelor de interes înainte de efectuarea analizei datelor. Această abordare” prospectivă „(spre deosebire de” retrospectivă”) este mult mai puțin probabil să fie deraiată de corelații întâmplătoare.
aceeași regulă este valabilă pentru testele corecte ale tratamentelor. Protocolul pentru un proces trebuie să definească în mod clar, înainte de studiu, ce relații trebuie investigate.
dacă cercetătorii vor căuta corelații după ce studiul a fost derulat, probabil vor veni cu constatări înșelătoare.
acest lucru este acoperit în mod cuprinzător în recentul blog statistic amuzant „dacă la început nu reușiți, nu mergeți în căutarea bebelușilor în apa de baie”
teorii netestate și puterea gândirii doritoare
„Căutați și veți găsi” (Matei 7:7).
nimănui nu-i place să creadă că își pierd timpul, inclusiv cronicarii, medicii și cercetătorii Noului Testament. Există întotdeauna o tentație de a presupune că, dacă luați o acțiune și un rezultat dorit îl urmează, atunci trebuie să fi fost acțiunea dvs. care a adus-o.
în primele zile ale fumatului, i s-au atribuit tot felul de beneficii pentru sănătate. După cum observăm în altă parte, Iacob al VI-lea al Scoției a fost peste tot în „Counterblaste to Tobacco”. Oamenii au răcit, oamenii au fumat tutun, s-au îmbunătățit, de aceea au crezut că tutunul i-a vindecat.
tutunul i-a vindecat? Sau s-ar fi îmbunătățit oricum? Care dintre noi credem poate depinde foarte bine de ceea ce așteptăm (sau dorim) să credem.
acest lucru este frumos ilustrat în excelentul comic Web xkcd:
credem că citirea tratamentelor de testare vă va face să evaluați mai bine afirmațiile despre tratamente, dar nu putem fi siguri până când cineva nu face un studiu randomizat asupra acestuia.
între timp, vă rugăm să ne trimiteți exemplele dvs. instructive pentru a ajuta oamenii să facă diferența dintre corelație și cauzalitate.
Multe mulțumiri lui Matt Penfold și Robin Massart.
- vizionarea porno asociată cu contracția creierului masculin. NHS Choices 30th May 2014
- vizionarea pornografiei micșorează creierul: cercetătorii găsesc prima legătură posibilă între vizionarea pornografiei și vătămarea fizică. Daily Mail, 30 Mai 2014
- dormitul într-o cameră ușoară este legat de obezitate? NHS Choices, 30 Mai 2014
- dormit cu lumina pe creste riscul de obezitate. The Daily Telegraph, 30 Mai 2014
- oamenii cu scop în viață ‘trăiesc mai mult’, recomandă studiul. NHS Choices, 14 Mai 2014
- simțul scopului ‘adaugă ani la viață’. BBC News, 14 Mai 2014
- corelații false. Accesat la 2 iunie 2014
- chemarea la datorie și sinucidere: ar trebui să fie îngrijorați părinții? The Guardian, 28 mai 2014
- Kayyali B, Knott D și van Kuiken S. Revoluția big-data în asistența medicală din SUA: accelerarea valorii și inovației. McKinsey & Co, aprilie 2013
- Shah s, Horne a și Capell J. Datele bune nu garantează decizii bune. Harvard Business Review, aprilie 2012
- Bastian H. Dacă la început nu reușești, nu te duce să cauți bebeluși în apa de baie, statistic amuzant, 16 martie 2014.