associatie is niet hetzelfde als oorzakelijk verband. Laten we dat nogmaals zeggen: associatie is niet hetzelfde als causatie!

formaat: teksten

,

Websites

,

Language/s: English

,

Target Audience: Self-directed learning

/

Undergraduate

/

korte beschrijving:

dit artikel legt uit hoe te vertellen wanneer correlatie of associatie is verward met oorzakelijk verband.

belangrijkste concepten:

  • 1-3 associatie is niet hetzelfde als causatie

Details

helaas, hoe vaak u het ook zegt, zult u nog steeds koppen zien zoals:

  • het bekijken van porno vermindert de hersenen
  • slapen met het licht aan verhoogt het risico op obesitas
  • zin voor doel ‘voegt jaren toe aan het leven’.

alle bovenstaande beweringen zijn ongegrond, op basis van het bewijsmateriaal waarop de verhalen zelf waren gebaseerd. Deze ongegronde claims zijn ontstaan omdat mensen associatie (correlatie) hebben verward met oorzakelijk verband.

dus, in een poging om u te helpen dit fenomeen uit te leggen, en te begrijpen waarom het belangrijk is om niet te worden misleid door het, hebben we een kleine verzameling van middelen samengesteld.

bekijk de video

Kansassociaties

Justin Vigen heeft een briljante website gemaakt, genaamd ‘onechte correlaties’. Hij trawlt datasets en matcht parameters tot hij met een associatie komt. In de onderstaande grafiek laat hij bijvoorbeeld een sterk verband zien tussen de consumptie van mozzarella kaas per hoofd van de bevolking in de Verenigde Staten en het aantal doctoraten in de civiele techniek.

grafiek van cheese vs engineering

I can haz cheese girders?

de correlatie co-efficiënt is een maat voor hoe nauw twee variabelen zijn geassocieerd. Een goed voorbeeld van vereniging is lengte en gewicht – groter mensen hebben de neiging om zwaarder. Hoe dichter de correlatie co-efficiënt is bij 1, Hoe dichter de variabelen worden geassocieerd. In het bovenstaande voorbeeld is de correlatiecoëfficiënt 0,95, wat een sterke associatie suggereert.

statistische correlatietesten zijn echter “blind”: ze vertellen u alleen over het patroon van getallen. Ze zeggen helemaal niets over mogelijke causale relaties, of andere factoren die we niet weten.

het probleem dat Justin benadrukt is dat hoe meer gegevens we trawl, hoe meer patronen we zullen zien in hen. En hoe meer we naar patronen zoeken, hoe waarschijnlijker het is dat de patronen die we vinden gewoon toevallige associaties zullen weerspiegelen.

dit zou prima kunnen zijn, zolang we duidelijk niet-gerelateerde variabelen vergelijken, zoals sterfgevallen door verdrinking in een zwembad vs. aantal films met Nicolas Cage (correlatie 0,66), of Amerikaanse olie-invoer uit Noorwegen vs.door treinen omgebrachte bestuurders (0,95).

maar wat als we een toevallige associatie vinden tussen twee variabelen die toevallig een plausibele connectie hebben? Laten we zeggen dat we denken dat het eten van kaas geeft je nachtmerries. Dit kan je doen woelen en draaien, en verstrikt raken in je lakens. Misschien ga je dan rechtop zitten, schreeuwen, uit bed vallen en je nek breken omdat je ledematen verstrikt zijn en je val niet kan breken.

grafiek die de correlatie toont tussen de consumptie van kaas per hoofd van de bevolking en het aantal mensen dat stierf door verstrikt te raken in hun lakens

correlatie co-efficiënt = 0,94. Zeg niet dat we je niet gewaarschuwd hebben!

als dat voorbeeld te dom is voor u, hoe zit het dan met de hysterie over computerspelletjes? We zien vaak berichten in de media over mogelijke schade door het spelen van gewelddadige computerspelletjes. Onlangs noemde een lijkschouwer in Engeland het computerspel Call of Duty als een factor in “drie of vier onderzoeken naar de dood van tieners”. Echter, dit moet niet verwonderlijk zijn: je zou moeilijk worden geduwd om een tiener die niet heeft gespeeld gewelddadige computer games in het recente verleden te vinden.

deze tendens is niet beperkt tot zeldzame voorvallen. Big Data, bijvoorbeeld, trawlt enorme datasets op zoek naar patronen. We zien vaak claims over de potentiële voordelen van deze aanpak in de gezondheidszorg onderzoek. De implicaties moeten duidelijk zijn – het zal onvermijdelijk leiden tot enorme aantallen valse correlaties. En ” geloven “is te vaak”zien”.

te veel vertrouwen op correlatie creëert een reëel risico dat we zullen geloven dat er een causaal verband is tussen twee fenomenen terwijl het gewoon toeval zou kunnen zijn. In feite is het geen risico, het is onvermijdelijk.

Cartoon over de gevaren van retrospectieve analyse

klik op de cartoon om het volledige artikel te lezen

Prospective, not retrospective

dit is de reden waarom systematische reviews erop aandringen om de variabelen van belang te definiëren voordat hun gegevensanalyse wordt uitgevoerd. Deze ” prospectieve “(in tegenstelling tot” retrospectieve”) benadering is veel minder waarschijnlijk ontspoort door toevallige correlaties.

dezelfde regel geldt voor eerlijke tests van behandelingen. Het protocol voor een proef moet voorafgaand aan de studie duidelijk bepalen welke relaties moeten worden onderzocht.

als de onderzoekers na het uitvoeren van het onderzoek naar correlaties gaan zoeken, zullen ze waarschijnlijk met misleidende bevindingen komen.

dit wordt uitvoerig behandeld in de recente statistisch grappige blog “If at first you don’ t succeed, don ’t go looking for babies in the bath water”

ongeteste theorieën en de kracht van wishful thinking

“zoekt en gij zult vinden” (Matteüs 7:7).

niemand vindt het leuk om te denken dat ze hun tijd verspillen, inclusief nieuwtestamentische kroniekschrijvers, artsen en onderzoekers. Er is altijd een verleiding om aan te nemen dat als je wat actie onderneemt en een gewenste uitkomst volgt, dan moet het jouw actie zijn geweest die het tot stand heeft gebracht.

in de begindagen van het roken werden er allerlei gezondheidsvoordelen aan toegeschreven. Zoals we elders opmerken, James VI van Schotland was helemaal over dit in zijn”Counterblaste to Tobacco”. Mensen werden verkouden, mensen rookten tabak, ze werden beter, daarom geloofden ze dat de tabak hen had genezen.

was het de tabak die ze genas? Of zouden ze toch beter zijn geworden? Welke we geloven kan heel goed afhangen van wat we verwachten (of willen) geloven.

dit is mooi geïllustreerd in de uitstekende xkcd webstrip:

correlatie is geen causatie

we denken dat het lezen van Testbehandelingen u beter zal maken om claims over behandelingen te evalueren, maar we kunnen er niet zeker van zijn totdat iemand er een gerandomiseerd onderzoek op doet.

stuur ons ondertussen uw leerzame voorbeelden om mensen te helpen het verschil tussen correlatie en oorzakelijk verband te zien.

Veel dank aan Matt Penfold en Robin Massart.

  • porno kijken geassocieerd met krimp van mannelijke hersenen. NHS Choices 30 mei 2014
  • het bekijken van porno krimpt de hersenen: onderzoekers vinden het eerste mogelijke verband tussen het bekijken van pornografie en fysieke schade. Daily Mail, 30 mei 2014
  • is slapen in een lichte kamer gekoppeld aan obesitas? NHS Choices, 30 mei 2014
  • slapen met licht verhoogt het risico op obesitas. The Daily Telegraph, 30 mei 2014
  • mensen met een doel in het leven “leven langer,” studie adviseert. NHS Choices, 14 mei 2014
  • Sense of purpose “adds years to life”. BBC News, 14 mei 2014
  • onechte correlaties. Geraadpleegd op 2 juni 2014
  • Call of Duty and suicide: should parents be concerned? The Guardian, 28 mei 2014
  • Kayyali B, Knott D en van Kuiken S. The big – Data revolution in US health care: Accelerating value and innovation. McKinsey & Co, April 2013
  • Shah s, Horne A en Capellá J. Goede gegevens garanderen geen goede beslissingen. Harvard Business Review, April 2012
  • Bastian H. als het je eerst niet lukt, ga dan niet op zoek naar baby ‘ s in het badwater, statistisch Grappig, 16 maart 2014.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.

Previous post The basal membraan as a structured surface-role in vascular health and disease / Journal of Cell Science
Next post Blog Post