Format: Texte
Webseiten
Sprache/n: Englisch
Zielgruppe: Selbstgesteuertes Lernen
Undergraduate
Kurzbeschreibung:
Dieser Artikel erklärt, wie man erkennt, wann Korrelation oder Assoziation mit Kausalität verwechselt wurde.
Schlüsselbegriffe angesprochen:
- 1-3 Assoziation ist nicht dasselbe wie Verursachung
Details
Leider werden Sie, egal wie oft Sie es sagen, immer noch Schlagzeilen sehen wie:
- Das Betrachten von Pornos schrumpft das Gehirn
- Schlafen mit eingeschaltetem Licht erhöht das Risiko von Fettleibigkeit
- Sinn für Zweck ‚fügt dem Leben Jahre hinzu‘.
Alle oben genannten Behauptungen sind unbegründet, basierend auf den Beweisen, auf denen die Geschichten selbst basierten. Diese unbegründeten Behauptungen sind entstanden, weil Menschen Assoziation (Korrelation) mit Kausalität verwechselt haben.
Um Ihnen zu helfen, dieses Phänomen zu erklären und zu verstehen, warum es wichtig ist, sich nicht davon irreführen zu lassen, haben wir eine kleine Sammlung von Ressourcen zusammengestellt.
Video ansehen
Zufallsassoziationen
Justin Vigen hat eine brillante Website namens Spurious Correlations erstellt. Er durchforstet Datensätze und passt Parameter an, bis er eine Assoziation findet. In der folgenden Grafik zeigt er beispielsweise einen starken Zusammenhang zwischen dem Pro-Kopf-Verbrauch von Mozzarella-Käse in den USA und der Anzahl der Promotionen im Bauingenieurwesen.
Ich kann Käseträger haz?
Der Korrelationskoeffizient ist ein Maß dafür, wie eng zwei Variablen verbunden sind. Ein gutes Beispiel für Assoziation ist Größe und Gewicht – größere Menschen neigen dazu, schwerer zu sein. Je näher der Korrelationskoeffizient an 1 liegt, desto näher sind die Variablen zugeordnet. Im obigen Beispiel beträgt der Korrelationskoeffizient 0,95, was auf eine starke Assoziation hindeutet.
Statistische Korrelationstests sind jedoch „blind“: Sie geben nur Auskunft über das Zahlenmuster. Sie sagen überhaupt nichts über mögliche kausale Zusammenhänge oder andere Faktoren aus, von denen wir nichts wissen.
Das Problem, das Justin hervorhebt, ist, dass je mehr wir Daten schleppen, desto mehr Muster werden wir in ihnen sehen. Und je mehr wir nach Mustern suchen, desto wahrscheinlicher ist es, dass die Muster, die wir finden, einfach zufällige Assoziationen widerspiegeln.
Dies könnte in Ordnung sein, solange wir eindeutig nicht verwandte Variablen vergleichen, wie Todesfälle durch Ertrinken in einem Schwimmbad gegen die Anzahl der Filme mit Nicolas Cage (Korrelation 0,66) oder US-Ölimporte aus Norwegen gegen Fahrer, die von Zügen getötet wurden (0,95).
Aber was ist, wenn wir eine zufällige Assoziation zwischen zwei Variablen finden, die zufällig eine plausible Verbindung haben? Nehmen wir an, wir denken, dass das Essen von Käse Albträume verursacht. Dies könnte dazu führen, dass Sie sich hin- und herwerfen und sich in Ihren Bettlaken verfangen. Vielleicht sitzt du dann auf, schreist, fällst aus dem Bett und brichst dir den Hals, weil deine Gliedmaßen alle verheddert sind und du deinen Sturz nicht brechen kannst.
Korrelationskoeffizient = 0,94. Sag nicht, wir hätten dich nicht gewarnt!
Wenn Ihnen dieses Beispiel zu albern ist, was ist mit der Hysterie über Computerspiele? Wir sehen oft Medienberichte über mögliche Schäden durch gewalttätige Computerspiele. Kürzlich zitierte ein Gerichtsmediziner in England das Computerspiel Call of Duty als Faktor für „drei oder vier Untersuchungen zum Tod von Teenagern“. Dies sollte jedoch nicht überraschen: Es fällt Ihnen schwer, einen Teenager zu finden, der in der jüngeren Vergangenheit keine gewalttätigen Computerspiele gespielt hat.
Diese Tendenz ist nicht auf seltene Ereignisse beschränkt. Big Data zum Beispiel durchforstet riesige Datensätze auf der Suche nach Mustern. Wir sehen oft Behauptungen über die potenziellen Vorteile dieses Ansatzes in der Gesundheitsforschung. Die Auswirkungen sollten klar sein – es wird unweigerlich eine große Anzahl falscher Korrelationen hervorrufen. Und „Glauben“ ist zu oft „Sehen“.
Zu viel Vertrauen in Korrelation schafft ein reales Risiko, dass wir glauben, dass es einen kausalen Zusammenhang zwischen zwei Phänomenen gibt, wenn es nur Zufall sein könnte. In der Tat ist es kein Risiko, es ist unvermeidlich.
Klicken Sie auf die Karikatur, um den vollständigen Artikel zu lesen
Prospektiv, nicht retrospektiv
Aus diesem Grund bestehen systematische Reviews darauf, die Variablen von Interesse vor der Durchführung ihrer Datenanalyse zu definieren. Dieser „prospektive“ (im Gegensatz zu „retrospektive“) Ansatz wird weitaus weniger wahrscheinlich durch zufällige Korrelationen entgleist.
Die gleiche Regel gilt für faire Tests von Behandlungen. Das Protokoll für eine Studie muss im Vorfeld der Studie klar definieren, welche Zusammenhänge untersucht werden sollen.
Wenn die Forscher nach der Durchführung der Studie nach Korrelationen suchen, werden sie wahrscheinlich zu irreführenden Ergebnissen kommen.
Dies wird in dem kürzlich erschienenen statistisch lustigen Blog „If at first you don’t succeed, don’t go looking for babies in the bathwater“ umfassend behandelt
Ungetestete Theorien und die Kraft des Wunschdenkens
“ Sucht, und ihr werdet finden“ (Matthäus 7,7).
Niemand denkt gerne, dass er seine Zeit verschwendet, Neutestamentliche Chronisten, Ärzte und Forscher eingeschlossen. Es besteht immer die Versuchung anzunehmen, dass, wenn Sie etwas unternehmen und ein gewünschtes Ergebnis folgt, es Ihre Aktion gewesen sein muss, die es bewirkt hat.
In den frühen Tagen des Tabakrauchens wurden ihm alle möglichen gesundheitlichen Vorteile zugeschrieben. Wie wir an anderer Stelle bemerken, war James VI. von Schottland in seinem „Gegengeschmack zum Tabak“ darüber hinweg. Die Leute erkälteten sich, die Leute rauchten Tabak, sie wurden besser, deshalb glaubten sie, der Tabak habe sie geheilt.
War es der Tabak, der sie heilte? Oder wären sie sowieso besser geworden? Was wir glauben, kann sehr wohl davon abhängen, was wir erwarten (oder wollen) zu glauben.
Dies wird im ausgezeichneten xkcd-Webcomic schön illustriert:
Wir glauben, dass Sie durch das Lesen von Testbehandlungen Behauptungen über Behandlungen besser bewerten können, aber wir können nicht sicher sein, bis jemand eine randomisierte Studie dazu durchführt.
In der Zwischenzeit senden Sie uns bitte Ihre lehrreichen Beispiele, damit die Menschen den Unterschied zwischen Korrelation und Kausalität erkennen können.
Vielen Dank an Matt Penfold und Robin Massart.
- Anschauen von Pornos im Zusammenhang mit der Schrumpfung des männlichen Gehirns. NHS Choices 30th May 2014
- Das Betrachten von Pornos schrumpft das Gehirn: Forscher finden den ersten möglichen Zusammenhang zwischen dem Betrachten von Pornografie und körperlichen Schäden. Daily Mail, Mai 30 2014
- Ist das Schlafen in einem hellen Raum mit Fettleibigkeit verbunden? NHS Choices, 30th Mai 2014
- Schlafen mit Licht erhöht das Risiko von Fettleibigkeit. The Daily Telegraph, Mai 30 2014
- Menschen mit Sinn im Leben ‚länger leben,‘ Studie berät. NHS Choices, 14th Mai 2014
- Sinn für Zweck ‚fügt dem Leben Jahre hinzu‘. BBC News, Mai 14 2014
- Falsche Korrelationen. Zugriff am 2. Juni 2014
- Call of Duty und Selbstmord: Sollten Eltern besorgt sein? The Guardian, 28th Mai 2014
- Kayyali B, Knott D und van Kuiken S. Die Big-Data-Revolution im US-Gesundheitswesen: Beschleunigung von Wert und Innovation. McKinsey & Co, April 2013
- Shah S, Horne A und Capellá J. Gute Daten garantieren keine guten Entscheidungen. Harvard Business Review, April 2012
- Bastian H. Wenn es Ihnen zunächst nicht gelingt, suchen Sie nicht nach Babys im Badewasser, Statistisch lustig, 16.März 2014.