Format: teksty
strony internetowe
język/y: angielski
Grupa docelowa: samodzielna nauka
studia licencjackie
Krótki opis:
ten artykuł wyjaśnia, jak rozpoznać, kiedy korelacja lub skojarzenie zostało pomylone z przyczynowością.
kluczowe pojęcia:
- 1-3 Stowarzyszenie to nie to samo co związek przyczynowy
szczegóły
niestety, bez względu na to, ile razy to powiesz, nadal zobaczysz nagłówki takie jak:
- oglądanie porno kurczy mózg
- spanie przy włączonym świetle zwiększa ryzyko otyłości
- poczucie celu „dodaje lat do życia”.
wszystkie powyższe twierdzenia są bezpodstawne, w oparciu o dowody, na których opierały się same historie. Te nieuzasadnione twierdzenia powstały, ponieważ ludzie pomylili skojarzenie (korelację) z przyczynowością.
tak więc, aby pomóc ci wyjaśnić to zjawisko i zrozumieć, dlaczego ważne jest, aby nie dać się zwieść, zebraliśmy mały zbiór zasobów.
Obejrzyj film
przypadkowe skojarzenia
Justin Vigen stworzył genialną stronę o nazwie Spurious Correlations. Przegląda zbiory danych i dopasowuje parametry, dopóki nie wymyśli asocjacji. Na przykład na poniższym wykresie pokazuje silny związek między spożyciem sera mozzarella na mieszkańca w Stanach Zjednoczonych a liczbą doktoratów przyznanych w dziedzinie inżynierii lądowej.
Czy Mogę haz ser dźwigary?
współzależność jest miarą tego, jak ściśle dwie zmienne są ze sobą powiązane. Dobrym przykładem Stowarzyszenia jest wzrost i waga – wyższy ludzie wydają się być cięższe. Im bliżej korelacji jest 1, tym bliżej są powiązane zmienne. W powyższym przykładzie współczynnik korelacji wynosi 0,95, co sugeruje silne skojarzenie.
jednak statystyczne testy korelacji są „ślepe”: mówią tylko o wzorze liczb. Nic nie mówią o możliwych związkach przyczynowych lub innych czynnikach, o których nie wiemy.
problem, na który zwraca uwagę Justin, polega na tym, że im więcej danych przeszukiwamy, tym więcej wzorców w nich zobaczymy. Im więcej szukamy wzorców, tym bardziej prawdopodobne jest, że wzorce, które znajdziemy, będą odzwierciedlać skojarzenia przypadkowe.
to może być w porządku, jeśli porównamy wyraźnie niepowiązane ze sobą zmienne, takie jak śmierć przez utonięcie w basenie vs liczba filmów z Nicolasem Cage ’ em (korelacja 0,66) lub import ropy z Norwegii w USA vs kierowcy zabici przez pociągi (0,95).
ale co, jeśli znajdziemy przypadkowe skojarzenie między dwiema zmiennymi, które akurat mają wiarygodne połączenie? Powiedzmy, że uważamy, że jedzenie sera powoduje koszmary. To może sprawić, że będziesz się przewracać i uwikłać w prześcieradła. Może wtedy usiądziesz, krzyczysz, spadniesz z łóżka i złamiesz kark, bo Twoje kończyny są splątane i nie możesz złamać upadku.
korelacja współwystępująca = 0,94. Nie mów, że cię nie ostrzegaliśmy!
Jeśli ten przykład jest dla Ciebie zbyt głupi, to co z histerią nad grami komputerowymi? Często widzimy doniesienia medialne o potencjalnych szkodach wynikających z grania w brutalne gry komputerowe. Niedawno koroner w Anglii wymienił grę komputerową Call of Duty jako czynnik „trzech lub czterech dochodzeń w sprawie śmierci nastolatków”. Nie powinno to jednak dziwić: trudno byłoby znaleźć nastolatka, który nie grał w brutalne gry komputerowe w niedawnej przeszłości.
tendencja ta nie ogranicza się do rzadkich zdarzeń. Big Data, na przykład, przeszukuje ogromne zbiory danych w poszukiwaniu wzorców. Często widzimy twierdzenia o potencjalnych korzyściach płynących z tego podejścia w badaniach nad ochroną zdrowia. Implikacje powinny być jasne – nieuchronnie spowoduje to powstanie ogromnej liczby fałszywych korelacji. A „wiara” to zbyt często „widzenie”.
zbyt duże poleganie na korelacji stwarza realne ryzyko, że uwierzymy, że istnieje związek przyczynowy między dwoma zjawiskami, gdy może to być tylko przypadek. Nie jest to ryzyko, jest nieuniknione.
kliknij rysunek, aby przeczytać cały artykuł
perspektywiczny, a nie retrospektywny
dlatego przeglądy systematyczne nalegają na zdefiniowanie interesujących zmiennych przed przeprowadzeniem analizy danych. To ” prospektywne „(w przeciwieństwie do” retrospektywnego”) podejście jest znacznie mniej prawdopodobne, aby być wykolejone przez przypadkowe korelacje.
ta sama zasada dotyczy uczciwych testów zabiegów. Protokół badania musi jasno określać, przed badaniem, jakie relacje mają być badane.
jeśli naukowcy poszukają korelacji po przeprowadzeniu badania, prawdopodobnie wymyślą mylące ustalenia.
jest to wyczerpująco opisane w najnowszym statystycznie śmiesznym blogu „jeśli na początku ci się nie uda, nie szukaj dzieci w wannie”
niesprawdzone teorie i moc pobożnego życzenia
„Szukajcie, a znajdziecie” (Ew. Mateusza 7.7).
nikt nie lubi myśleć, że marnuje swój czas, w tym kronikarze Nowego Testamentu, lekarze i badacze. Zawsze istnieje pokusa, aby zakładać, że jeśli podejmiesz jakieś działanie i po nim nastąpi pożądany rezultat, to musiało to być twoje działanie.
w pierwszych dniach palenia tytoniu przypisywano mu wszelkie korzyści zdrowotne. Jak zauważamy gdzie indziej, Jakub VI ze Szkocji zajmował się tym w swoim „Kontrablastie do tytoniu”. Ludzie się przeziębili, ludzie palili tytoń, poprawili się, dlatego wierzyli, że tytoń ich wyleczył.
czy to tytoń ich wyleczył? A może i tak by im się polepszyło? To, w co wierzymy, może bardzo dobrze zależeć od tego, czego oczekujemy (lub chcemy) wierzyć.
jest to ładnie zilustrowane w znakomitym komiksie internetowym xkcd:
uważamy, że czytanie testów pozwoli Ci lepiej ocenić twierdzenia o leczeniu, ale nie możemy być pewni, dopóki ktoś nie przeprowadzi na nim randomizowanego badania.
tymczasem prześlij nam swoje pouczające przykłady, aby pomóc ludziom odróżnić korelację od Związku przyczynowego.
podziękowania dla Matta Penfolda i Robina Massarta.
- oglądanie porno związanego z męskim skurczem mózgu. NHS Choices 30th May 2014
- oglądanie pornografii kurczy mózg: Naukowcy znajdują pierwszy możliwy związek między oglądaniem pornografii a szkodą fizyczną. Daily Mail, 30 maja 2014
- czy spanie w jasnym pokoju wiąże się z otyłością? NHS Choices, 30 maja 2014
- spanie ze światłem zwiększa ryzyko otyłości. The Daily Telegraph, 30 maja 2014
- ludzie z celem w życiu „żyją dłużej”, radzi badanie. NHS Choices, 14 maja 2014
- poczucie celu „dodaje lat do życia”.
- Call of Duty and suicide: should parents be concerned? The Guardian, 28 maja 2014
- Kayyali B, Knott D i van Kuiken S. rewolucja big-data W US health care: przyspieszenie wartości i innowacji. McKinsey & Co, April 2013
- Shah S, Horne a i Capellá J. Dobre dane nie gwarantują dobrych decyzji. Harvard Business Review, kwiecień 2012
- Bastian H. jeśli na początku ci się nie uda, nie szukaj dzieci w wannie, statystycznie Zabawne, 16 marca 2014.