Sdružení není totéž jako kauzalita. Řekněme to znovu: asociace není totéž jako příčinná souvislost!

Formát: Texty

,

webových Stránek

,

Jazyk/y: angličtina

,

Cílová skupina: Self-nařídil učení

|

Student

|

Krátký Popis:

Tento článek vysvětluje, jak říct, když korelace nebo asociace byla zaměňována s příčinných souvislostí.

klíčové pojmy:

  • 1-3 Sdružení není totéž jako kauzalita

Podrobnosti

Bohužel, bez ohledu na to, kolikrát to řekneš, budete stále vidět titulky jako:

  • Sledování porna zmenšuje mozek
  • Spí s rozsvíceným světlem zvyšuje riziko obezity
  • Smysl se přidává roky života.

všechna výše uvedená tvrzení jsou neopodstatněná na základě důkazů, na nichž byly založeny samotné příběhy. Tato neopodstatněná tvrzení vznikla proto, že lidé zaměnili asociaci (korelaci) s příčinnou souvislost.

takže ve snaze pomoci vám vysvětlit tento jev a pochopit, proč je důležité, aby nebyl uveden v omyl, jsme sestavili malou sbírku zdrojů.

podívejte se na video

Šance, sdružení

Justin Vigen vytvořil brilantní webové stránky s názvem Falešné Korelace. Vlečné sítě dat a odpovídá parametrům, dokud nepřijde s Asociací. Například v níže uvedeném grafu ukazuje silnou souvislost mezi spotřebou mozzarelly na hlavu ve Spojených státech a počtem doktorátů udělených ve stavebnictví.

 Graf sýra vs engineering

mohu haz sýr nosníky?

korelační koefektivita je měřítkem toho, jak úzce jsou dvě proměnné spojeny. Dobrým příkladem asociace je výška a váha – vyšší lidé bývají těžší. Čím blíže je korelace koefektivní k 1, tím blíže jsou proměnné přidruženy. Ve výše uvedeném příkladu je korelační koeficient 0,95, což naznačuje silnou asociaci.

statistické testy korelace jsou však „slepé“: říkají vám pouze o vzoru čísel. Neříkají vůbec nic o možných příčinných vztazích, nebo o jiných faktorech, o kterých nevíme.

problém, který Justin zdůrazňuje, je, že čím více vlečeme data, tím více vzorů v nich uvidíme. A čím více budeme hledat vzory, tím je pravděpodobnější, že vzory, které najdeme, budou jednoduše odrážet náhodná sdružení.

To by mohlo být v pořádku tak dlouho, jak jsme porovnání zjevně nesouvisejících proměnných, jako jsou Úmrtí v důsledku utonutí v bazénu vs Počet filmů s Nicolasem Cagem (korelace 0.66), nebo NÁS dovoz ropy z Norska vs Ovladače zabit vlaky (0.95).

ale co když najdeme náhodnou souvislost mezi dvěma proměnnými, které mají náhodou věrohodné spojení? Řekněme, že si myslíme, že jíst sýr vám dává noční můry. To by vás mohlo hodit a otočit, a zamotat se do prostěradel. Možná se pak posadíte, křičíte, spadnete z postele a zlomíte si krk, protože vaše končetiny jsou zamotané a nemůžete zlomit pád.

Graf znázorňující korelaci mezi obyvatele spotřeba sýrů a počet lidí, kteří zemřeli stát se zapletený v jejich povlečení

Korelační koeficient = 0.94. Neříkej, že jsme tě nevarovali!

pokud je tento příklad pro vás příliš hloupý, co hysterie nad počítačovými hrami? Často vidíme mediální zprávy o potenciální škodě při hraní násilných počítačových her. Nedávno, koroner v Anglii citoval počítačovou hru Call of Duty jako faktor „tří nebo čtyř vyšetřování úmrtí teenagerů“. To by však nemělo být překvapivé: těžko byste hledali teenagera, který v nedávné minulosti nehrál násilné počítačové hry.

tato tendence se neomezuje pouze na vzácné příhody. Velká Data, například, vlečné sítě masivní datové sady hledají vzory. Často vidíme tvrzení o možných výhodách tohoto přístupu ve výzkumu zdravotní péče. Důsledky by měly být jasné-nevyhnutelně to vyvolá obrovské množství falešných korelací. A „věřit“ je příliš často „vidět“.

přílišná závislost na korelaci vytváří skutečné riziko, že budeme věřit, že existuje příčinná souvislost mezi dvěma jevy, když by to mohla být jen náhoda. Ve skutečnosti to není riziko, je to nevyhnutelné.

Cartoon o nebezpečí retrospektivní analýza

Klikněte karikatury, aby přečtěte si celý článek

Potenciální, nikoli retrospektivní

To je důvod, proč systematické recenze trvají na definování proměnných zájmu v předstihu provádět jejich analýzu dat. Tento“ prospektivní „(na rozdíl od“ retrospektivního“) přístup je mnohem méně pravděpodobné, že bude vykolejen náhodnými korelacemi.

stejné pravidlo platí pro spravedlivé testy léčby. Protokol pro zkoušku musí před zahájením studie jasně definovat, které vztahy mají být vyšetřeny.

pokud vědci hledají korelace po spuštění studie, pravděpodobně přijdou s zavádějícími zjištěními.

Tohle je komplexně pokryty v nedávné Statisticky Vtipný blog „Pokud se na první se vám nepodaří, nemusíte jít hledat pro děti v lázních“

Neprověřených teorií a moc zbožné přání

„Hledejte a naleznete“ (Matouš 7:7).

nikdo si nechce myslet, že ztrácí čas, včetně kronikářů Nového zákona, lékařů a vědců. Vždy existuje pokušení předpokládat, že pokud podniknete nějakou akci a následuje požadovaný výsledek, pak to musela být vaše akce, která to způsobila.

v počátcích kouření tabáku byly připisovány všechny zdravotní přínosy. Jak si všimneme jinde, James VI Skotska byl všude ve svém „Counterblaste to Tobacco“. Lidé dostali rýmu, lidé kouřili tabák, zlepšili se, proto věřili, že je tabák vyléčil.

byl to tabák, který je vyléčil? Nebo by se stejně zlepšili? Který z nich věříme, může velmi dobře záviset na tom, co očekáváme (nebo chceme) věřit.

To je pěkně znázorněno ve vynikající web komiks xkcd:

Korelace není kauzalita

myslíme si, že čtení Testovací Procedury, bude se vám lépe hodnotit tvrzení o ošetření, ale můžeme si být jistí, dokud někdo dělá randomizované studii na to.

mezitím nám prosím pošlete své poučné příklady, které lidem pomohou zjistit rozdíl mezi korelací a příčinnou souvislost.

Děkujeme Mattu Penfoldovi a Robinu Massartovi.

  • sledování porna spojeného se smrštěním mužského mozku. NHS 30. Května 2014
  • Sledování porna zmenšuje mozek: Vědci našli první možnou souvislost mezi prohlížení pornografie a fyzickou újmu. Daily Mail, 30. Května 2014
  • spí ve světlé místnosti spojené s obezitou? NHS, 30. Května 2014
  • Spát s ohledem na se zvyšuje riziko obezity. The Daily Telegraph, Květen 30 2014
  • lidé s cílem v životě „žijí déle,“ studie radí. NHS Choices, 14th May 2014
  • smysl pro účel „přidává roky k životu“. BBC News, 14. Května 2014
  • Falešné Korelace. Accessed 2nd June 2014
  • Call of Duty and suicide: měli by se rodiče obávat? The Guardian, 28. Května 2014
  • Kayyali B, Knott D a van Kuiken. S. big-data, revoluce v NÁS zdravotní péče: Urychlení hodnotu a inovace. McKinsey & co, duben 2013
  • Shah S, Horne A and Capella J. Dobrá data nezaručují dobrá rozhodnutí. Harvard Business Review, duben 2012
  • Bastian H. Pokud se na první se vám nepodaří, nemusíte jít hledat pro děti v lázních, Statisticky Vtipné, 16. Března 2014.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.

Previous post Bazální membrány jako strukturovaný povrch – role cévního zdraví a nemoci | Journal of Cell Science
Next post Blog Post