Formato: Testi
Siti web
Lingua: inglese
Target: Self-directed learning
Laurea
Breve Descrizione:
Questo articolo spiega come capire quando la correlazione o la associazione è stata confusa con la causalità.
Concetti chiave affrontati:
- 1-3 l’Associazione non è la stessa come causale
Dettagli
Purtroppo, non importa quante volte si dice, si continua a vedere titoli come::
- Visualizzazione di porno si restringe il cervello
- Dormire con la luce accesa aumenta il rischio di obesità
- Senso di scopo “aggiunge anni alla vita”.
Tutte le affermazioni di cui sopra sono infondate, sulla base delle prove su cui si basavano le storie stesse. Queste affermazioni infondate sono sorte perché le persone hanno confuso l’associazione (correlazione) con la causalità.
Così, nel tentativo di aiutare a spiegare questo fenomeno, e capire perché è importante non essere ingannati da esso, abbiamo messo insieme una piccola collezione di risorse.
Guarda il video
Associazioni chance
Justin Vigen ha creato un sito web brillante chiamato Correlazioni spurie. Egli pesca a strascico set di dati e corrisponde parametri fino a quando non si presenta con un’associazione. Ad esempio, nel grafico sottostante, mostra una forte associazione tra il consumo pro capite di mozzarella negli Stati Uniti e il numero di dottorati assegnati in ingegneria civile.
Posso travi formaggio haz?
La correlazione co-efficiente è una misura di quanto strettamente due variabili sono associate. Un buon esempio di associazione è altezza e peso – le persone più alte tendono ad essere più pesanti. Più vicina è la correlazione co-efficiente a 1, più vicine sono le variabili associate. Nell’esempio precedente, il coefficiente di correlazione è 0,95, suggerendo una forte associazione.
Tuttavia, i test statistici di correlazione sono “ciechi”: ti parlano solo del modello dei numeri. Non dicono nulla su possibili relazioni causali, o altri fattori che non conosciamo.
Il problema che Justin mette in evidenza è che più abbiamo dati di pesca a strascico, più modelli vedremo in loro. E più cerchiamo i modelli, più è probabile che i modelli che troviamo riflettano semplicemente le associazioni casuali.
Questo potrebbe andare bene finché stiamo confrontando variabili chiaramente non correlate, come le morti per annegamento in una piscina rispetto al numero di film con Nicolas Cage (correlazione 0.66), o le importazioni di petrolio statunitensi dalla Norvegia rispetto ai conducenti uccisi dai treni (0.95).
Ma cosa succede se troviamo un’associazione casuale tra due variabili che hanno una connessione plausibile? Diciamo che pensiamo che mangiare formaggio ti dia incubi. Questo potrebbe farti girare e girare e rimanere impigliato nelle tue lenzuola. Forse poi ti siedi, urli, cadi dal letto e ti rompi il collo perché le tue membra sono tutte aggrovigliate e non puoi rompere la tua caduta.
Correlazione co-efficiente = 0.94. Non dire che non ti abbiamo avvertito!
Se quell’esempio è troppo sciocco per te, che dire dell’isteria sui giochi per computer? Spesso vediamo rapporti dei media sui potenziali danni derivanti dal gioco di giochi per computer violenti. Recentemente, un medico legale in Inghilterra ha citato il gioco per computer Call of Duty come un fattore in “tre o quattro inchieste sulla morte di adolescenti”. Tuttavia, questo non dovrebbe essere sorprendente: si sarebbe difficile spinto a trovare un adolescente che non ha giocato giochi per computer violenti nel recente passato.
Questa tendenza non si limita agli eventi rari. Big Data, ad esempio, reti a strascico enormi set di dati alla ricerca di modelli. Spesso vediamo affermazioni sui potenziali benefici di questo approccio nella ricerca sanitaria. Le implicazioni dovrebbero essere chiare – inevitabilmente vomiterà un numero enorme di correlazioni spurie. E ” Credere “è troppo spesso”Vedere”.
Troppa dipendenza dalla correlazione crea un rischio reale che crederemo che ci sia una connessione causale tra due fenomeni quando potrebbe essere solo un caso. In realtà, non è un rischio, è inevitabile.
Clicca sul fumetto per leggere l’articolo completo
Prospettico, non retrospettivo
Questo è il motivo per cui le revisioni sistematiche insistono sulla definizione delle variabili di interesse prima di condurre la loro analisi dei dati. Questo approccio” prospettico “(al contrario di” retrospettivo”) è molto meno probabile che venga deragliato da correlazioni casuali.
La stessa regola vale per i test equi dei trattamenti. Il protocollo per uno studio deve definire chiaramente, prima dello studio, quali relazioni devono essere investigate.
Se i ricercatori vanno alla ricerca di correlazioni dopo che il processo è stato eseguito, probabilmente troveranno risultati fuorvianti.
Questo è ampiamente coperto nel recente blog statisticamente divertente “Se all’inizio non ci riesci, non andare alla ricerca di bambini nell’acqua sporca”
Teorie non testate e il potere del pio desiderio
“Cercate e troverete” (Matteo 7:7).
A nessuno piace pensare che stiano sprecando il loro tempo, cronisti del Nuovo Testamento, medici e ricercatori inclusi. C’è sempre la tentazione di supporre che se si prende qualche azione e un risultato desiderato lo segue, allora deve essere stata la vostra azione che ha portato.
Nei primi giorni del fumo di tabacco, tutti i tipi di benefici per la salute sono stati attribuiti ad esso. Come notiamo altrove, Giacomo VI di Scozia era tutto questo nel suo “Counterblaste to Tobacco”. La gente ha avuto un raffreddore, la gente fumava tabacco, miglioravano, quindi credevano che il tabacco li avesse curati.
Fu il tabacco che li curò? O sarebbero migliorati comunque? Quale crediamo può benissimo dipendere da ciò che ci aspettiamo (o vogliamo) credere.
Questo è ben illustrato nell’eccellente fumetto web xkcd:
Pensiamo che leggere i trattamenti di test ti farà valutare meglio le affermazioni sui trattamenti, ma non possiamo essere sicuri fino a quando qualcuno non fa uno studio randomizzato su di esso.
Nel frattempo, vi preghiamo di inviarci i vostri esempi istruttivi per aiutare le persone a capire la differenza tra correlazione e causalità.
Molte grazie a Matt Penfold e Robin Massart.
- Guardare il porno associato al restringimento del cervello maschile. NHS Choices 30th May 2014
- La visualizzazione del porno restringe il cervello: i ricercatori trovano il primo possibile collegamento tra la visualizzazione della pornografia e il danno fisico. Daily Mail, 30 maggio 2014
- Dormire in una stanza luminosa è legato all’obesità? Scelte NHS, 30 maggio 2014
- Dormire con la luce aumenta il rischio di obesità. The Daily Telegraph, May 30 2014
- Le persone con uno scopo nella vita ‘vivono più a lungo’, consiglia lo studio. NHS Scelte, 14 maggio 2014
- Senso di scopo ‘aggiunge anni alla vita’. BBC News, 14 maggio 2014
- Correlazioni spurie. Accessed 2nd June 2014
- Call of Duty and suicide: i genitori dovrebbero essere preoccupati? The Guardian, 28 maggio 2014
- Kayyali B, Knott D e van Kuiken S. La rivoluzione dei big data nell’assistenza sanitaria statunitense: accelerare il valore e l’innovazione. McKinsey & Co, aprile 2013
- Shah S, Horne A e Capellá J. Buoni dati non garantiranno buone decisioni. Harvard Business Review, aprile 2012
- Bastian H. Se all’inizio non ci riesci, non andare alla ricerca di bambini nell’acqua sporca, Statisticamente divertente, 16 marzo 2014.