a associação não é a mesma que o nexo de causalidade. Digamos mais uma vez: a associação não é a mesma causa!

Formato: Textos

,

Sites

,

Idioma/s: inglês

,

Público-Alvo: a aprendizagem Auto-dirigida

|

Graduação

|

Descrição Breve:

Este artigo explica como saber quando correlação ou associação, foi confundido com o nexo de causalidade.

conceitos-chave abordados:

  • 1-3 Associação não é o mesmo como o nexo de causalidade

Detalhes

Infelizmente, não importa quantas vezes você diga, você ainda vai ver manchetes como:

  • a Visualização de pornografia encolhe o cérebro
  • Dormir com a luz acesa aumenta o risco de obesidade
  • Senso de finalidade”, acrescenta anos à vida”.

todas as alegações acima são infundadas, com base nas provas em que as próprias histórias foram baseadas. Estas alegações infundadas surgiram porque as pessoas confundiram associação (correlação) com nexo de causalidade.Então, em um esforço para ajudá-lo a explicar este fenômeno, e entender por que é importante não ser enganado por ele, nós montamos uma pequena coleção de recursos.

Assista ao vídeo

associações de Chance

Justin Vigen criou um site brilhante chamado correlações espúrias. Ele trava conjuntos de dados e combina com parâmetros até que ele aparece com uma associação. Por exemplo, no gráfico abaixo, ele mostra uma forte associação entre o consumo per capita de queijo mozzarella nos Estados Unidos e o número de Doutoramentos concedidos em Engenharia civil.

Graph of cheese vs engineering

I can haz cheese girders?

a correlação co-eficiente é uma medida de quão próximas duas variáveis estão associadas. Um bom exemplo de associação é a altura e peso – pessoas mais altas tendem a ser mais pesadas. Quanto mais próxima a correlação co-eficiente é de 1, mais próximas as variáveis são associadas. No exemplo acima, o coeficiente de correlação é 0,95, sugerindo uma forte associação.

no entanto, os testes estatísticos de correlação são “cegos”: eles só lhe falam sobre o padrão dos números. Eles não dizem nada sobre possíveis relações causais, ou outros fatores que não conhecemos.

o problema que Justin destaca é que quanto mais nós arrastamos os dados, mais padrões veremos neles. E quanto mais procuramos padrões, mais provável é que os padrões que encontramos reflictam simplesmente as associações do acaso.Isto pode ser bom, desde que estejamos a comparar variáveis claramente independentes, tais como mortes por afogamento numa piscina vs número de filmes com Nicolas Cage (correlação 0.66), ou importações de petróleo dos EUA da Noruega vs condutores mortos por comboios (0.95).Mas e se encontrarmos uma associação entre duas variáveis que por acaso têm uma ligação plausível? Digamos que achamos que comer queijo te dá pesadelos. Isto pode fazer-te atirar e virar, e ficar enredado nos teus lençóis. Talvez depois se sente, grite, caia da cama e parta o pescoço porque os seus membros estão todos emaranhados e não consegue quebrar a sua queda.

gráfico que mostra a correlação entre o consumo per capita de queijo e o número de pessoas que morreram por se terem enredado nas suas lençóis

correlação co-eficiente = 0,94. Não digas que não te avisámos!Se esse exemplo for demasiado tolo para si, e a histeria dos jogos de computador? Muitas vezes vemos relatos de mídia sobre danos potenciais de jogar jogos de computador violentos. Recentemente, um médico legista na Inglaterra citou o jogo de computador Call of Duty como um fator em “três ou quatro inquéritos sobre a morte de adolescentes”. No entanto, isso não deve ser surpreendente: você seria forçado a encontrar um adolescente que não tenha jogado jogos de computador violentos no passado recente.

esta tendência não se limita a acontecimentos raros. Grandes dados, por exemplo, redes de arrasto grandes conjuntos de dados à procura de padrões. Vemos frequentemente alegações sobre os potenciais benefícios desta abordagem na investigação em matéria de cuidados de saúde. As implicações devem ser claras-irá inevitavelmente criar um grande número de correlações espúrias. E ” acreditar “é muitas vezes”ver”.A confiança excessiva na correlação cria um risco real de acreditarmos que há uma relação causal entre dois fenómenos quando pode ser apenas acaso. Na verdade, não é um risco, é inevitável.

Cartoon sobre os perigos da análise retrospectiva

Clique em desenho animado para ler o artigo completo

Prospectiva, e não retrospectiva

é por Isso que as revisões sistemáticas insistem em definir as variáveis de interesse com antecedência de realização de sua análise de dados. Esta abordagem” prospectiva “(em oposição a” retrospectiva”) é muito menos provável de ser descarrilada por correlações casuais.

a mesma regra aplica-se a testes justos dos tratamentos. O Protocolo para um ensaio deve definir claramente, antes do estudo, quais as relações que devem ser investigadas.

se os investigadores procurarem correlações após o ensaio ter sido executado, provavelmente irão encontrar conclusões enganosas.

isto é amplamente coberto no recente blog estatisticamente Engraçado “If at first you don’t succeed, don’t go looking for babies in the bathwater”

teorias não testadas e o poder do pensamento desejoso

“buscai e encontrareis” (Mateus 7:7).Ninguém gosta de pensar que está perdendo seu tempo, incluindo cronistas do Novo Testamento, médicos e pesquisadores. Há sempre a tentação de supor que se você tomar alguma ação e um resultado desejado segue-o, então deve ter sido a sua ação que causou isso.

nos primeiros dias de tabagismo, todos os tipos de benefícios para a saúde foram atribuídos a ele. Como notamos em outros lugares, Jaime VI da Escócia estava em cima disso em seu “contra-blaste ao tabaco”. As pessoas constiparam-se, fumaram tabaco, melhoraram, por isso acreditavam que o tabaco as tinha curado.Foi o tabaco que os curou? Ou teriam melhorado? Qual deles acreditamos pode muito bem depender do que esperamos (ou queremos) acreditar.

isto está bem ilustrado na excelente banda desenhada xkcd:

a correlação não é causação

pensamos que a leitura de tratamentos de teste lhe fará avaliar melhor as alegações sobre tratamentos, mas não podemos ter a certeza até que alguém faça um ensaio randomizado sobre ele.Entretanto, envie-nos os seus exemplos instrutivos para ajudar as pessoas a distinguir entre correlação e causalidade.Muito obrigado a Matt Penfold e Robin Massart.

  • ver pornografia associada a encolhimento cerebral masculino. Escolhas NHS 30 de Maio de 2014
  • ver pornografia encolhe o cérebro: os investigadores encontram a primeira ligação possível entre ver pornografia e danos físicos. Daily Mail, 30 de Maio de 2014
  • está dormindo em uma sala de luz ligada à obesidade? Escolhas NHS, 30 de Maio de 2014
  • dormir com luz aumenta o risco de obesidade. The Daily Telegraph, 30 de Maio de 2014
  • People with purpose in life ‘live longer,’ study advises. Escolhas NHS, 14 de Maio de 2014
  • sentido de propósito ‘acrescenta anos à vida’. BBC News, 14 de Maio de 2014
  • correlações espúrias. Accessed 2nd June 2014
  • Call of Duty and suicide: should parents be concerned? The Guardian, 28 de Maio de 2014
  • Kayyali B, Knott D e van Kuiken S. The big-data revolution in US health care: Accelerating value and innovation. McKinsey & Co, April 2013
  • Shah S, Horne a And Capellá J. Bons dados não garantem boas decisões. Harvard Business Review, April 2012
  • Bastian H. If at first you don’t succeed, don’t go looking for babies in the bathwater, Statistically Funny, 16th March 2014.

Deixe uma resposta

O seu endereço de email não será publicado.

Previous post monitore a saúde da sua comunidade aqui
Next post Post