La asociación no es lo mismo que la causalidad. Digámoslo de nuevo: ¡asociación no es lo mismo que causalidad!

Formato: Textos

,

Sitios web

,

Idioma / s: Inglés

,

Público objetivo: Aprendizaje autodirigido Pregrado Descripción breve:

Este artículo explica cómo saber cuándo se ha confundido la correlación o asociación con la causalidad.

Conceptos clave abordados:

  • 1-3 La asociación no es lo mismo que la causalidad

Detalles

Lamentablemente, no importa cuántas veces lo digas, aún verás titulares como:

  • Ver porno reduce el cerebro
  • Dormir con la luz encendida aumenta el riesgo de obesidad
  • El sentido de propósito «añade años a la vida».

Todas las afirmaciones anteriores son infundadas, basadas en la evidencia en la que se basaron las historias. Estas afirmaciones infundadas han surgido porque la gente ha confundido la asociación (correlación) con la causalidad.

Por lo tanto, en un esfuerzo por ayudarlo a explicar este fenómeno y comprender por qué es importante no dejarse engañar por él, hemos reunido una pequeña colección de recursos.

Mira el video

Asociaciones de azar

Justin Vigen ha creado un sitio web brillante llamado Correlaciones espurias. Rastrea conjuntos de datos y coincide con parámetros hasta que se le ocurre una asociación. Por ejemplo, en el gráfico siguiente, muestra una fuerte asociación entre el consumo per cápita de queso mozzarella en los Estados Unidos y el número de doctorados otorgados en ingeniería civil.

 Gráfico de queso vs ingeniería

¿Puedo hacer vigas de queso?

El coeficiente de correlación es una medida de cuán estrechamente se asocian dos variables. Un buen ejemplo de asociación es la altura y el peso: las personas más altas tienden a ser más pesadas. Cuanto más cerca esté el coeficiente de correlación a 1, más cerca estarán asociadas las variables. En el ejemplo anterior, el coeficiente de correlación es de 0,95, lo que sugiere una fuerte asociación.

Sin embargo, las pruebas estadísticas de correlación son «ciegas»: solo le informan sobre el patrón de los números. No dicen nada sobre posibles relaciones causales u otros factores que desconocemos.

El problema que Justin destaca es que cuantos más datos rastreemos, más patrones veremos en ellos. Y cuanto más busquemos patrones, más probable es que los patrones que encontremos simplemente reflejen asociaciones casuales.

Esto podría estar bien siempre y cuando comparemos variables claramente no relacionadas, como Muertes por ahogamiento en una piscina frente al número de películas con Nicolas Cage (correlación 0,66), o importaciones de petróleo de Estados Unidos de Noruega frente a Conductores muertos por trenes (0,95).

Pero, ¿y si encontramos una asociación casual entre dos variables que simplemente tienen una conexión plausible? Digamos que pensamos que comer queso te da pesadillas. Esto podría hacerte girar y revolcarte, y enredarte en tus sábanas. Tal vez entonces te sientas, gritas, te caes de la cama y te rompes el cuello porque tus extremidades están enredadas y no puedes romper tu caída.

 Gráfico que muestra la correlación entre el consumo per cápita de queso y el número de personas que murieron por enredarse en sus sábanas

Coeficiente de correlación = 0,94. ¡No digas que no te avisamos!

Si ese ejemplo es demasiado tonto para ti, ¿qué pasa con la histeria sobre los juegos de computadora? A menudo vemos informes de los medios de comunicación sobre el daño potencial de jugar juegos de computadora violentos. Recientemente, un forense en Inglaterra citó el juego de computadora Call of Duty como un factor en «tres o cuatro investigaciones sobre la muerte de adolescentes». Sin embargo, esto no debería ser sorprendente: sería difícil encontrar a un adolescente que no haya jugado juegos de computadora violentos en el pasado reciente.

Esta tendencia no se limita a eventos raros. Los grandes datos, por ejemplo, rastrean conjuntos de datos masivos en busca de patrones. A menudo vemos afirmaciones sobre los beneficios potenciales de este enfoque en la investigación de atención médica. Las implicaciones deben ser claras: inevitablemente arrojará un gran número de correlaciones falsas. Y » Creer «es con demasiada frecuencia»Ver».

Confiar demasiado en la correlación crea un riesgo real de que creamos que hay una conexión causal entre dos fenómenos cuando podría ser solo casualidad. De hecho, no es un riesgo, es inevitable.

 Caricatura sobre los peligros del análisis retrospectivo

Haga clic en la caricatura para leer el artículo completo

Prospectivo, no retrospectivo

Es por eso que las revisiones sistemáticas insisten en definir las variables de interés antes de realizar su análisis de datos. Este enfoque» prospectivo «(en contraposición a» retrospectivo») es mucho menos probable que se descarrile por correlaciones casuales.

La misma regla se aplica a las pruebas justas de los tratamientos. El protocolo de un ensayo debe definir claramente, antes del estudio, qué relaciones deben investigarse.

Si los investigadores buscan correlaciones después de que se haya realizado el ensayo, probablemente descubrirán hallazgos engañosos.

Esto se cubre exhaustivamente en el reciente blog Estadísticamente divertido»Si al principio no tienes éxito, no busques bebés en el agua del baño»

Teorías no probadas y el poder de las ilusiones

«Buscad y hallaréis» (Mateo 7: 7).

A nadie le gusta pensar que está perdiendo el tiempo, cronistas del Nuevo Testamento, médicos e investigadores incluidos. Siempre hay una tentación de asumir que si tomas alguna acción y un resultado deseado la sigue, entonces debe haber sido tu acción la que la produjo.

En los primeros días del tabaquismo, se le atribuyeron todo tipo de beneficios para la salud. Como observamos en otra parte, Jacobo VI de Escocia se ocupó de todo esto en su»Counterblaste to Tobacco». La gente se resfriaba, fumaba tabaco, mejoraba, por lo tanto, creían que el tabaco los había curado.

¿Fue el tabaco el que los curó? ¿O habrían mejorado de todos modos? Cuál creemos puede muy bien depender de lo que esperamos (o queremos) creer.

Esto está muy bien ilustrado en el excelente cómic web xkcd:

La correlación no es causalidad

Creemos que los tratamientos de prueba de lectura le harán evaluar mejor las afirmaciones sobre los tratamientos, pero no podemos estar seguros hasta que alguien realice un ensayo aleatorizado sobre ellos.

Mientras tanto, envíenos sus ejemplos instructivos para ayudar a las personas a distinguir la diferencia entre correlación y causalidad.

Muchas gracias a Matt Penfold y Robin Massart.

  • Ver porno asociado con la contracción del cerebro masculino. Elecciones del NHS 30 de mayo de 2014
  • Ver pornografía reduce el cerebro: Los investigadores encuentran el primer vínculo posible entre ver pornografía y el daño físico. Daily Mail, 30 de mayo de 2014
  • ¿Dormir en una habitación luminosa está relacionado con la obesidad? Elecciones del NHS, 30 de mayo de 2014
  • Dormir con luz encendida aumenta el riesgo de obesidad. The Daily Telegraph, 30 de mayo de 2014
  • Las personas con un propósito en la vida «viven más», aconseja el estudio. Elecciones del NHS, 14 de mayo de 2014
  • Sentido de propósito «añade años a la vida». BBC News, 14 de mayo de 2014
  • Correlaciones espurias. Consultado el 2 de junio de 2014
  • Call of Duty and suicide: should parents be concerned? The Guardian, 28 de mayo de 2014
  • Kayyali B, Knott D y van Kuiken S. La revolución de los grandes datos en el cuidado de la salud de los Estados Unidos: Acelerar el valor y la innovación. McKinsey & Co, abril de 2013
  • Shah S, Horne A y Capellá J. Los buenos datos no garantizan buenas decisiones. Harvard Business Review, abril de 2012
  • Bastian H. Si al principio no tienes éxito, no busques bebés en el agua del baño, Estadísticamente divertido, 16 de marzo de 2014.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

Previous post La membrana basal como un papel de superficie estructurada en la salud y las enfermedades vasculares / Journal of Cell Science
Next post Entrada de blog