ESCRIBA LO QUE DESEA LEER EN ESTE BLOG

jueves, 16 de junio de 2016

Correlación no implica causalidad



Tomemos un típico titular sobre un estudio científico tipo “Un estudio afirma que las personas que fuman ligan más”. Leemos la noticia con más profundidad y vemos que un grupo de experimentadores ha comparado el grupo 1 “fumadores”con el grupo 2 “no fumadores” y ha constatado que el grupo 1 tenía un historial de  experiencias sexuales mayor que el grupo 2. Hasta aquí todo normal.
El problema es la conclusión que el lector puede extraer, o incluso el periodista o los mismos científicos. La conclusión que parece desprenderse es “fumar causa más ligues”. Y aquí está el problema. Esa es, contrariamente a la intuición, una conclusión muy precipitada. Y es que una correlación entre A y B no implica que A cause B. Correlación no implica causalidad, o dicho de manera algo más pedante “Cum hoc ergo propter hoc” Vamos a explicar esa afirmación con más detalle.
Hecho: Constatamos que a más A, más B; y que a menos A, menos B. Es decir, una correlación entre A y B.
  • Posibilidad 1: A causa B. Es la conclusión precipitada. En nuestro ejemplo, fumar causa más ligues.
  • Posiblilidad 2: B causa A. Primera sorpresa, llamada “falacia de dirección incorrecta”: la causalidad era inversa a lo que pensábamos. En nuestro ejemplo, muchos ligues causan fumar, en lugar de que fumar cause más ligues. Por ejemplo, hipoteticemos que las personas que ligan mucho se estresan más y por tanto fuman más para lidiar con ese estrés.
Otro ejemplo: en la edad media, se pensaba que los piojos daban buena salud porque no se veían en gente enferma. En realidad era al revés, la buena salud hacía probable que tuvieras piojos, porque los piojos picaban a  casi todo el mundo menos a los enfermos.
  • Posibilidad 3: A causa C que causa B. Una variable intermedia que no habíamos tenido en cuenta a la hora de analizar los datos. En nuestro ejemplo, pongamos que la gente que fuma tiende a salir más a la calle ( por ejemplo en el trabajo haciendo la pausa del pitillo), y eso hace que la gente ligue más. La realidad no consistía en que fumar causara más ligues, sino en que fumar causa más salidas a la calle (variable C) y eso causa más ligues.
Otro ejemplo: se observa que los integrantes de una secta determinada tienen menos probabilidad de caer en las drogas. Se concluye que esa secta causa mayor protección ante la drogadicción. Pero observando mejor la realidad, descubrimos que los miembros de esa secta están bajo la vigilancia regular de un supervisor. La realidad no era que la secta (A) causara poca probabilidad de caer en la drogadicción (B), sino que la secta (A) causa vigilancia regular (C) que causa poca probabilidad de caer en la drogadicción (B). Así que en nuestro ejemplo podemos liberar a nuestro hijo de los exigentes preceptos de la secta y dejarlo en manos de un simple supervisor.
  • Posibilidad 4: C causa A y B. Se suele referir a este fenómeno como “relación espúria”. Esta vez, la variable tercera causa los dos fenómenos. En nuestro ejemplo, hipoteticemos que las personas que son más despreocupadas (variable C) fuman más, pongamos que porque no están tan asustadas por las enfermedades pulmonares. Y ligan más, pongamos que porque no están tan preocupadas por el rechazo.
Otro ejemplo: se observa que a más consumo de helados, mayor número de ahogamientos. La conclusión “Comer helados (A) causa mayor probabilidad de ahogarse (B)” parece mucho menos ajustada a la realidad que “El calor (C) causa más consumo de helados (A) y más baños refrescantes, lo que aumenta la posibilidad de ahogarse (B). Este que acabo de contar es el ejemplo que se usa siempre, pero podríamos poner cientos de ejemplos reales, debido a que es un error muy típico.
Por ejemplo, un famoso estudio afirmaba que los niños con los pies grandes eran mejores en matemáticas. En realidad, los niños de mayor edad tenían los pies más grandes y también eran mejores en matemáticas. La edad (creo recordar que habían tenido en cuenta la edad por años, pero no por meses) era esa fastidiosa variable C. Otro estudio afirmaba que los niños que duermen con la luz encendida tenían más posibilidad de padecer miopía. En realidad, eran los padres miopes (C) los que provocaban por herencia que sus hijos tuvieran mayor probabilidad de ser miopes y los que, al parecer, tenían más tendencia a dejar la luz encendida del dormitorio de sus hijos (no he encontrado la explicación a esto último).
Finalmente, podemos incluir posibilidades mucho más rebuscadas como A causa C que causa D que causa B, tanto A causa B como B causa A, B causa C que causa A, etc.
Así que la próxima vez que leáis “Un estudio afirma que las personas que fuman ligan más“, no corráis a compraros un paquete de Ducados. Porque correlación no implica causalidad. Incluso podríamos describir un escenario en que comprarlo hiciera que ligáseis menos. Por ejemplo: imaginemos que el 85% de la población de nuestro escenario es fea, y fumar hace que se ligue más porque el humo tapa la cara y se logra eliminar esa primera impresión desfavorable. (Un ejemplo de variable C intermedia.) Pero nuestro lector de titulares de nuestro escenario hipotético casualmente no es nada feo, y cuando compre su paquete de Ducados y se ponga a fumar ocultará su atractivo rostro, lo que le proporcionará muchos menos ligues.
————————————–
Este artículo participa en los Premios Nikola Tesla de divulgación científica y nos lo envía “Antonio S.” Licenciado en Psicología



Relación espuria

Relación espuria

En estadística, una relación espuria (o, a veces, correlación espuria) es una relación matemática en la cual dos acontecimientos no tienen conexión lógica, aunque se puede implicar que la tienen debido a un tercer factor no considerado aún (llamado "factor de confusión" o "variable escondida"). La relación espuria da la impresión de la existencia de un vínculo apreciable entre dos grupos que es inválido cuando se examina objetivamente.

Ejemplo general[editar]

Un ejemplo de una relación espuria puede ser ilustrado examinando las ventas de helados de una ciudad. Éstas son más altas cuando la tasa de sofocamientos es mayor. Sostener que la venta de helados causa los sofocamientos sería implicar una relación espuria entre las dos. En realidad, una ola de calor puede haber causado ambas. La ola de calor es un ejemplo de variable escondida.

Estadística[editar]

El término se usa comúnmente en estadística y particularmente en técnicas de investigación experimental. La investigación experimental intenta comprender y predecir las relaciones causales (X → Y). Una correlación no-causal puede crearse de manera espuria por un antecedente que causa ambas (W → X & Y). Las variables que intervienen (X → W → Y), si no son detectadas, pueden hacer parecer que una causalidad indirecta es directa. Por esto, las correlaciones identificadas experimentalmente no representan relaciones causales a menos que las relaciones espurias sean descartadas.
En la práctica, se deben cumplir tres condiciones para poder concluir que X causa Y, directa o indirectamente:
  • X debe preceder a Y.
  • Si Y no ocurre entonces X no ocurre.
  • Y debe ocurrir cada vez que X ocurra.
Las relaciones espurias a menudo pueden ser identificadas considerando que cualquiera de estas condiciones ha sido violada.
La condición final puede relajarse en el caso de la causalidad indirecta. Por ejemplo, considérese un duelo de pistolas. Dos hombres se enfrentan y disparan uno al otro. Si un hombre muere como resultado del disparo del otro hombre, podremos concluir correctamente que el otro hombre causó la muerte del primero. Sin embargo, si un médico salva la vida del hombre herido (violando así la tercera premisa), esto no socava la causalidad, sólo la causalidad "directa". El daño biológico (W) provocado por el disparo (X) causa la muerte (Y), pero no el disparo en sí, permitiendo la intervención médica.

Véase también[editar]

Correlación no implica causalidad

Cerca de 189,000 resultados (0.33 segundos) 

Diferencia entre correlación y causalidad

Diferencia entre correlación y causalidad

En economía, es de gran importancia conocer qué es la correlación y qué es la causalidad. También la gran diferencia existente entre los mismos, dado que se trata de dos palabras del lenguaje estadístico que son muy utilizadas hoy en día en las noticias. El no conocimiento o confusión entre correlación y causalidad, puede dar lugar a un mal entendimiento de lo que nos están contando, e incluso los medios pueden utilizar éstos términos con intención de que nos confundamos. Recuerda esta frase que más adelante irá tomando sentido, correlación no implica causalidad.
Voy a introducir los términos, a explicarlos y diferenciarlos mediante dos ejemplos:
·        Causalidad: según la RAE significa: “Causa, origen, principio”. Es una palabra que se utiliza para establecer una relación entre una causa y un efecto, es decir, hace referencia a los motivos que originan “algo”.
  • Ejemplo: si tocas el fuego, te causa una quemadura.
  • Explicación: existe una relación de causalidad, dado que es una cosa que pasa inequívocamente y que está demostrada, tocar el fuego, siempre te quema.
·      Correlación: según la RAE significa: “Correspondencia o relación recíproca entre dos o más cosas o series de cosas.” En este caso la relación que se establece es de simple correspondencia o similitud, no de origen.
  • Ejemploexiste una correlación entre el número de iglesias en una ciudad y el número de alcohólicos en la misma.
  • Explicación: te habrá incluso chocado leer la frase anterior, ¡pues es cierta!, aunque no pienses mal, he dicho que hay correlación, pero en ningún momento he dicho que una cosa cause la otra, en este caso habría detrás una tercera variable no considerada en mi frase que está correlacionada con las dos y que sería la variable explicativa. Estoy hablando claro, de la cantidad de población que haya en esa ciudad, a más población más iglesias y a más población más alcohólicos.
Por lo tanto hemos visto que se mueven en la misma dirección y por ello existe una correlación entre las dos cosas, pero el que haya más iglesias no implica que haya más alcohólicos.
A través de éste último ejemplo hemos podido ver claramente la diferencia entre los dos términos y que correlación no implica causalidad.
También puede existir correlación por simple casualidad, por una coincidencia, como se puede observar en el gráfico de que se muestra, (compara las ventas en millones de dólares de comida orgánica, con la cantidad de personas con diagnóstico de autismo), las dos aumentan a la par,  luego existe una correlación, pero no existe ninguna causa que las una.
Espero que haya sido de ayuda, y recuerda, cuando escuches una noticia y te presenten cifras de dos cosas que aumentan a la par, que no te hagan creer que una cosa causa la otra, piensa siempre primero que se puede deber a algo que les afecte por igual, o a una simple coincidencia.