Correlación espuria: La relación entre el queso y las sábanas mortales

Karl Pearson: profundizó en el concepto de correlación.

En los últimos días, se ha vuelto bastante común encontrarse con encabezados de noticias tan intrigantes como este: “¡Increíble descubrimiento! Estudio revela una sorprendente correlación entre el consumo de café y el rendimiento académico”.

Aunque para los amantes del café esto nos podría sonar como la mejor noticia del mundo (o no), sin duda surge una pregunta importante: ¿realmente implica que consumir más café resulte en mejores o peores calificaciones?

Aquí es donde nos encontramos con la famosa correlación espuria. Básicamente, la correlación espuria se refiere a una aparente relación entre dos variables que, en realidad, no tienen una conexión causal real.

A primera vista, parece haber una conexión significativa, pero en realidad, la asociación se debe a la influencia de una tercera variable no considerada.

¿Qué es una correlación?

Para entender un poquito mejor qué es la correlación espuria, primero tenemos que tener claro qué es una correlación. ¡No te preocupes, no nos meteremos en el mundo aburrido de las fórmulas complicadas!

La correlación es una medida estadística que nos dice cómo se relacionan dos variables. Nos ayuda a entender si existe alguna conexión o dependencia lineal entre ellas y a evaluar qué tan fuerte es esa relación y en qué dirección va.

Ahora, y no te me abrumes, hay un coeficiente de correlación llamado coeficiente de correlación de Pearson (nombrado así por los trabajos del hombrecito en la foto de arriba) o “r”.

Magnitudes de la Correlación de Pearson

Lo que hace este “r” es calcular la dependencia entre variables dividiendo una cosita llamada covarianza de las dos variables entre el producto de sus desviaciones estándar.

Ya, ya, calma. Ya superamos la parte más difícil, ahora sigamos con lo nuestro. 😉

¿Cómo puedo identificar una correlación espuria? 🤔

Ahora que ya sabemos qué es la correlación, o tenemos una idea, sigamos conversando sobre la correlación espuria.

Resulta que la causa de la correlación falsa entre dos variables suele ser una tercera variable que tiene influencia en las dos variables que estamos analizando.

¿Qué significa “espuria”?

“Espuria” es un adjetivo que se utiliza para describir algo falso, engañoso o aparente, que no es genuino o auténtico.

Volviendo a nuestro ejemplo del café y el rendimiento académico, una tercera variable posible podría ser el nivel de estrés o la carga académica.

Durante épocas de exámenes o cuando hay montañas de trabajos y proyectos, es normal que nosotros, los estudiantes, consumamos más café.

Así que, en este caso, el nivel de estrés o la carga académica sería la variable que influye tanto en cuánto café tomamos como en nuestro rendimiento académico.

La aparente correlación entre el café y el rendimiento académico sería espuria, porque el café no estaría directamente relacionado con nuestro desempeño académico si no fuera por el nivel de estrés o la carga académica.

Las sábanas tejen su tela mortal: el queso como el inesperado protagonista 🙀

Aquí va otro ejemplo de correlación espuria: ¡la relación entre el consumo de queso por persona y la cantidad de personas que mueren enredadas en sus sábanas! Sí, suena un poco tonto, pero hay quienes afirman que hay una relación causal entre estas dos variables. ¡Increíble, ¿no?!

Pero tú y yo, que ya somos”expertos” en esto de la correlación espuria, sabemos cómo manejar las cosas con más cautela.

Ya sabemos que, aunque al principio pueda parecer que hay una conexión entre el queso y las sábanas mortales (sigue sonando como una historia muy extraña, lo sé), la explicación más sensata nos lleva al tamaño de la población.

¿Qué tiene que ver el tamaño de la población en esto? Bueno, cuando hay más personas en un lugar, es más probable que ocurran una variedad de eventos extraños o inusuales.

Así que, no te preocupes, el queso no es el villano aquí. 😂

¡Cuidado con la causalidad!

Ojo, en este mundo loco de las correlaciones, hay que tener cuidado al establecer relaciones causales. A veces, las aparentes conexiones pueden ser solo coincidencias o resultado de otros factores que influyen en ambas variables.

Para conocer más sobre otros factores que influyen en la relación entre variables, puedes visitar mi más reciente artículo.

Así que, antes de saltar a conclusiones, siempre es mejor hacer un análisis más profundo y no dejarse llevar por las apariencias.

Recuerda…

La correlación espuria es una aparente relación entre dos variables que no tienen una conexión causal real. Esta relación se debe a una tercera variable no considerada que influye en ambas variables.

En el ejemplo del café y el rendimiento académico, vimos que el nivel de estrés o carga académica podría ser la tercera variable que influye tanto en el consumo de café como en el rendimiento académico.

Es importante entender que esta relación puede estar sujeta a otros factores no considerados.

Recuerda, la correlación no implica necesariamente causalidad, y es necesario analizar más a fondo para llegar a conclusiones más precisas.

¿Te identificas con la niña en la foto? Descuida, todos hemos estado ahí alguna vez. 😂

Si tienes dudas o comentarios, ¡te invito a tener una conversación!