Correlación vs Causalidad
cuando dos variables suben juntas no significa que una cause a la otra
¿Alguna vez has visto dos datos que suben y bajan al mismo ritmo y has pensado: “¡Claro, A provoca B!”? Pues cuidado, a veces eso es tan engañoso como creer que los vampiros existen porque la luna llena coincide con brotes de violencia en las películas de terror.
¿Qué es correlación y qué es causalidad?
Correlación: es simplemente una relación estadística entre dos variables. Cuando una cambia, la otra tiende a cambiar de forma predecible… ¡pero ojo! No sabemos por qué.
Causalidad: implica que el cambio en A provoca directamente el cambio en B. Aquí sí hay una conexión de causa y efecto.
Regla de oro: “Correlación no implica causalidad.” Solo porque dos líneas en un gráfico vayan parecidas, no podemos asumir que una empuje a la otra.
Por 5$ puedes comprarte un donut en el aeropuerto, dos cafés aguados en una máquina de hospital, un imán de nevera con forma de flamenco… o apoyar este proyecto y sentirte como Warren Buffett pero con menos traje y más sentido común.
Ejemplo veraniego: helados y ahogamientos
Situación real (y un poco macabra):
En los meses de calor, las ventas de helados se disparan… y, al mismo tiempo, aumentan los incidentes de ahogamiento en piscinas. Si miras un gráfico, verías dos curvas casi gemelas: helados arriba, ahogamientos arriba; helados abajo, ahogamientos abajo.
¿Significa esto que comer helado hace que la gente se ahogue?
No.¿O que los ahogamientos disparan las ventas de helados?
Tampoco.
Lo que realmente está pasando es que el calor (variable oculta) empuja a la gente a refrescarse de dos maneras:
Nadar → más riesgo de ahogamientos.
Comprar helados → ¡felicidad temporal (y golpes de glucosa)!
👉 Por tanto, la temperatura alta es la causa común que explica ambas subidas.
¿Por qué importa distinguirlas?
Decisiones acertadas: si crees que helados causan ahogamientos, podrías prohibir su venta en verano… pero eso no bajaría los incidentes en la piscina.Para reducir ahogamientos, la solución está en mejorar la vigilancia, enseñar técnicas de natación y señalizar las zonas peligrosas.
Investigación rigurosa: en ciencia y negocios hace falta controlar las “variables ocultas” (confundidores) mediante experimentos, estudios controlados o modelos estadísticos que descarten coincidencias.
Evitar falacias y bulos: en redes sociales abundan los “datos aislados” para apoyar teorías descabelladas. Aprender esta diferencia te convierte en un consumidor de información más crítico.
¿Cómo demostrar causalidad?
Experimentos controlados: por ejemplo, asignar al azar a unas personas un tratamiento y a otras no, para ver si el tratamiento causa un cambio.
Modelos estadísticos avanzados: uso de regresiones con variables de control, análisis de series temporales, métodos de variables instrumentales…
Lógica y sentido común: antes de asignar causalidad, pregúntate si hay un mecanismo plausible que una las dos variables.
En resumen:
Correlación es encontrar patrones juntos. Causalidad es demostrar que uno genera el otro. Sin experimento ni modelo robusto, mejor desconfiar de las curvas gemelas en tu gráfico.
🎙️ Y si quieres seguir el proceso sin filtros, cada semana en el podcast “Cuaderno de Bitácora” te cuento cómo voy creando un producto digital con IA: éxitos y fracasos (sobre todo fracasos).
Así es. Un secreto “behind the scenes”: un buen diseño experimental que controle confusores, es mucho más caro que hallar una correlación y justificarla con otros argumentos. Y si p<0.05, todo el mundo contento… 🙃