Calculadora de Coeficiente de Correlación (Pearson)
Ingresa dos series de datos numéricos (X y Y) con la misma cantidad de valores para calcular r, la fuerza y dirección de la relación lineal.
¿Qué es el coeficiente de correlación?
El coeficiente de correlación de Pearson, representado como r, mide qué tan fuerte y en qué dirección se relacionan dos variables cuantitativas. Su valor está entre -1 y 1:
- r = 1: relación lineal positiva perfecta.
- r = -1: relación lineal negativa perfecta.
- r = 0: no hay relación lineal (aunque puede existir otra relación no lineal).
Este indicador se usa en estadística, finanzas, educación, salud, marketing y ciencia de datos para evaluar asociaciones entre variables, por ejemplo: horas de estudio y calificaciones, publicidad y ventas, o ejercicio y nivel de colesterol.
Fórmula de Pearson
La fórmula clásica es:
r = Σ[(xi - x̄)(yi - ȳ)] / √(Σ(xi - x̄)² · Σ(yi - ȳ)²)
Donde:
- xi, yi: cada par de datos observados.
- x̄, ȳ: medias de X y Y.
- Σ: suma de todos los términos.
En palabras simples: compara cómo se mueven juntas ambas variables, ajustando por su variabilidad.
Cómo calcular el coeficiente de correlación paso a paso
1) Preparar los datos
Asegúrate de que ambas series tengan la misma cantidad de observaciones y que cada valor de X corresponda al mismo caso en Y.
2) Calcular medias
Obtén la media de X y la media de Y para usar como punto de referencia.
3) Medir desviaciones
Resta cada dato de su media para conocer cuánto se aleja del promedio.
4) Multiplicar desviaciones y sumar
Multiplica desviaciones de X e Y en cada fila y suma todo. Eso forma el numerador.
5) Normalizar por la variación total
Divide entre la raíz del producto de las sumas de cuadrados de cada variable. Así obtienes r en el rango [-1, 1].
Interpretación práctica de r
| Valor absoluto de r | Interpretación común |
|---|---|
| 0.00 a 0.19 | Muy débil |
| 0.20 a 0.39 | Débil |
| 0.40 a 0.59 | Moderada |
| 0.60 a 0.79 | Fuerte |
| 0.80 a 1.00 | Muy fuerte |
Además del valor de r, conviene observar r² (coeficiente de determinación), que indica el porcentaje de variación de Y explicado linealmente por X.
Errores frecuentes al calcular correlación
- Confundir correlación con causalidad: que dos variables se muevan juntas no significa que una cause a la otra.
- Ignorar valores atípicos: pocos outliers pueden inflar o hundir el valor de r.
- Usar Pearson con relaciones no lineales: si la relación es curva, Spearman puede ser mejor opción.
- No revisar contexto: una correlación “alta” puede no ser útil si no tiene sentido de negocio o científico.
¿Pearson o Spearman?
Usa Pearson cuando tus datos son numéricos y esperas una relación aproximadamente lineal. Usa Spearman cuando trabajas con rangos, datos ordinales o relaciones monotónicas no necesariamente lineales.
Recomendaciones finales
Para un análisis sólido, acompaña el coeficiente con un gráfico de dispersión, tamaño de muestra adecuado y prueba de significancia (p-valor). La calculadora de arriba es ideal para una evaluación rápida y confiable de la correlación lineal.