Calculadora del coeficiente de correlación (Pearson)
Introduce dos series numéricas del mismo tamaño (separadas por comas, espacios o punto y coma).
¿Qué es el coeficiente de correlación?
El coeficiente de correlación mide la intensidad y la dirección de la relación lineal entre dos variables cuantitativas. Cuando hablamos de “cómo calcular el coeficiente de correlación”, normalmente nos referimos al coeficiente de Pearson (r).
Su valor siempre está entre -1 y +1:
- r = +1: relación lineal positiva perfecta.
- r = 0: no hay relación lineal (aunque podría existir relación no lineal).
- r = -1: relación lineal negativa perfecta.
Fórmula del coeficiente de correlación de Pearson
r = Σ[(xi - x̄)(yi - ȳ)] / √(Σ(xi - x̄)² · Σ(yi - ȳ)²)
Donde:
- xi, yi: cada observación de X y de Y.
- x̄, ȳ: medias de las series X y Y.
- El numerador representa la covarianza “no normalizada”.
- El denominador ajusta por la variabilidad de cada serie (desviaciones estándar).
Cómo calcularlo paso a paso
1) Organiza tus datos en pares
Cada valor de X debe corresponder exactamente a un valor de Y. Si tienes 10 datos en X, debes tener 10 datos en Y.
2) Calcula la media de cada variable
Suma todos los valores de X y divide entre n. Repite con Y.
3) Calcula las desviaciones respecto a la media
Resta la media a cada dato: (xi - x̄) y (yi - ȳ).
4) Multiplica desviaciones y súmalas
Multiplica cada par de desviaciones y suma los resultados: Σ[(xi - x̄)(yi - ȳ)].
5) Calcula las sumas de cuadrados
Obtén Σ(xi - x̄)² y Σ(yi - ȳ)².
6) Divide usando la fórmula
Aplica la fórmula completa para obtener r.
Interpretación práctica del resultado
Aunque no existe una escala universal rígida, esta guía suele ser útil:
- |r| < 0.10: correlación prácticamente nula.
- 0.10 ≤ |r| < 0.30: débil.
- 0.30 ≤ |r| < 0.50: moderada.
- 0.50 ≤ |r| < 0.70: considerable.
- 0.70 ≤ |r| < 0.90: fuerte.
- |r| ≥ 0.90: muy fuerte.
Si r es positivo, cuando X aumenta, Y tiende a aumentar. Si r es negativo, cuando X aumenta, Y tiende a disminuir.
Errores comunes al calcular correlación
- Confundir correlación con causalidad: que dos variables se muevan juntas no implica que una cause a la otra.
- Usar datos desalineados: pares mal emparejados distorsionan totalmente el resultado.
- No revisar outliers: un valor extremo puede alterar drásticamente r.
- Aplicar Pearson a relaciones no lineales: puedes obtener r cercano a 0 aunque exista una relación curvilínea clara.
Ejemplo rápido
Supón X = [1, 2, 3, 4, 5] y Y = [2, 4, 5, 4, 5]. La correlación es positiva y moderada-alta. Puedes usar la calculadora de arriba para verificar el valor exacto y ver también r², el coeficiente de determinación.
¿Qué es r² y para qué sirve?
El valor r² indica qué proporción de la variabilidad de Y puede explicarse linealmente por X. Por ejemplo, si r = 0.8, entonces r² = 0.64, lo que sugiere que aproximadamente el 64% de la variación de Y se asocia linealmente con X (en un sentido descriptivo).
Conclusión
Aprender cómo calcular el coeficiente de correlación te permite analizar datos con más criterio, detectar patrones y tomar mejores decisiones. Usa el cálculo manual para entender la lógica y una calculadora para agilizar el trabajo cuando tengas muchos datos. Siempre interpreta el resultado con contexto estadístico y de negocio.