Calculadora del coeficiente de correlación (Pearson)
Escribe dos listas de números con la misma cantidad de datos. Puedes separarlos con coma, espacio, punto y coma o salto de línea.
¿Qué es el coeficiente de correlación?
El coeficiente de correlación es una medida estadística que indica qué tan fuerte y en qué dirección se relacionan dos variables numéricas. Cuando se habla de “coeficiente de correlación” normalmente se refiere al coeficiente de Pearson, representado por la letra r.
- r = 1: relación lineal positiva perfecta.
- r = -1: relación lineal negativa perfecta.
- r = 0: no hay relación lineal aparente.
Es muy útil en análisis de datos, investigación, economía, educación, marketing y ciencias sociales para responder preguntas como: “¿a mayor horas de estudio, mejor calificación?” o “¿a mayor precio, menor demanda?”.
Fórmula del coeficiente de correlación de Pearson
r = [n·Σ(xy) − (Σx)(Σy)] / √{[n·Σ(x²) − (Σx)²][n·Σ(y²) − (Σy)²]}
Donde:
- n = número de pares de datos.
- x, y = valores de cada variable.
- Σ = sumatoria.
Esta expresión compara cómo varían juntas ambas variables en relación con su variación individual. Si ambas tienden a subir o bajar al mismo tiempo, r será positivo. Si una sube y la otra baja, r será negativo.
Cómo se calcula paso a paso
1) Organiza tus datos en pares
Cada observación debe tener dos valores: uno para X y otro para Y. Ambos vectores deben tener exactamente la misma longitud.
2) Calcula las columnas necesarias
Además de X y Y, debes obtener:
- X² (cada valor de X al cuadrado)
- Y² (cada valor de Y al cuadrado)
- XY (producto de cada par)
3) Suma cada columna
Necesitarás Σx, Σy, Σx², Σy² y Σxy.
4) Sustituye en la fórmula
Coloca esos valores en la fórmula de Pearson para calcular el numerador y el denominador.
5) Interpreta el resultado
El resultado siempre estará entre -1 y 1. Cuanto más cerca de los extremos, más fuerte es la relación lineal.
Ejemplo rápido
Supón los siguientes datos:
- X: 1, 2, 3, 4, 5
- Y: 2, 4, 5, 4, 5
Al aplicar la fórmula, obtendrás un valor de r positivo (aproximadamente 0.77), lo que indica una relación lineal positiva moderada/alta entre X e Y.
Cómo interpretar el valor de r
- 0.00 a 0.09: relación lineal prácticamente nula.
- 0.10 a 0.29: relación débil.
- 0.30 a 0.49: relación moderada.
- 0.50 a 0.69: relación notable.
- 0.70 a 0.89: relación fuerte.
- 0.90 a 1.00: relación muy fuerte.
Estas categorías son orientativas. En algunos campos, una correlación de 0.30 puede ser relevante; en otros, se espera más.
Errores comunes al calcular la correlación
- Confundir correlación con causalidad: que dos variables se muevan juntas no implica que una cause la otra.
- Usar datos desalineados: cada X debe corresponder al Y del mismo caso.
- No revisar valores atípicos: unos pocos datos extremos pueden distorsionar el resultado.
- Aplicar Pearson a relaciones no lineales: Pearson mide relación lineal, no cualquier patrón.
- Comparar escalas sin contexto: conviene visualizar los datos antes con un gráfico de dispersión.
¿Cuándo usar Spearman en lugar de Pearson?
Si tus datos no cumplen bien la linealidad, tienen muchos valores extremos o están en escala ordinal (rangos), suele ser mejor usar Spearman (rho) en lugar de Pearson. Spearman mide relación monotónica y es más robusto ante ciertas violaciones de supuestos.
Cómo usar la calculadora de arriba
- Ingresa la Serie X y la Serie Y.
- Haz clic en Calcular correlación.
- Revisa el valor de r, el R² y la interpretación automática.
- Si quieres practicar, pulsa Cargar ejemplo.
La herramienta también muestra sumatorias y valores intermedios para que puedas comprobar el cálculo manual.
Conclusión
Calcular el coeficiente de correlación es una habilidad básica y muy poderosa en análisis estadístico. Saber cómo se calcula el coeficiente de correlación te permite describir relaciones entre variables con precisión y tomar decisiones basadas en datos. Usa la fórmula, valida tus datos y complementa siempre con interpretación estadística y contexto real.