como se calcula el coeficiente de correlacion

Calculadora del coeficiente de correlación (Pearson)

Escribe dos listas de números con la misma cantidad de datos. Puedes separarlos con coma, espacio, punto y coma o salto de línea.

¿Qué es el coeficiente de correlación?

El coeficiente de correlación es una medida estadística que indica qué tan fuerte y en qué dirección se relacionan dos variables numéricas. Cuando se habla de “coeficiente de correlación” normalmente se refiere al coeficiente de Pearson, representado por la letra r.

  • r = 1: relación lineal positiva perfecta.
  • r = -1: relación lineal negativa perfecta.
  • r = 0: no hay relación lineal aparente.

Es muy útil en análisis de datos, investigación, economía, educación, marketing y ciencias sociales para responder preguntas como: “¿a mayor horas de estudio, mejor calificación?” o “¿a mayor precio, menor demanda?”.

Fórmula del coeficiente de correlación de Pearson

r = [n·Σ(xy) − (Σx)(Σy)] / √{[n·Σ(x²) − (Σx)²][n·Σ(y²) − (Σy)²]}

Donde:

  • n = número de pares de datos.
  • x, y = valores de cada variable.
  • Σ = sumatoria.

Esta expresión compara cómo varían juntas ambas variables en relación con su variación individual. Si ambas tienden a subir o bajar al mismo tiempo, r será positivo. Si una sube y la otra baja, r será negativo.

Cómo se calcula paso a paso

1) Organiza tus datos en pares

Cada observación debe tener dos valores: uno para X y otro para Y. Ambos vectores deben tener exactamente la misma longitud.

2) Calcula las columnas necesarias

Además de X y Y, debes obtener:

  • X² (cada valor de X al cuadrado)
  • Y² (cada valor de Y al cuadrado)
  • XY (producto de cada par)

3) Suma cada columna

Necesitarás Σx, Σy, Σx², Σy² y Σxy.

4) Sustituye en la fórmula

Coloca esos valores en la fórmula de Pearson para calcular el numerador y el denominador.

5) Interpreta el resultado

El resultado siempre estará entre -1 y 1. Cuanto más cerca de los extremos, más fuerte es la relación lineal.

Ejemplo rápido

Supón los siguientes datos:

  • X: 1, 2, 3, 4, 5
  • Y: 2, 4, 5, 4, 5

Al aplicar la fórmula, obtendrás un valor de r positivo (aproximadamente 0.77), lo que indica una relación lineal positiva moderada/alta entre X e Y.

Cómo interpretar el valor de r

  • 0.00 a 0.09: relación lineal prácticamente nula.
  • 0.10 a 0.29: relación débil.
  • 0.30 a 0.49: relación moderada.
  • 0.50 a 0.69: relación notable.
  • 0.70 a 0.89: relación fuerte.
  • 0.90 a 1.00: relación muy fuerte.

Estas categorías son orientativas. En algunos campos, una correlación de 0.30 puede ser relevante; en otros, se espera más.

Errores comunes al calcular la correlación

  • Confundir correlación con causalidad: que dos variables se muevan juntas no implica que una cause la otra.
  • Usar datos desalineados: cada X debe corresponder al Y del mismo caso.
  • No revisar valores atípicos: unos pocos datos extremos pueden distorsionar el resultado.
  • Aplicar Pearson a relaciones no lineales: Pearson mide relación lineal, no cualquier patrón.
  • Comparar escalas sin contexto: conviene visualizar los datos antes con un gráfico de dispersión.

¿Cuándo usar Spearman en lugar de Pearson?

Si tus datos no cumplen bien la linealidad, tienen muchos valores extremos o están en escala ordinal (rangos), suele ser mejor usar Spearman (rho) en lugar de Pearson. Spearman mide relación monotónica y es más robusto ante ciertas violaciones de supuestos.

Cómo usar la calculadora de arriba

  • Ingresa la Serie X y la Serie Y.
  • Haz clic en Calcular correlación.
  • Revisa el valor de r, el y la interpretación automática.
  • Si quieres practicar, pulsa Cargar ejemplo.

La herramienta también muestra sumatorias y valores intermedios para que puedas comprobar el cálculo manual.

Conclusión

Calcular el coeficiente de correlación es una habilidad básica y muy poderosa en análisis estadístico. Saber cómo se calcula el coeficiente de correlación te permite describir relaciones entre variables con precisión y tomar decisiones basadas en datos. Usa la fórmula, valida tus datos y complementa siempre con interpretación estadística y contexto real.

🔗 Related Calculators