calcular coeficiente de correlacion

Calculadora de Coeficiente de Correlación (Pearson)

Ingresa dos series de datos numéricos (X y Y) con la misma cantidad de valores para calcular r, la fuerza y dirección de la relación lineal.

Tip: Puedes usar números enteros o decimales. Ejemplo válido: 12.5, 10, 9.75, 14.

¿Qué es el coeficiente de correlación?

El coeficiente de correlación de Pearson, representado como r, mide qué tan fuerte y en qué dirección se relacionan dos variables cuantitativas. Su valor está entre -1 y 1:

  • r = 1: relación lineal positiva perfecta.
  • r = -1: relación lineal negativa perfecta.
  • r = 0: no hay relación lineal (aunque puede existir otra relación no lineal).

Este indicador se usa en estadística, finanzas, educación, salud, marketing y ciencia de datos para evaluar asociaciones entre variables, por ejemplo: horas de estudio y calificaciones, publicidad y ventas, o ejercicio y nivel de colesterol.

Fórmula de Pearson

La fórmula clásica es:

r = Σ[(xi - x̄)(yi - ȳ)] / √(Σ(xi - x̄)² · Σ(yi - ȳ)²)

Donde:

  • xi, yi: cada par de datos observados.
  • x̄, ȳ: medias de X y Y.
  • Σ: suma de todos los términos.

En palabras simples: compara cómo se mueven juntas ambas variables, ajustando por su variabilidad.

Cómo calcular el coeficiente de correlación paso a paso

1) Preparar los datos

Asegúrate de que ambas series tengan la misma cantidad de observaciones y que cada valor de X corresponda al mismo caso en Y.

2) Calcular medias

Obtén la media de X y la media de Y para usar como punto de referencia.

3) Medir desviaciones

Resta cada dato de su media para conocer cuánto se aleja del promedio.

4) Multiplicar desviaciones y sumar

Multiplica desviaciones de X e Y en cada fila y suma todo. Eso forma el numerador.

5) Normalizar por la variación total

Divide entre la raíz del producto de las sumas de cuadrados de cada variable. Así obtienes r en el rango [-1, 1].

Interpretación práctica de r

Valor absoluto de r Interpretación común
0.00 a 0.19Muy débil
0.20 a 0.39Débil
0.40 a 0.59Moderada
0.60 a 0.79Fuerte
0.80 a 1.00Muy fuerte

Además del valor de r, conviene observar (coeficiente de determinación), que indica el porcentaje de variación de Y explicado linealmente por X.

Errores frecuentes al calcular correlación

  • Confundir correlación con causalidad: que dos variables se muevan juntas no significa que una cause a la otra.
  • Ignorar valores atípicos: pocos outliers pueden inflar o hundir el valor de r.
  • Usar Pearson con relaciones no lineales: si la relación es curva, Spearman puede ser mejor opción.
  • No revisar contexto: una correlación “alta” puede no ser útil si no tiene sentido de negocio o científico.

¿Pearson o Spearman?

Usa Pearson cuando tus datos son numéricos y esperas una relación aproximadamente lineal. Usa Spearman cuando trabajas con rangos, datos ordinales o relaciones monotónicas no necesariamente lineales.

Recomendaciones finales

Para un análisis sólido, acompaña el coeficiente con un gráfico de dispersión, tamaño de muestra adecuado y prueba de significancia (p-valor). La calculadora de arriba es ideal para una evaluación rápida y confiable de la correlación lineal.

🔗 Related Calculators