Calculadora de Covarianza
Introduce dos series de datos del mismo tamaño (separadas por comas, espacios o punto y coma) para calcular la covarianza poblacional o muestral.
¿Qué es la covarianza?
La covarianza es una medida estadística que indica cómo varían dos variables de forma conjunta. En otras palabras, te ayuda a entender si cuando una variable sube, la otra también tiende a subir, a bajar, o no tiene un patrón claro.
- Covarianza positiva: ambas variables tienden a moverse en la misma dirección.
- Covarianza negativa: cuando una sube, la otra tiende a bajar.
- Covarianza cercana a 0: no hay relación lineal clara en sus movimientos.
Fórmula: cómo se calcula la covarianza
Covarianza poblacional
Si tienes todos los datos de la población:
Cov(X,Y) = [Σ (xi - μx)(yi - μy)] / n
Covarianza muestral
Si trabajas con una muestra (lo más común en análisis real):
sxy = [Σ (xi - x̄)(yi - ȳ)] / (n - 1)
Pasos para calcularla manualmente
- Calcula la media de X y la media de Y.
- Resta la media a cada valor para obtener desviaciones: (xi - x̄) y (yi - ȳ).
- Multiplica las desviaciones en pares: (xi - x̄)(yi - ȳ).
- Suma todos esos productos.
- Divide entre n (poblacional) o n - 1 (muestral).
Ejemplo rápido
Supón estas dos series:
- X = [2, 4, 6, 8]
- Y = [1, 3, 5, 7]
Ambas crecen de manera bastante alineada. El resultado de la covarianza será positivo, indicando una relación lineal directa.
Interpretación correcta de la covarianza
La covarianza sirve para identificar la dirección de la relación, pero no es ideal para comparar la fuerza entre datasets con escalas distintas. Para eso suele usarse la correlación, que está normalizada entre -1 y 1.
Covarianza vs. correlación
- Covarianza: depende de las unidades de medida.
- Correlación: sin unidades, más fácil de comparar.
Errores comunes al calcular covarianza
- Usar series con diferente cantidad de datos.
- Confundir fórmula muestral con poblacional.
- Interpretar una covarianza grande como “relación fuerte” sin revisar la escala.
- No detectar valores atípicos que pueden distorsionar el resultado.
¿Dónde se usa la covarianza?
La covarianza se utiliza ampliamente en estadística, ciencia de datos y finanzas. Por ejemplo:
- En portafolios de inversión para estudiar cómo se mueven dos activos.
- En machine learning para analizar relaciones entre variables.
- En control de calidad y análisis experimental.
Conclusión
Si te preguntas cómo se calcula la covarianza, el proceso es directo: medias, desviaciones, productos cruzados y división final por n o n - 1. Usa la calculadora de arriba para practicar con tus propios datos y entender mejor la relación entre variables.