Calculadora BIC (Bayesian Information Criterion)
Usa esta herramienta para calcular el BIC de un modelo estadístico. Puedes hacerlo con log-verosimilitud o con RSS (residual sum of squares) para modelos lineales gaussianos.
¿Qué es el BIC y para qué sirve?
El BIC (Bayesian Information Criterion, también llamado criterio de información bayesiano de Schwarz) es una métrica para comparar modelos estadísticos. Su idea central es simple: premiar el buen ajuste, pero penalizar la complejidad.
Cuando ajustas varios modelos sobre los mismos datos, el BIC te ayuda a elegir uno que explique bien la información sin sobreajustar. En términos prácticos: cuanto más bajo el BIC, mejor (en comparación con otros modelos candidatos).
Fórmulas para calcular el BIC
1) Usando log-verosimilitud
BIC = k · ln(n) - 2 · ln(L)
- n: tamaño de muestra.
- k: número de parámetros del modelo.
- ln(L): log-verosimilitud del modelo.
2) Usando RSS (caso lineal gaussiano)
BIC = n · ln(RSS / n) + k · ln(n)
Esta versión es una reexpresión común cuando trabajas con regresión lineal y supuestos de error normales con varianza constante. Si no estás en ese contexto, usa la fórmula con log-verosimilitud.
Cómo interpretar el resultado
El BIC por sí solo no significa mucho fuera de contexto. Lo importante es compararlo entre modelos construidos con la misma variable objetivo y el mismo conjunto de datos.
- Modelo A tiene menor BIC que B: A es preferible bajo este criterio.
- Diferencia pequeña (ΔBIC < 2): evidencia débil.
- ΔBIC entre 2 y 6: evidencia positiva.
- ΔBIC entre 6 y 10: evidencia fuerte.
- ΔBIC > 10: evidencia muy fuerte a favor del modelo con BIC menor.
Ejemplo rápido
Supón que tienes dos modelos para predecir ventas:
- Modelo 1: BIC = 415.2
- Modelo 2: BIC = 408.7
La diferencia es 6.5 puntos, así que hay evidencia fuerte a favor del Modelo 2 (el de menor BIC).
Errores comunes al calcular el BIC
1) Comparar modelos con datos distintos
Si cambias la muestra entre modelos, la comparación pierde validez.
2) Contar mal el número de parámetros
Olvidar el intercepto o parámetros de dispersión puede alterar el resultado.
3) Usar RSS sin verificar supuestos
La fórmula con RSS no es universal. Cuando sea posible, usa log-verosimilitud directamente.
4) Elegir el modelo solo por BIC
El BIC es útil, pero no reemplaza diagnóstico, interpretabilidad, validación externa y criterio de negocio.
Buenas prácticas
- Evalúa también AIC, error de validación y estabilidad de coeficientes.
- Prefiere modelos más simples cuando el rendimiento sea similar.
- Documenta claramente n, k y la forma exacta de cálculo.
- No compares BIC entre familias de modelos que no sean realmente comparables.
Conclusión
Si necesitas calcular el BIC de manera rápida, la calculadora de esta página te permite hacerlo en segundos. Recuerda: el objetivo no es solo obtener un número, sino tomar mejores decisiones al seleccionar modelos.
En análisis estadístico y ciencia de datos, un buen modelo no es el más complicado: es el que generaliza bien y mantiene equilibrio entre ajuste y parsimonia.