Metodología de Predicción
Aplicamos Multilevel Regression with Poststratification (MRP) con inferencia Bayesiana para proyectar la intención de voto a partir de las transiciones electorales 2022 → 2026, ajustadas por demografía y geografía.
¿Cómo transformamos registros en predicciones?
No hacemos conteos simples. Nuestro motor estadístico analiza cómo se desplaza el electorado de 2022 hacia las nuevas opciones de 2026. Construimos matrices de transición por celda demográfica (departamento × grupo de edad × género × estrato), las ponderamos con datos del censo poblacional, y las proyectamos sobre los resultados oficiales de la Registraduría 2022 para obtener estimaciones representativas del electorado nacional.
Fuentes de Datos
El sistema integra tres fuentes de datos complementarias:
| Fuente | Origen | Descripción |
|---|---|---|
| Encuesta de Intención de Voto | Supabase | Registros de usuarios con preferencia 2026, voto 2022, departamento, municipio, grupo de edad, género y estrato. |
| Resultados Oficiales 2022 | CSV Oficial | Votación real de primera vuelta 2022 a nivel departamental (33 dptos) y municipal (1.130 municipios). Fuente: Registraduría Nacional. |
| Censo Poblacional | DANE | Datos demográficos por celda (departamento, edad, género, estrato) para post-estratificación. |
El Modelo MRP Bayesiano
El Multilevel Regression with Poststratification (MRP) es el método principal. Combina inferencia Bayesiana con post-estratificación demográfica para producir estimaciones a nivel departamental y nacional con intervalos de credibilidad al 95%.
Matriz de Transición
Para cada celda demográfica (departamento × edad × género × estrato), construimos una matriz que mide: si un ciudadano votó por el Candidato X en 2022, ¿cuál es la probabilidad de que elija al Candidato Y en 2026?
Inferencia Bayesiana con Partial Pooling
Aplicamos distribuciones Dirichlet como prior sobre cada fila de transición. Cuando una celda tiene pocos datos, el modelo combina la evidencia local con la tendencia nacional (partial pooling). Se realizan 3.000 simulaciones Monte Carlo.
Anclaje a Resultados Oficiales 2022
Las probabilidades de transición se multiplican por la distribución real de votos 2022 de la Registraduría en cada departamento. Esto ancla la proyección a datos verificables.
Post-estratificación con Censo
Los resultados a nivel de celda se ponderan por la población real según el censo. Esto corrige los sesgos de autoselección: si los jóvenes están sobre-representados, se les reduce el peso.
| Parámetro | Valor |
|---|---|
| Simulaciones Monte Carlo | 3.000 draws |
| Fuerza de Pooling (k) | 40.0 |
| Prior Dirichlet (α₀) | 0.1 (no informativo) |
| Intervalo de Credibilidad | 95% (2.5% – 97.5%) |
Seis Métodos de Cálculo
Distribución Simple
Conteo ponderado por peso demográfico, sin ajuste geográfico.
Ponderación Geográfica
Peso final = peso demográfico × población de la celda censal. Bootstrap con 800 re-muestreos.
MRP Bayesiano
Modelo principal: transiciones Dirichlet + pooling + post-estratificación censal. 3.000 simulaciones.
Flujo de Votos
Matrices de transición 2022 → 2026: cuántos votantes de cada candidato migran a otro.
Segmentos por Edad
Predicciones desglosadas por grupo etario (18-25, 26-35, 36-50, 51-65, 65+).
Segmentos por Estrato
Predicciones desglosadas por nivel socioeconómico (estratos 1 a 6).
Integridad de Datos y Detección de Fraude
Cada registro pasa por un sistema de detección de participación fraudulenta. Los registros sospechosos no se bloquean, sino que se reducen en peso dentro del modelo para minimizar su impacto en las predicciones.
- IP Duplicada: Se detectan múltiples usuarios desde la misma IP.
- Discrepancia Geográfica: Se compara la geolocalización de la IP con el departamento declarado.
- IP Extranjera: Si la IP no proviene de Colombia, se eleva el nivel de riesgo.
- Ataque Coordinado: Si desde una IP el 95%+ elige al mismo candidato, se marca como manipulación.
- Cambio Ideológico Extremo: Transiciones históricamente implausibles (ej: extrema izquierda a extrema derecha).
Niveles de riesgo: Bajo (peso normal), Medio (peso reducido al 50%), Alto (excluido del modelo), Bloqueado (excluido del modelo). Los registros sin ninguna alerta mantienen su peso completo (1.0).
Recálculo Automático
Las predicciones se recalculan cuando:
- Se registran nuevos votos en la plataforma.
- La caché tiene más de 60 minutos.
- Un administrador lo solicita manualmente.
El sistema detecta cambios comparando un fingerprint (hash) de los datos recientes. Si no hay cambios, no se recalcula innecesariamente.
Explora los análisis