Cargando...
Inicio/Elecciones/Metodología
Documentación Técnica

Metodología de Predicción

Aplicamos Multilevel Regression with Poststratification (MRP) con inferencia Bayesiana para proyectar la intención de voto a partir de las transiciones electorales 2022 → 2026, ajustadas por demografía y geografía.

Modelo: MRP BayesianoIntervalos de Credibilidad 95%

¿Cómo transformamos registros en predicciones?

No hacemos conteos simples. Nuestro motor estadístico analiza cómo se desplaza el electorado de 2022 hacia las nuevas opciones de 2026. Construimos matrices de transición por celda demográfica (departamento × grupo de edad × género × estrato), las ponderamos con datos del censo poblacional, y las proyectamos sobre los resultados oficiales de la Registraduría 2022 para obtener estimaciones representativas del electorado nacional.

01

Fuentes de Datos

El sistema integra tres fuentes de datos complementarias:

FuenteOrigenDescripción
Encuesta de Intención de VotoSupabaseRegistros de usuarios con preferencia 2026, voto 2022, departamento, municipio, grupo de edad, género y estrato.
Resultados Oficiales 2022CSV OficialVotación real de primera vuelta 2022 a nivel departamental (33 dptos) y municipal (1.130 municipios). Fuente: Registraduría Nacional.
Censo PoblacionalDANEDatos demográficos por celda (departamento, edad, género, estrato) para post-estratificación.
02

El Modelo MRP Bayesiano

El Multilevel Regression with Poststratification (MRP) es el método principal. Combina inferencia Bayesiana con post-estratificación demográfica para producir estimaciones a nivel departamental y nacional con intervalos de credibilidad al 95%.

01

Matriz de Transición

Para cada celda demográfica (departamento × edad × género × estrato), construimos una matriz que mide: si un ciudadano votó por el Candidato X en 2022, ¿cuál es la probabilidad de que elija al Candidato Y en 2026?

02

Inferencia Bayesiana con Partial Pooling

Aplicamos distribuciones Dirichlet como prior sobre cada fila de transición. Cuando una celda tiene pocos datos, el modelo combina la evidencia local con la tendencia nacional (partial pooling). Se realizan 3.000 simulaciones Monte Carlo.

03

Anclaje a Resultados Oficiales 2022

Las probabilidades de transición se multiplican por la distribución real de votos 2022 de la Registraduría en cada departamento. Esto ancla la proyección a datos verificables.

04

Post-estratificación con Censo

Los resultados a nivel de celda se ponderan por la población real según el censo. Esto corrige los sesgos de autoselección: si los jóvenes están sobre-representados, se les reduce el peso.

ParámetroValor
Simulaciones Monte Carlo3.000 draws
Fuerza de Pooling (k)40.0
Prior Dirichlet (α₀)0.1 (no informativo)
Intervalo de Credibilidad95% (2.5% – 97.5%)
03

Seis Métodos de Cálculo

01

Distribución Simple

Conteo ponderado por peso demográfico, sin ajuste geográfico.

02

Ponderación Geográfica

Peso final = peso demográfico × población de la celda censal. Bootstrap con 800 re-muestreos.

03

MRP Bayesiano

Modelo principal: transiciones Dirichlet + pooling + post-estratificación censal. 3.000 simulaciones.

04

Flujo de Votos

Matrices de transición 2022 → 2026: cuántos votantes de cada candidato migran a otro.

05

Segmentos por Edad

Predicciones desglosadas por grupo etario (18-25, 26-35, 36-50, 51-65, 65+).

06

Segmentos por Estrato

Predicciones desglosadas por nivel socioeconómico (estratos 1 a 6).

04

Integridad de Datos y Detección de Fraude

Cada registro pasa por un sistema de detección de participación fraudulenta. Los registros sospechosos no se bloquean, sino que se reducen en peso dentro del modelo para minimizar su impacto en las predicciones.

  • IP Duplicada: Se detectan múltiples usuarios desde la misma IP.
  • Discrepancia Geográfica: Se compara la geolocalización de la IP con el departamento declarado.
  • IP Extranjera: Si la IP no proviene de Colombia, se eleva el nivel de riesgo.
  • Ataque Coordinado: Si desde una IP el 95%+ elige al mismo candidato, se marca como manipulación.
  • Cambio Ideológico Extremo: Transiciones históricamente implausibles (ej: extrema izquierda a extrema derecha).

Niveles de riesgo: Bajo (peso normal), Medio (peso reducido al 50%), Alto (excluido del modelo), Bloqueado (excluido del modelo). Los registros sin ninguna alerta mantienen su peso completo (1.0).

05

Recálculo Automático

Las predicciones se recalculan cuando:

  • Se registran nuevos votos en la plataforma.
  • La caché tiene más de 60 minutos.
  • Un administrador lo solicita manualmente.

El sistema detecta cambios comparando un fingerprint (hash) de los datos recientes. Si no hay cambios, no se recalcula innecesariamente.