Cómo funciona nuestro modelo de IA
Un modelo de machine learning más dos modelos estadísticos, combinados en una única puntuación de confianza de conjunto — entrenado con más de 28.000 partidos y evaluado por su calibración, no solo por la precisión de titular.
Cada pronóstico de Daily Sport Pick lo genera un sistema automatizado que ejecuta varios modelos de predicción independientes sobre cada partido del día. Los modelos trabajan por separado y luego sus salidas se combinan en una única puntuación de confianza de conjunto entre 0 y 100%.
Esto reduce el riesgo de que los puntos ciegos de un solo modelo determinen la decisión final. Cuando los modelos coinciden, la puntuación es más alta. Cuando discrepan, la puntuación es más baja — y somos más cautelosos a la hora de publicar ese pronóstico.
| De un vistazo | |
|---|---|
| Modelos combinados | Machine learning + Poisson + Dixon-Coles |
| Datos de entrenamiento | Más de 28.000 partidos históricos (2024 → hoy) |
| Precisión de prueba del ML (1X2) | ~45% en un conjunto de prueba estrictamente cronológico (referencia 33%) |
| Características por predicción | 30 (forma, goles, ELO, fuerza de la liga) |
| Ligas principales publicadas | 14 (nuestras competiciones con mejor cobertura) |
| Actualización | Los modelos se ejecutan cada mañana |
El fútbol es difícil de predecir, y un mercado de tres vías (local/empate/visitante) da un 33% de referencia solo por adivinar. Algunos sitios citan precisiones por encima del 60% usando una división de entrenamiento/prueba aleatoria — pero eso filtra partidos futuros al conjunto de prueba y adorna el número. Nosotros usamos una división cronológica (aprender del pasado, probar con los partidos más recientes), que da alrededor del 45%. Preferimos mostrarte una cifra real, y evaluamos el modelo por algo más útil que la precisión bruta: la calibración — si un “60% de probabilidad” declarado realmente gana alrededor del 60% de las veces.
Modelo 1 — Machine learning (peso del 60%)
Nuestro modelo principal es un clasificador de árboles de decisión potenciados por gradiente entrenado con más de 28.000 partidos históricos. En realidad funciona en dos niveles: un modelo más reciente de histogram gradient boosting (v4) gestiona nuestras competiciones principales, donde la calidad de los datos es mayor, y un modelo más antiguo de gradient boosting (v3) actúa como respaldo para las ligas con menor cobertura.
Precisión: ~45% al predecir el resultado 1X2 correcto en un conjunto de prueba cronológico reservado de ~4.300 partidos recientes — muy por encima de la referencia del 33% a tres vías. La precisión varía según la competición: es más fuerte en ligas como la Serie A y la Eredivisie (por encima del 50%) y menor en las menos predecibles.
El modelo usa 30 características por predicción, entre ellas:
- Valoraciones ELO — una valoración global más valoraciones separadas de local y visitante por equipo. La separación local/visitante es una de las señales más potentes del modelo.
- Forma reciente — victorias, empates, derrotas y una puntuación de forma de los últimos 5 partidos de ambos equipos
- Promedios de goles — goles marcados y encajados por partido en los partidos recientes
- Fuerza de la liga — el nivel y la competitividad de la competición
El modelo genera una probabilidad para cada uno de los tres resultados — victoria local, empate o victoria visitante — y el más probable se convierte en la predicción. Fundamentalmente, cada característica se calcula en el momento: solo se usa información disponible antes del saque inicial, por lo que el modelo nunca se entrena con información a posteriori.
Modelo 2 — Distribución de Poisson (peso del 20%)
El modelo de Poisson adopta un enfoque puramente matemático. En lugar de aprender de resultados etiquetados, estima cuántos goles es probable que marque cada equipo y luego usa la distribución de Poisson para construir una matriz completa de marcadores.
Para cada marcador (p. ej. 1-0, 2-1, 0-0) calcula una probabilidad exacta. A partir de esta matriz derivamos:
- Probabilidades 1X2 (victoria local / empate / victoria visitante)
- Probabilidades de Más/Menos goles
- Los marcadores exactos más probables
Calcula valoraciones de ataque y defensa por equipo y por competición, corregidas por la ventaja local y normalizadas a la media de la liga. Un ataque fuerte frente a una defensa débil produce mayores goles esperados.
Modelo 3 — Dixon-Coles MLE (peso del 20%)
El modelo de Dixon-Coles (Dixon & Coles, 1997) amplía Poisson para corregir una debilidad conocida: el Poisson estándar subestima los resultados de pocos goles como 0-0, 1-0, 0-1 y 1-1.
Dixon-Coles añade un factor de corrección llamado tau (τ) para esos cuatro marcadores. También ajusta conjuntamente los parámetros de ataque, defensa y ventaja local mediante Estimación de Máxima Verosimilitud (MLE) con el optimizador L-BFGS-B de scipy, en lugar de tratarlos como simples promedios. Además está ponderado en el tiempo, por lo que los partidos recientes cuentan más que los antiguos y el modelo se adapta más rápido a la forma de mitad de temporada.
Dixon-Coles se ajusta por separado para cada competición, en cientos de ligas — mucho más allá del puñado sobre el que publicamos pronósticos activamente.
El conjunto: combinar los modelos
Después de que cada modelo predice un partido, la capa de conjunto los combina con pesos fijos:
| Enfoque | Peso | Optimizado para |
|---|---|---|
| Machine learning (v4 + respaldo v3) | 60% | Resultado general del partido (1X2) |
| Distribución de Poisson | 20% | Mercados de Más/Menos y goles |
| Dixon-Coles MLE | 20% | Marcadores y corrección de pocos goles |
Si un modelo no está disponible para una competición concreta, los pesos se renormalizan entre los modelos que sí lo están — así, un partido de categoría inferior podría puntuarse solo con Poisson y Dixon-Coles.
La puntuación de confianza se construye entonces a partir de cuatro componentes:
| Componente | Rango | Qué premia |
|---|---|---|
| Puntuación base | 0–75 | La probabilidad ponderada del resultado predicho, escalada desde la referencia aleatoria del 33% |
| Bonificación por consenso | 0–15 | +15 si los tres modelos coinciden, +7 si coinciden dos |
| Bonificación por margen | 0–10 | Cuán claramente el resultado principal destaca sobre las alternativas |
| Bonificación por consenso de goles | 0–15 | Se añade cuando los modelos coinciden con fuerza en el Más/Menos |
Los cuatro componentes se suman y se limitan a 100. Una puntuación alta significa fuerte acuerdo y un resultado principal claro — pero aplicamos deliberadamente un límite de sobreconfianza para que el sistema nunca exagere lo seguro que realmente está.
Cómo elegimos qué pronósticos publicar
Generar una predicción es solo la mitad del trabajo. Un modelo puede estar seguro y aun así equivocarse, por lo que varios filtros se sitúan entre la predicción en bruto y un pronóstico publicado:
- Publicación selectiva. Publicamos pronósticos sobre un conjunto principal de competiciones donde nuestra cobertura y la calidad del modelo son más fuertes — en lugar de esparcir selecciones por cada liga que técnicamente podemos puntuar.
- Mínimos de confianza y un límite de sobreconfianza. Los pronósticos por debajo de una confianza mínima se retienen, y las puntuaciones inusualmente altas se limitan, porque la sobreconfianza es donde los modelos de pronóstico pierden dinero.
- Líneas de Hándicap Asiático conscientes del mercado. Para los pronósticos de hándicap no adivinamos una línea — calculamos, a partir de la matriz de marcadores de Poisson, la línea donde el lado elegido tiene aproximadamente un 50% de probabilidad de cubrir (la “línea equilibrada” que usan casas como Pinnacle). Esto sustituyó una antigua regla general que era sistemáticamente sobreconfiada.
- Comprobaciones de seguridad entre divisiones. Los partidos de copa y de play-off pueden enfrentar a equipos de distintas divisiones. Detectamos esos casos y los descartamos, para que un equipo de segunda no se valore por error como si jugara en la máxima categoría.
Calibración: la métrica que importa
La precisión te dice con qué frecuencia ocurre el resultado más probable. La calibración te dice si las propias probabilidades son fiables — y para apostar, eso es lo que cuenta. Si etiquetamos un lote de pronósticos como “70% probable”, aproximadamente el 70% deberían ganar. Lo seguimos de forma continua y lo mostramos en cada pronóstico como una etiqueta de Confianza de IA (Alta / Media / Baja).
Ve el modelo en acción
Consulta los pronósticos de hoy y sus puntuaciones de confianza
Preguntas frecuentes
¿Qué modelos de predicción usa Daily Sport Pick?
Combinamos tres enfoques de modelado en un único conjunto: un modelo de machine learning (árboles de decisión potenciados por gradiente) entrenado con más de 28.000 partidos históricos, un modelo de goles de Poisson y un modelo de Dixon-Coles que corrige los resultados de pocos goles. Sus salidas se fusionan en una única puntuación de confianza entre 0 y 100.
¿Qué es la puntuación de confianza de conjunto?
La puntuación de conjunto (0–100) combina los tres enfoques con pesos fijos — machine learning 60%, Poisson 20% y Dixon-Coles 20% — y luego añade bonificaciones cuando los modelos coinciden y cuando un resultado destaca claramente. Puntuaciones más altas significan mayor acuerdo entre modelos.
¿Qué precisión tiene el modelo de IA?
En un conjunto de prueba estrictamente cronológico (entrenar con el pasado, probar con los partidos más recientes), nuestro modelo de machine learning predice el resultado 1X2 correcto alrededor del 45% de las veces — muy por encima del 33% que cabría esperar adivinando un mercado de tres vías. Indicamos esta cifra honesta fuera de muestra temporal en lugar de un número inflado de división aleatoria, y nos centramos en si nuestras probabilidades están bien calibradas.
¿Por qué vuestra precisión es menor que la de otros sitios de pronósticos?
Porque la medimos de forma honesta. Una división aleatoria de entrenamiento/prueba puede elevar la precisión reportada del fútbol muy por encima del 60%, pero filtra información del futuro al conjunto de prueba. Usamos una división cronológica que refleja las condiciones reales de apuesta, lo que da alrededor del 45%. Preferimos publicar un número real antes que uno halagador.
¿Qué muestra el mapa de calor de marcadores?
El mapa de calor de marcadores muestra la probabilidad de cada resultado desde 0-0 hasta 4-4, según el modelo de Dixon-Coles. Las celdas azules son escenarios de victoria local, las grises son empates y las naranjas son victorias visitantes. Los colores más oscuros indican mayor probabilidad.
¿Por qué Poisson y Dixon-Coles tienen menor precisión 1X2 que el modelo de machine learning?
No están construidos principalmente para acertar ganadores. Modelan cuántos goles es probable que marque cada equipo, lo que los hace fuertes para los mercados de Más/Menos y de marcador exacto. Su papel en el conjunto es complementario — aportan información de goles y marcadores que el modelo de machine learning no capta directamente.
