Nuestra tecnología

Cómo funciona nuestro modelo de IA

Un modelo de machine learning más dos modelos estadísticos, combinados en una única puntuación de confianza de conjunto — entrenado con más de 28.000 partidos y evaluado por su calibración, no solo por la precisión de titular.

Cada pronóstico de Daily Sport Pick lo genera un sistema automatizado que ejecuta varios modelos de predicción independientes sobre cada partido del día. Los modelos trabajan por separado y luego sus salidas se combinan en una única puntuación de confianza de conjunto entre 0 y 100%.

Esto reduce el riesgo de que los puntos ciegos de un solo modelo determinen la decisión final. Cuando los modelos coinciden, la puntuación es más alta. Cuando discrepan, la puntuación es más baja — y somos más cautelosos a la hora de publicar ese pronóstico.

De un vistazo  
Modelos combinados Machine learning + Poisson + Dixon-Coles
Datos de entrenamiento Más de 28.000 partidos históricos (2024 → hoy)
Precisión de prueba del ML (1X2) ~45% en un conjunto de prueba estrictamente cronológico (referencia 33%)
Características por predicción 30 (forma, goles, ELO, fuerza de la liga)
Ligas principales publicadas 14 (nuestras competiciones con mejor cobertura)
Actualización Los modelos se ejecutan cada mañana
Cómo se calcula la puntuación de confianza: la puntuación de conjunto combina la probabilidad ponderada del resultado predicho (60% machine learning, 20% Poisson, 20% Dixon-Coles), una bonificación por consenso cuando los modelos coinciden, una bonificación por margen cuando la probabilidad ganadora destaca claramente sobre las alternativas, y una bonificación por consenso de goles cuando los modelos coinciden con fuerza en el Más/Menos. El total se limita a 100.

Por qué nuestra precisión parece modesta — y por qué ese es el punto.

El fútbol es difícil de predecir, y un mercado de tres vías (local/empate/visitante) da un 33% de referencia solo por adivinar. Algunos sitios citan precisiones por encima del 60% usando una división de entrenamiento/prueba aleatoria — pero eso filtra partidos futuros al conjunto de prueba y adorna el número. Nosotros usamos una división cronológica (aprender del pasado, probar con los partidos más recientes), que da alrededor del 45%. Preferimos mostrarte una cifra real, y evaluamos el modelo por algo más útil que la precisión bruta: la calibración — si un “60% de probabilidad” declarado realmente gana alrededor del 60% de las veces.

Modelo 1 — Machine learning (peso del 60%)

Nuestro modelo principal es un clasificador de árboles de decisión potenciados por gradiente entrenado con más de 28.000 partidos históricos. En realidad funciona en dos niveles: un modelo más reciente de histogram gradient boosting (v4) gestiona nuestras competiciones principales, donde la calidad de los datos es mayor, y un modelo más antiguo de gradient boosting (v3) actúa como respaldo para las ligas con menor cobertura.

Precisión: ~45% al predecir el resultado 1X2 correcto en un conjunto de prueba cronológico reservado de ~4.300 partidos recientes — muy por encima de la referencia del 33% a tres vías. La precisión varía según la competición: es más fuerte en ligas como la Serie A y la Eredivisie (por encima del 50%) y menor en las menos predecibles.

El modelo usa 30 características por predicción, entre ellas:

  • Valoraciones ELO — una valoración global más valoraciones separadas de local y visitante por equipo. La separación local/visitante es una de las señales más potentes del modelo.
  • Forma reciente — victorias, empates, derrotas y una puntuación de forma de los últimos 5 partidos de ambos equipos
  • Promedios de goles — goles marcados y encajados por partido en los partidos recientes
  • Fuerza de la liga — el nivel y la competitividad de la competición

El modelo genera una probabilidad para cada uno de los tres resultados — victoria local, empate o victoria visitante — y el más probable se convierte en la predicción. Fundamentalmente, cada característica se calcula en el momento: solo se usa información disponible antes del saque inicial, por lo que el modelo nunca se entrena con información a posteriori.

Por qué importan las valoraciones ELO: El ELO es una valoración dinámica que se actualiza tras cada partido según el resultado y la fuerza del rival. Vencer a un rival fuerte aporta más que vencer a uno débil. La separación local/visitante nos permite seguir por separado cómo rinden los equipos en casa frente a fuera — una distinción crucial en el fútbol.

Modelo 2 — Distribución de Poisson (peso del 20%)

El modelo de Poisson adopta un enfoque puramente matemático. En lugar de aprender de resultados etiquetados, estima cuántos goles es probable que marque cada equipo y luego usa la distribución de Poisson para construir una matriz completa de marcadores.

Para cada marcador (p. ej. 1-0, 2-1, 0-0) calcula una probabilidad exacta. A partir de esta matriz derivamos:

  • Probabilidades 1X2 (victoria local / empate / victoria visitante)
  • Probabilidades de Más/Menos goles
  • Los marcadores exactos más probables

Calcula valoraciones de ataque y defensa por equipo y por competición, corregidas por la ventaja local y normalizadas a la media de la liga. Un ataque fuerte frente a una defensa débil produce mayores goles esperados.

Fortaleza: Poisson es especialmente útil para las predicciones de Más/Menos. Al modelar los goles de cada equipo de forma independiente, ofrece una visión clara de si un partido será de muchos o pocos goles — independientemente de quién gane.

Modelo 3 — Dixon-Coles MLE (peso del 20%)

El modelo de Dixon-Coles (Dixon & Coles, 1997) amplía Poisson para corregir una debilidad conocida: el Poisson estándar subestima los resultados de pocos goles como 0-0, 1-0, 0-1 y 1-1.

Dixon-Coles añade un factor de corrección llamado tau (τ) para esos cuatro marcadores. También ajusta conjuntamente los parámetros de ataque, defensa y ventaja local mediante Estimación de Máxima Verosimilitud (MLE) con el optimizador L-BFGS-B de scipy, en lugar de tratarlos como simples promedios. Además está ponderado en el tiempo, por lo que los partidos recientes cuentan más que los antiguos y el modelo se adapta más rápido a la forma de mitad de temporada.

Dixon-Coles se ajusta por separado para cada competición, en cientos de ligas — mucho más allá del puñado sobre el que publicamos pronósticos activamente.

Mapa de calor de marcadores: Dixon-Coles alimenta el mapa de calor de probabilidad de marcadores de cada pronóstico. La cuadrícula de 5×5 muestra cada marcador desde 0-0 hasta 4-4, coloreado por probabilidad. Las celdas azules son escenarios de victoria local, las grises son empates, las naranjas son victorias visitantes — cuanto más oscuro, más probable.

El conjunto: combinar los modelos

Después de que cada modelo predice un partido, la capa de conjunto los combina con pesos fijos:

Enfoque Peso Optimizado para
Machine learning (v4 + respaldo v3) 60% Resultado general del partido (1X2)
Distribución de Poisson 20% Mercados de Más/Menos y goles
Dixon-Coles MLE 20% Marcadores y corrección de pocos goles

Si un modelo no está disponible para una competición concreta, los pesos se renormalizan entre los modelos que sí lo están — así, un partido de categoría inferior podría puntuarse solo con Poisson y Dixon-Coles.

La puntuación de confianza se construye entonces a partir de cuatro componentes:

Componente Rango Qué premia
Puntuación base 0–75 La probabilidad ponderada del resultado predicho, escalada desde la referencia aleatoria del 33%
Bonificación por consenso 0–15 +15 si los tres modelos coinciden, +7 si coinciden dos
Bonificación por margen 0–10 Cuán claramente el resultado principal destaca sobre las alternativas
Bonificación por consenso de goles 0–15 Se añade cuando los modelos coinciden con fuerza en el Más/Menos

Los cuatro componentes se suman y se limitan a 100. Una puntuación alta significa fuerte acuerdo y un resultado principal claro — pero aplicamos deliberadamente un límite de sobreconfianza para que el sistema nunca exagere lo seguro que realmente está.

Cómo elegimos qué pronósticos publicar

Generar una predicción es solo la mitad del trabajo. Un modelo puede estar seguro y aun así equivocarse, por lo que varios filtros se sitúan entre la predicción en bruto y un pronóstico publicado:

  • Publicación selectiva. Publicamos pronósticos sobre un conjunto principal de competiciones donde nuestra cobertura y la calidad del modelo son más fuertes — en lugar de esparcir selecciones por cada liga que técnicamente podemos puntuar.
  • Mínimos de confianza y un límite de sobreconfianza. Los pronósticos por debajo de una confianza mínima se retienen, y las puntuaciones inusualmente altas se limitan, porque la sobreconfianza es donde los modelos de pronóstico pierden dinero.
  • Líneas de Hándicap Asiático conscientes del mercado. Para los pronósticos de hándicap no adivinamos una línea — calculamos, a partir de la matriz de marcadores de Poisson, la línea donde el lado elegido tiene aproximadamente un 50% de probabilidad de cubrir (la “línea equilibrada” que usan casas como Pinnacle). Esto sustituyó una antigua regla general que era sistemáticamente sobreconfiada.
  • Comprobaciones de seguridad entre divisiones. Los partidos de copa y de play-off pueden enfrentar a equipos de distintas divisiones. Detectamos esos casos y los descartamos, para que un equipo de segunda no se valore por error como si jugara en la máxima categoría.

Calibración: la métrica que importa

La precisión te dice con qué frecuencia ocurre el resultado más probable. La calibración te dice si las propias probabilidades son fiables — y para apostar, eso es lo que cuenta. Si etiquetamos un lote de pronósticos como “70% probable”, aproximadamente el 70% deberían ganar. Lo seguimos de forma continua y lo mostramos en cada pronóstico como una etiqueta de Confianza de IA (Alta / Media / Baja).

Compruébalo tú mismo: nuestra página de Estadísticas del modelo de IA representa la confianza predicha frente a la tasa de aciertos real, para que puedas comprobar si nuestros números se sostienen a lo largo de cientos de partidos resueltos.

Ve el modelo en acción

Consulta los pronósticos de hoy y sus puntuaciones de confianza

Preguntas frecuentes

¿Qué modelos de predicción usa Daily Sport Pick?

Combinamos tres enfoques de modelado en un único conjunto: un modelo de machine learning (árboles de decisión potenciados por gradiente) entrenado con más de 28.000 partidos históricos, un modelo de goles de Poisson y un modelo de Dixon-Coles que corrige los resultados de pocos goles. Sus salidas se fusionan en una única puntuación de confianza entre 0 y 100.

¿Qué es la puntuación de confianza de conjunto?

La puntuación de conjunto (0–100) combina los tres enfoques con pesos fijos — machine learning 60%, Poisson 20% y Dixon-Coles 20% — y luego añade bonificaciones cuando los modelos coinciden y cuando un resultado destaca claramente. Puntuaciones más altas significan mayor acuerdo entre modelos.

¿Qué precisión tiene el modelo de IA?

En un conjunto de prueba estrictamente cronológico (entrenar con el pasado, probar con los partidos más recientes), nuestro modelo de machine learning predice el resultado 1X2 correcto alrededor del 45% de las veces — muy por encima del 33% que cabría esperar adivinando un mercado de tres vías. Indicamos esta cifra honesta fuera de muestra temporal en lugar de un número inflado de división aleatoria, y nos centramos en si nuestras probabilidades están bien calibradas.

¿Por qué vuestra precisión es menor que la de otros sitios de pronósticos?

Porque la medimos de forma honesta. Una división aleatoria de entrenamiento/prueba puede elevar la precisión reportada del fútbol muy por encima del 60%, pero filtra información del futuro al conjunto de prueba. Usamos una división cronológica que refleja las condiciones reales de apuesta, lo que da alrededor del 45%. Preferimos publicar un número real antes que uno halagador.

¿Qué muestra el mapa de calor de marcadores?

El mapa de calor de marcadores muestra la probabilidad de cada resultado desde 0-0 hasta 4-4, según el modelo de Dixon-Coles. Las celdas azules son escenarios de victoria local, las grises son empates y las naranjas son victorias visitantes. Los colores más oscuros indican mayor probabilidad.

¿Por qué Poisson y Dixon-Coles tienen menor precisión 1X2 que el modelo de machine learning?

No están construidos principalmente para acertar ganadores. Modelan cuántos goles es probable que marque cada equipo, lo que los hace fuertes para los mercados de Más/Menos y de marcador exacto. Su papel en el conjunto es complementario — aportan información de goles y marcadores que el modelo de machine learning no capta directamente.

Telegram Bluesky Twitter Facebook Instagram YouTube LinkedIn
Scroll to Top