Unsere Technologie

Wie unser KI-Modell funktioniert

Ein Machine-Learning-Modell plus zwei statistische Modelle, kombiniert zu einer einzigen Ensemble-Konfidenzbewertung — trainiert mit über 28.000 Spielen und beurteilt nach Kalibrierung, nicht nur nach der Schlagzeilen-Genauigkeit.

Jeder Tipp bei Daily Sport Pick wird von einem automatisierten System erzeugt, das mehrere unabhängige Vorhersagemodelle auf jedes Spiel des Tages anwendet. Die Modelle arbeiten getrennt, dann werden ihre Ausgaben zu einer einzigen Ensemble-Konfidenzbewertung zwischen 0 und 100% kombiniert.

Das verringert das Risiko, dass die blinden Flecken eines einzelnen Modells die endgültige Entscheidung bestimmen. Wenn die Modelle übereinstimmen, ist die Bewertung höher. Wenn sie sich widersprechen, ist die Bewertung niedriger — und wir sind vorsichtiger damit, diesen Tipp zu veröffentlichen.

Auf einen Blick  
Kombinierte Modelle Machine Learning + Poisson + Dixon-Coles
Trainingsdaten Über 28.000 historische Spiele (2024 → heute)
ML-Testgenauigkeit (1X2) ~45% in einem streng chronologischen Test-Set (Referenz 33%)
Merkmale pro Vorhersage 30 (Form, Tore, ELO, Ligastärke)
Veröffentlichte Kernligen 14 (unsere Wettbewerbe mit der besten Abdeckung)
Aktualisierung Die Modelle laufen jeden Morgen
Wie die Konfidenzbewertung berechnet wird: Die Ensemble-Bewertung kombiniert die gewichtete Wahrscheinlichkeit des vorhergesagten Ausgangs (60% Machine Learning, 20% Poisson, 20% Dixon-Coles), einen Konsens-Bonus, wenn die Modelle übereinstimmen, einen Abstands-Bonus, wenn die Gewinnwahrscheinlichkeit klar vor den Alternativen liegt, und einen Tor-Konsens-Bonus, wenn die Modelle bei Über/Unter stark übereinstimmen. Die Summe ist auf 100 begrenzt.

Warum unsere Genauigkeit bescheiden wirkt — und warum genau das der Punkt ist.

Fußball ist schwer vorherzusagen, und ein Dreiweg-Markt (Heim/Unentschieden/Auswärts) ergibt allein durch Raten eine Basis von 33%. Manche Seiten nennen Genauigkeiten über 60% durch eine zufällige Trainings-/Test-Aufteilung — aber das leakt zukünftige Spiele in das Test-Set und schmeichelt der Zahl. Wir verwenden eine chronologische Aufteilung (aus der Vergangenheit lernen, an den jüngsten Spielen testen), die rund 45% ergibt. Wir zeigen dir lieber eine echte Zahl und beurteilen das Modell nach etwas Nützlicherem als roher Genauigkeit: der Kalibrierung — ob eine angegebene „60%-Chance” wirklich etwa 60% der Zeit gewinnt.

Modell 1 — Machine Learning (Gewicht 60%)

Unser Hauptmodell ist ein gradientenverstärkter Entscheidungsbaum-Klassifikator, trainiert mit über 28.000 historischen Spielen. Es läuft eigentlich auf zwei Ebenen: ein neueres Histogram-Gradient-Boosting-Modell (v4) bedient unsere Kernwettbewerbe, wo die Datenqualität am höchsten ist, und ein älteres Gradient-Boosting-Modell (v3) dient als Fallback für Ligen mit geringerer Abdeckung.

Genauigkeit: ~45% bei der Vorhersage des korrekten 1X2-Ausgangs in einem zurückgehaltenen chronologischen Test-Set von ~4.300 jüngsten Spielen — deutlich über der Dreiweg-Basis von 33%. Die Genauigkeit variiert je Wettbewerb: Sie ist in Ligen wie der Serie A und der Eredivisie höher (über 50%) und in weniger vorhersehbaren niedriger.

Das Modell nutzt 30 Merkmale pro Vorhersage, darunter:

  • ELO-Wertungen — eine globale Wertung plus separate Heim- und Auswärtswertungen pro Team. Die Heim-/Auswärts-Trennung gehört zu den stärksten Signalen des Modells.
  • Aktuelle Form — Siege, Unentschieden, Niederlagen und ein Form-Score über die letzten 5 Spiele beider Teams
  • Tordurchschnitte — erzielte und kassierte Tore pro Spiel über die jüngsten Partien
  • Ligastärke — die Stufe und Wettbewerbsfähigkeit des Wettbewerbs

Das Modell gibt eine Wahrscheinlichkeit für jeden der drei Ausgänge aus — Heimsieg, Unentschieden oder Auswärtssieg — und der wahrscheinlichste wird zur Vorhersage. Entscheidend ist, dass jedes Merkmal zeitpunktgenau berechnet wird: Es werden nur Informationen verwendet, die vor dem Anpfiff verfügbar waren, sodass das Modell nie mit Rückschau trainiert wird.

Warum ELO-Wertungen wichtig sind: ELO ist eine dynamische Wertung, die sich nach jedem Spiel je nach Ergebnis und Stärke des Gegners aktualisiert. Einen starken Gegner zu schlagen bringt mehr als einen schwachen. Die Heim-/Auswärts-Trennung erlaubt es uns, getrennt zu verfolgen, wie Teams zu Hause gegenüber auswärts abschneiden — eine entscheidende Unterscheidung im Fußball.

Modell 2 — Poisson-Verteilung (Gewicht 20%)

Das Poisson-Modell verfolgt einen rein mathematischen Ansatz. Statt aus gelabelten Ergebnissen zu lernen, schätzt es, wie viele Tore jedes Team wahrscheinlich erzielt, und nutzt dann die Poisson-Verteilung, um eine vollständige Ergebnismatrix zu erstellen.

Für jedes Resultat (z. B. 1-0, 2-1, 0-0) berechnet es eine exakte Wahrscheinlichkeit. Aus dieser Matrix leiten wir ab:

  • 1X2-Wahrscheinlichkeiten (Heimsieg / Unentschieden / Auswärtssieg)
  • Über/Unter-Tor-Wahrscheinlichkeiten
  • Die wahrscheinlichsten genauen Ergebnisse

Es berechnet Angriffs- und Abwehrwertungen pro Team und pro Wettbewerb, korrigiert um den Heimvorteil und auf den Ligadurchschnitt normiert. Ein starker Angriff gegen eine schwache Abwehr ergibt höhere erwartete Tore.

Stärke: Poisson ist besonders nützlich für Über/Unter-Vorhersagen. Indem es die Tore jedes Teams unabhängig modelliert, gibt es einen klaren Überblick, ob ein Spiel tor- oder torarm wird — unabhängig davon, wer gewinnt.

Modell 3 — Dixon-Coles MLE (Gewicht 20%)

Das Dixon-Coles-Modell (Dixon & Coles, 1997) erweitert Poisson, um eine bekannte Schwäche zu beheben: Standard-Poisson unterschätzt torarme Ergebnisse wie 0-0, 1-0, 0-1 und 1-1.

Dixon-Coles fügt für diese vier Ergebnisse einen Korrekturfaktor namens Tau (τ) hinzu. Es schätzt zudem die Angriffs-, Abwehr- und Heimvorteilsparameter gemeinsam mittels Maximum-Likelihood-Schätzung (MLE) über den L-BFGS-B-Optimierer von scipy, statt sie als einfache Durchschnitte zu behandeln. Es ist außerdem zeitgewichtet, sodass jüngste Spiele stärker zählen als ältere und sich das Modell schneller an die Form zur Saisonmitte anpasst.

Dixon-Coles wird für jeden Wettbewerb separat angepasst, über Hunderte Ligen — weit über die Handvoll hinaus, zu denen wir aktiv Tipps veröffentlichen.

Ergebnis-Heatmap: Dixon-Coles speist die Ergebnis-Wahrscheinlichkeits-Heatmap jedes Tipps. Das 5×5-Raster zeigt jedes Resultat von 0-0 bis 4-4, eingefärbt nach Wahrscheinlichkeit. Blaue Zellen sind Heimsieg-Szenarien, graue sind Unentschieden, orange sind Auswärtssiege — dunkler bedeutet wahrscheinlicher.

Das Ensemble: die Modelle kombinieren

Nachdem jedes Modell ein Spiel vorhergesagt hat, kombiniert die Ensemble-Schicht sie mit festen Gewichten:

Ansatz Gewicht Optimiert für
Machine Learning (v4 + v3-Fallback) 60% Gesamtspielausgang (1X2)
Poisson-Verteilung 20% Über/Unter- und Tor-Märkte
Dixon-Coles MLE 20% Ergebnisse und Korrektur torarmer Resultate

Ist ein Modell für einen bestimmten Wettbewerb nicht verfügbar, werden die Gewichte über die verfügbaren Modelle neu normiert — so könnte ein unterklassiges Spiel allein mit Poisson und Dixon-Coles bewertet werden.

Die Konfidenzbewertung wird dann aus vier Teilen aufgebaut:

Komponente Bereich Was sie belohnt
Basiswert 0–75 Die gewichtete Wahrscheinlichkeit des vorhergesagten Ausgangs, skaliert ab der Zufallsbasis von 33%
Konsens-Bonus 0–15 +15 wenn alle drei Modelle übereinstimmen, +7 wenn zwei übereinstimmen
Abstands-Bonus 0–10 Wie klar der Top-Ausgang vor den Alternativen liegt
Tor-Konsens-Bonus 0–15 Wird hinzugefügt, wenn die Modelle bei Über/Unter stark übereinstimmen

Die vier Teile werden summiert und auf 100 begrenzt. Ein hoher Wert bedeutet starke Übereinstimmung und einen klaren führenden Ausgang — aber wir wenden bewusst eine Überkonfidenz-Begrenzung an, damit das System nie überzeichnet, wie sicher es wirklich ist.

Wie wir auswählen, welche Tipps wir veröffentlichen

Eine Vorhersage zu erzeugen ist nur die halbe Arbeit. Ein Modell kann sicher und trotzdem falsch liegen, daher sitzen mehrere Filter zwischen der Rohvorhersage und einem veröffentlichten Tipp:

  • Selektive Veröffentlichung. Wir veröffentlichen Tipps zu einem Kern-Set von Wettbewerben, in denen unsere Abdeckung und Modellqualität am stärksten sind — statt Tipps über jede Liga zu streuen, die wir technisch bewerten könnten.
  • Konfidenz-Untergrenzen und eine Überkonfidenz-Begrenzung. Tipps unter einer Mindestkonfidenz werden zurückgehalten, und ungewöhnlich hohe Werte werden begrenzt, weil Überkonfidenz der Punkt ist, an dem Tipp-Modelle Geld verlieren.
  • Marktbewusste Asian-Handicap-Linien. Für Handicap-Tipps raten wir keine Linie — wir berechnen aus der Poisson-Ergebnismatrix die Linie, bei der die gewählte Seite etwa 50% Chance hat, abzudecken (die „ausgewogene Linie”, die Buchmacher wie Pinnacle nutzen). Das ersetzte eine ältere Faustregel, die systematisch überkonfident war.
  • Sicherheitsprüfungen zwischen Divisionen. Pokal- und Play-off-Spiele können Teams aus verschiedenen Divisionen aufeinandertreffen lassen. Wir erkennen diese Fälle und lassen sie aus, damit ein Zweitligist nicht fälschlich bewertet wird, als spiele er in der höchsten Spielklasse.

Kalibrierung: die Kennzahl, die zählt

Genauigkeit sagt dir, wie oft der wahrscheinlichste Ausgang eintritt. Die Kalibrierung sagt dir, ob die Wahrscheinlichkeiten selbst vertrauenswürdig sind — und beim Wetten zählt genau das. Wenn wir einen Satz Tipps mit „70% wahrscheinlich” kennzeichnen, sollten etwa 70% davon gewinnen. Wir verfolgen dies fortlaufend und zeigen es bei jedem Tipp als KI-Konfidenz-Label (Hoch / Mittel / Niedrig).

Überzeuge dich selbst: Unsere Seite mit den KI-Modellstatistiken stellt die vorhergesagte Konfidenz der tatsächlichen Trefferquote gegenüber, sodass du prüfen kannst, ob unsere Zahlen über Hunderte abgeschlossener Spiele standhalten.

Sieh das Modell in Aktion

Schau dir die heutigen Tipps und ihre Konfidenzwerte an

Häufige Fragen

Welche Vorhersagemodelle nutzt Daily Sport Pick?

Wir kombinieren drei Modellierungsansätze zu einem Ensemble: ein Machine-Learning-Modell (gradientenverstärkte Entscheidungsbäume), trainiert mit über 28.000 historischen Spielen, ein Poisson-Tormodell und ein Dixon-Coles-Modell, das torarme Ergebnisse korrigiert. Ihre Ausgaben werden zu einer einzigen Konfidenzbewertung zwischen 0 und 100 zusammengeführt.

Was ist die Ensemble-Konfidenzbewertung?

Die Ensemble-Bewertung (0–100) kombiniert die drei Ansätze mit festen Gewichten — Machine Learning 60%, Poisson 20% und Dixon-Coles 20% — und fügt dann Boni hinzu, wenn die Modelle übereinstimmen und wenn ein Ausgang klar führt. Höhere Werte bedeuten stärkere Übereinstimmung zwischen den Modellen.

Wie genau ist das KI-Modell?

In einem streng chronologischen Test-Set (mit der Vergangenheit trainieren, an den jüngsten Spielen testen) sagt unser Machine-Learning-Modell das korrekte 1X2-Ergebnis etwa 45% der Zeit voraus — deutlich über den 33%, die man beim Raten eines Dreiweg-Marktes erwarten würde. Wir geben diese ehrliche Out-of-Time-Zahl an statt einer aufgeblähten Zahl aus zufälliger Aufteilung und konzentrieren uns darauf, ob unsere Wahrscheinlichkeiten gut kalibriert sind.

Warum ist eure Genauigkeit niedriger als bei manchen anderen Tipster-Seiten?

Weil wir sie ehrlich messen. Eine zufällige Trainings-/Test-Aufteilung kann die berichtete Fußballgenauigkeit weit über 60% treiben, leakt aber Informationen aus der Zukunft in das Test-Set. Wir verwenden eine chronologische Aufteilung, die reale Wettbedingungen widerspiegelt und etwa 45% ergibt. Wir veröffentlichen lieber eine echte Zahl als eine schmeichelhafte.

Was zeigt die Ergebnis-Heatmap?

Die Ergebnis-Heatmap zeigt die Wahrscheinlichkeit jedes Resultats von 0-0 bis 4-4 auf Basis des Dixon-Coles-Modells. Blaue Zellen sind Heimsieg-Szenarien, graue Zellen sind Unentschieden und orange Zellen sind Auswärtssiege. Dunklere Farben bedeuten höhere Wahrscheinlichkeit.

Warum haben Poisson und Dixon-Coles eine geringere 1X2-Genauigkeit als das Machine-Learning-Modell?

Sie sind nicht in erster Linie dafür gebaut, Sieger zu tippen. Sie modellieren, wie viele Tore jedes Team wahrscheinlich erzielt, was sie stark für Über/Unter- und Genau-Ergebnis-Märkte macht. Ihre Rolle im Ensemble ist ergänzend — sie liefern Tor- und Ergebnisinformationen, die das Machine-Learning-Modell nicht direkt erfasst.

Telegram Bluesky Twitter Facebook Instagram YouTube LinkedIn
Scroll to Top