Dies ist eine alte Version des Dokuments!


Wir wollen einen Versuch unternehmen, um die Bedeutung des Zufalls im Fußball zu quantifizieren. Dies ist ein äußerst schwieriges Unterfangen und viele denkbare Zugänge sind möglich. Der Zufall spielt eine deutlich größere Rolle, als der gemeine Fußballfan wohl vermuten würde. Simuliert man eine Liga gleich starker Mannschaften mit realistischen Zufallsergebnissen, so beträgt der Punktunterschied zwischen dem ersten und letzten der Liga etwa 30 Punkte (A. Werner, MDMV 19, 2011)! Jedoch mischt sich die zufällige Komponente eben auch mit dem Einfluss der Qualität der Spieler. Dies auseinander zu halten ist eine mehr als schwierige Aufgabe.

Wie könnte man den Zufall quantifizieren? Wir versuchen dies anhand von knappen Spielen zu tun. Die Frage ist nur, was ist ein knappes Spiel? Unsere Definition eines knappen Spiels wird über die Torchancen-Differenz formuliert, für letztere Größe verwenden wir xGoals. Die Idee hinter diesem Vorgehen ist die, dass bei etwa gleichen Torchancen vornehmlich der Zufall entscheidet, ob eine gegebene Torchance in ein Tor verwandelt wird. Selbstverständlich entscheidet nicht nur der Zufall, ob eine Torchance zu einem Tor führt, sondern eben auch die Qualität des Schützen und die des Torwartes. Mittelt man über alle solche Torchancen, wird eine Abweichung von dem idealen Mittelwert unter Umständen eine Aussage ermöglichen, wie groß in etwa der Anteil des Zufalls im Vergleich zur Spieler-Qualität ist. Zumindest ist dies die Hoffnung!

Wir definieren ein knappes Spiel $s$ über die xGoal-Differenz: $$ dG(s) := | xG_H(s) - xG_G(s) | < d $$ wobei $xG_H(s)$ und $xG_G(s)$ die xGoal-Werte des Spiels $s$ der Heim- und Gast-Mannschaft ist und die Größe $d$ ein noch zu definierender Wert ist. Die genaue Wahl stellt offenbar eine gewisse Willkür in der Definition dar. Desto niedriger $d$ gewählt wird, desto größer spielt der Zufall eine Rolle, jedoch werden die Anzahl der Spiele die zur Statistik beitragen geringer. Vergrößert man $d$, so steigt die Anzahl der Spiele in der Statistik, aber der Zufall hat dann einen immer geringeren Einfluss, da es sich immer weniger um ein knappes Spiel handelt. Natürliche Wahlen wären etwa $d=0.5, 0.75$ oder $1$. Wir entscheiden uns hier für den Mittelweg von $d=0.75$, was nebenbei bemerkt dem xG-Wert für die Torchance bei einem Elfmeter entspricht und somit eine anschauliche Vorstellung dafür liefert.

Schauen wir uns die 4 Spielzeiten 14/15-17/18 an, so gab es 575 knappe Spiele (mit $d=0.75$), was einem Anteil von 47% aller $S=1224$ Spiele entspricht. Gruppiert in Abschnitte $n\cdot d < dG < (n+1)\cdot d,\; n=0,1...,7$ ist die Verteilung in der folgenden Grafik dargestellt. Zum Vergleich sind die entsprechenden Daten der aktuellen Saison bis zum 13. Spieltag in Rot eingezeichnet. Knapp die Hälfte aller Spiele in einer Saison sind demnach knappe Spiele. Nimmt man den #FCB aus der Wertung heraus, so sind es 49% der Spiele!

Für eine andere Wahl mit $d=0.5$ sind es 34% der Spiele und für $d=1$ sind es 58% knappe Spiele. Der letztere Wert ist deutlich zu hoch, der erstere Wert wäre eventuell besser, aber der statistische Fehler für eine einzelne Saison ist zu hoch, wie wir im Verlauf der Diskussion noch sehen werden. Betrachten wir die Ergebnisverteilung aller knappen Spiele in der nachfolgenden Grafik, so erkennen wir, dass auch tatsächlich die überwiegende Mehrzahl aller knappen Spiele definiert über $dG(s)<0.75$ tatsächlich auch ein knappes Spielergebnis zur Folge hatte.

Nehmen wir also im Folgenden die so definierten knappen Spiele als Basis unserer Untersuchung und schauen im nächsten Abschnitt an, wie gleich verteilt die Spielausgänge sind.

Ein wichtiges Indiz für eine gute Wahl des Parameters $d$ ist die Punkteverteilung der knappen Spiele. Wäre diese ideal (infinitesimal kleines $d$ und eine sehr große Anzahl von Spielen $S$), dann wären alle drei Ergebnisse aus Sicht der Heimmannschaft [Sieg (S), Unentschieden (U) und Niederlage (N)] gleich wahrscheinlich. Da aber ein Heimvorteil in allen Ligen existiert, gibt es keine Gleichverteilung der Ergebnisse, sondern eine Verschiebung hin zu Heimsiegen. Im Konkreten sieht die Anteils-Verteilung $P$ der Spielausgänge für die betrachteten 4 Spielzeiten wie folgt aus: $$ P_S = 0.356, \qquad P_U=0.342, \qquad P_N=0.301. $$ Diese Werte weichen damit tatsächlich nicht sehr vom idealen Wert $P=1/3$ ab, zeigen aber schon die angesprochene Tendenz zu Heimsiegen! Korrekterweise müssten wir im Folgenden mit diesen Schätzern $P_S, P_U$ und $P_N$ der Wahrscheinlichkeiten rechnen. Um die Interpretation und folgende Argumentation etwas zu vereinfachen, nehmen wir der einfachheitshalber $P=1/3$ an. Dann ist der theoretische Erwartungswert der Punktzahl über alle Spiele: $$ \bar{p}=\sum_{s=1}^S p(s)\frac{P(s)}{S} = \frac{1}{S}\big(3P_S +P_U\big), $$ dabei ist $p(s)=3,1,0$ die Punktzahl im Spiel $s$, für Sieg, Unentschieden und Niederlage. Die Summe geht über alle knappen Spiele, in unserem Fall über $S=575$ Spiele. Bei Verwendung der idealen Verteilung ergibt sich $\bar{p}=4/3=1.333...$, im Vergleich zu $\bar{p}=1.41$ bei Verwendung der Schätzer. Der Fehler durch diese Vereinfachung der Betrachtung ist damit klein.

Die verschiedenen Mannschaften werden in Summe unterschiedliche Anzahl von knappen Spielen aufweisen, um diese einheitlich vergleichen zu können definieren wir im nächsten Abschnitt die Punkteausbeute.

Zum Vergleich des Erfolgs von Mannschaften in $S$ knappen Spielen, werden wir die Punkteausbeute $p_{100}(S)$ jeder Mannschaft auf die maximal mögliche Anzahl von Punkten normieren, die in $S$ knappen spielen möglich gewesen wäre, und geben diese in Prozent an: $$ p_{100}(S) := \frac{100}{3S} \sum_{s=1}^S p(s). $$ Demnach entspricht der Erwartungswert $\bar{p}=4/3$ einem $p_{100}=100/3S \cdot S4/3 =44.4...$. Das ist der Erfolgswert, den durchschnittlich ein Team zu erwarten hätte, wenn alle Spielausgänge zufällig gewesen wären. Selbstverständlich bedeutet dies nicht, dass jede Mannschaft genau diese mittlere Erfolgsquote hat, denn der Zufall sorgt eben dafür, dass es Schwankungen gibt. Diese Schwankung lässt sich abschätzen, hierauf wollen wir im Detail nicht eingehen, aber anmerken, dass diese Grenzen in den folgenden Diagrammen als rote vertikale Linien neben der grauen Erwartungswertlinie mit eingezeichnet werden.

Aufgrund der größeren Datenbasis und als Vergleichsmaßstab für die laufende Saison schauen wir uns zunächst die Punkteausbeute der knappen Spiele der vergangenen Saison an.

Die Anzahl der knappen in der Saison 17/18 lag bei 45.8%, also sehr nahe am Vierjahresmittel. Die folgende Grafik zeigt die Tabelle der normierten Punktausbeute $p_{100}$. Zusätzlich sind die Punkte und Spiele (Pkt/Spiel), die Effizienz in Tore pro $xG_H$ bzw Tore pro $xG_G$ in Prozent (exGH:exGG) und das mittlere xGoal-Ergebnis pro Spiel (xGH:xGG) je Mannschaft angegeben. Der #FCB fällt nicht nur in der Punkteausbeute aus dem Rahmen, auch in der Anzahl der knappen Spiele, die mit Abstand am geringsten ausfällt. Die Anzahl der knappen Spiele ist darüber hinaus über alle Teams unauffällig zwischen 13 und 20 Spiele verteilt.

Zunächst ein paar allgemeine Bemerkungen zur Grafik. Der Meister ist in Grün, die Champions League Plätze in Blau und die Absteiger sind in Rot gekennzeichnet. Im Sinne unserer Ausgangsfragestellung ist es wichtig an dieser Stelle zu bemerken, dass die Schwankung sehr groß ist. Lediglich 2 Teams (#FCB und #KOE) liegen deutlich außerhalb der Schwankung, jeweils im positiven wie im negativen Sinne. Vier weitere Teams liegen an der Grenze, #S04 und #RBL im Positiven und #FCA und #BVB im Negativen. Die allermeisten Teams liegen tatsächlich um den erwarteten Wert von $\bar{p}=44.4...$. Für diese Teams könnte man sagen, alles ist statistisch recht normal verlaufen. Allenfalls könnte man im Detail in der Effizienz bzw des xGoals-Ergebnisses nach Auffälligkeiten suchen. Dies wollen wir an dieser Stelle nicht verfolgen, da zur Interpretation oft ein Detailwissen zur jeweiligen Mannschaft nötig ist. Gehen wir stattdessen über zu den Auffälligkeiten der Teams, die außerhalb der Schwankung liegen.


Team-Analysen

Der #FCB liegt in der Punkteausbeute $p_{100}$ deutlich an der Spitze. Dies ist die Folge der besten offensiven Effizienz von 145% verwandelter xGoals und der zweitbesten Effizienz von 87% im Verhindern von Toren aus Torchancen!

& Die zweitbeste Punkteausbeute $p_{100}$ erreichte #S04. Ein bemerkenswerter Unterschied zum #FCB und vielen anderen Teams ist jedoch, dass sie tatsächlich ein vergleichsweise negatives xGoals-Ergebnis von 1.06:1.19 besitzen! Auf den ersten Blick erscheint dies wenig. Bei den 18 Spielen macht dies jedoch etwa 2 Tore aus, was bei knappen Spielen durchaus im 1-4 Punkte ausmachen kann! Beachtet man, dass in der Saison 17/18 zwischem dem 3. und 6. der Tabelle genau 2 Punkte Unterschied lagen, so können diese Punkte entscheidend für die Qualifikation zwischen Champions League und Euro League sein. Die Schalker kompensierten dies durch eine hohe Effizienz und erzielten eine überdurchschnittliche Punkteausbeute. Nahezu dieselben Argumente treffen auch auf #RBL zu, bis auf die nicht ganz so negative xG-Differenz.

Am anderen Ende der Punkteausbeute liegt der Absteiger #KOE mit der deutlich schlechtesten Punkteausbeute, als Folge der schlechten offensiven und defensiven Effizienz, kombiniert mit einer negativen xG-Differenz.

& Überraschenderweise liegt aber auch der #BVB am Ende der Tabelle und der Grund scheint eindeutig die miserable schlechteste Effizienz von 144% Toren aus Torchancen des Gegners zu sein. Dies geht vermutlich auf die schlechte Phase mit Trainer Bosz zurück. Praktisch dieselbe Punkteausbeute erzielte der #FCA, aber mit einem gänzlich anderem Stil. Mit einer nahezu ausgeglichenen Effizienz aber eben einer im Gegensatz zum #BVB umgedrehten xG-Differenz von -0.2, der schlechtesten aller Teams.


Knappe Spiele 18/19 nach dem 13. Spieltag

Kommen wir nun zur aktuellen Saison. Wichtig bei der Interpretation ist, dass es zwar auch 41% knappe Spiele gab aber durch bisher erst 13 Spieltage absolut dann deutlich weniger Spiele. Das bedeutet, dass die Schwankung deutlich größer ist und die Ergebnisse mit noch mehr Vorsicht zu genießen sind. Ein Spiel mehr gewonnen oder verloren statt eines Unentschiedens bedeutet schon in der Regel ca 4-5 Plätze Unterschied in der Tabelle!

Deswegen sind wir vorsichtig und betrachten tatsächlich nur die großen Ausreißer, sowie zum Vergleich die großen Abweichungen zur letzten Saison. Eine Interpretation der einzelnen Teams überlassen wir den jeweiligen Experten der Teams.

Team-Analysen

Der #BVB liegt in der Punktausbeute mit satten 81% an der Spitze, mit der besten positiven (157%), wie negativen (72) Effizienz bei recht ausgeglichener xG-Differenz von 0.06, was bei 7 Spielen nicht einmal ein Tor ausmacht! Das ist vermutlich zu einem Großteil auf den Trainer zurückzuführen.

Die gute Punkteausbeute vom #SVW geht sicherlich auf die Anfangsphase der Saison zurück, in der eine ausgesprochene gute Effizienz erzielt wurde, die trotz negativer xG-Differenz zu einem positiven Gesamtresultat führt.

Die Borussia ist an der Grenze der Auffälligkeit, sei aber hier erwähnt wegen der höchsten offensiven Effizienz von 175% in knappen Spielen! Das wiederum ist in Teilen den Toren von A. Plea geschuldet.

Der #FCB liegt zur Zeit zwar im Mittelfeld, aber ein Vergleich zur letzten Saison ist ein Vergleich angemessen. Die Effizienz ist sowohl in der Offensive (145% zu 114%) aber ganz besonders in der Defensive (87% zu 153%) eingebrochen, was mehr als eine Halbierung der Punkteausbeute zur Folge hat! Ebenso spielen sich die Bayern nicht mehr Torchancen in den knappen Spielen heraus.

Ähnliches gilt für den #S04, der ebenso die Punkteausbeute halbierte, da sowohl eine Verschlechterung in der Offensive als auch Defensive zu beobachten ist. Das Glück des letzten Jahres hat sich in entsprechendes Pech gedreht.

Die schlechteste Gesamt-Effizienz aller Teams weist der #VFB aus (63%:171%), dies zusammen mit der ausgeglichenen xG-Differenz erklärt die derzeitige Lage des #VFB.


Auch hier wollen wir weitere Interpretationen den Vereinsexperten überlassen und kommen zu einem vorläufigen Fazit.

Die ursprünglich gestellte Frage nach der Bedeutung des Zufalls lässt sich leider nur in Teilen beantworten und bestätigt eher bekanntes Fußballallgemeinwissen. Der Zufall spielt im Fußball durch die geringe Anzahl von Toren in einem Spiel, wie in keiner anderen Ballsportart, eine extrem große Rolle. Knappe Spiele, in denen tatsächlich eben oft der Zufall über den Ausgang entscheidet, können am Ende der Saison zur Folge haben, dass eine Mannschaft 3-6 Punkte mehr oder weniger hat, aus rein statistischen Gründen. Diese wenigen Punkte können jedoch den Unterschied zu CL vs EL oder Abstieg und Relegation bedeuten, was wiederum mit großen finanziellen Unterschieden einhergeht.

Mit diesem kleinen Zwischenfazit wollen wir es an dieser Stelle zunächst bewenden lassen. Am Ende der Saison wird es ein Update der Analyse geben und ein vielleicht detaillierteres Fazit. Bis dahin wird es gelegentlich eine aktualisierte Punkteausbeute-Tabelle auf Twitter geben.

Geben Sie Ihren Kommentar ein. Wiki-Syntax ist zugelassen:
B K E P Q
 
  • Zuletzt geändert: 2018/12/05 20:13
  • von admin