BStat

Zu Beginn der Saison 19/20 gab es in der Bundesliga viele Trainerwechsel und dadurch bedingt typischerweise auch mehr oder minder starke Veränderungen im Spielstil der betroffenen Teams. Solche Veränderungen sind für ausgebildete Trainer erkennbar, für den gemeinen Fußballfan vielleicht nicht in allen Facetten. Wir wollen hier der Frage nachgehen, inwieweit mögliche Veränderungen signifikant auch in statistischen Spieldaten sichtbar sind. Dazu betrachten wir ausgewählte Spieldaten, die einen Spielstil charakterisieren. Im Einzelnen sind dies:

Laufdaten: Laufleistung und Sprints
Zweikampf: Fouls und Zweikampfquote
Passspiel: Ballbesitz und Passquote
Offensive: Torschüsse und xGoals
Defensive: Gegentorschüsse und Gegen-xGoals

Als Datenbasis legen wir die Spieldaten von Sport.de aus der Saison 18/19 und der Hinrunde 19/20 zugrunde und vergleichen im Wesentlichen zwei Teams mit jungen neuen Trainern:

Gladbach - D. Hecking $\rightarrow$ M. Rose,
Schalke 04 - D. Tedesco / H. Stevens $\rightarrow$ D.Wagner,

Im Einzelfall betrachten wir jedoch auch andere Teams, bei denen es zu markanten Verschiebungen in Spieldaten gekommen ist, insbesondere auch wegen der hier dargestellten Methode den #FCB, da in diesem Fall die Datenbasis für einen Vergleich deutlich kleiner ist und Aussagen bezüglich signifikanten Änderungen schwieriger sind.

Alle Spieldaten werden wir anhand der Mittelwerte (Mediane) und Schwankungen miteinander vergleichen und dabei auf statistische Signifikanz testen. Um dies grafisch zu verdeutlichen, stellen wir die Daten als sogenannte Box-Plots dar und führen t-Tests als Signifikanztest durch. Auf alle Details dieser Methoden werden wir hier nicht eingehen, die wesentlichen Merkmale jedoch anhand einfach verständlicher Beispiele anschaulich erklären.

Zunächst erklären wir die in diesem Artikel verwendeten Diagramme und Methoden anhand der Laufleistung (in km pro Spiel des Teams) und Zahl der Sprints (pro Spiel des Teams) für die gesamte Liga in der Hin- und Rückrunde 18/19 sowie der Hinrunde der aktuellen Saison 19/20. Die beiden folgenden Grafiken zeigen Median-Werte [dicker durch median und $p(0.50)$ gekennzeichneter schwarzer Strich], die Quantilen zu 25% [unterer schwarzer Strich mit $p(0.25)$] und 75% [oberer schwarzer Strich mit $p(0.75)$]. Man stelle sich alle Spieldaten nach Größe geordnet vor, dann sind die Quantilen die Grenzen bei der 25%,50% bzw. 75% aller Spieldaten jeweils unterhalb oder auf der Linien liegen.

Die länglichen vertikalen schwarzen Linien geben Bereiche an, in der die Mehrzahl aller Spieldaten liegen, bis auf vereinzelte Ausreißer, die durch graue Punkte ebenfalls gekennzeichnet sind. Zusätzlich sind in Rot die Mittelwerte zusammen mit den Schwankungen eingezeichnet. Bei einem Vergleich von Mittelwerten und der dadurch initiierten Diskussion ist es wichtig zu wissen, ob diese sich tatsächlich signifikant voneinander unterscheiden. Hierzu gibt es verschiedene statistische Verfahren und Kenngrößen. Wir verwenden als Hauptkriterium den Signifikanzwert ($p$-Wert) des t-Tests. Als Beispiel schauen wir uns verschiedene Mittelwert-Paare aus obigen Sprint- und Laufleistungs-Diagrammen an.

	1819 H	1819 R	1920 H	p
Sprints	216.4	215.1		0.587
Sprints	216.4		216.1	0.915
Laufleistung	117.2	116.5		0.067
Laufleistung	117.2		115.9	0.0005

Verkürzt und vereinfacht formuliert könnte man sagen, desto kleiner der $p$-Wert ist, desto wahrscheinlicher ist es, dass die betrachteten Mittelwerte tatsächlich verschieden voneinander sind. Da $p$ eine Wahrscheinlichkeit ist, gibt es keinen festen Wert, bei der man von signifikant sprechen kann, sondern eben nur Wahrscheinlichkeiten. Wir sprechen hier im Folgenden von signifikant verschieden, wenn $p<0.005$ ist. Für die obigen Vergleiche der Mittelwerte wären dann nur die letzten beiden Mittelwerte signifikant verschieden. In der Sprechweise der Statistik wäre die Interpretation, dass in 2000 (=1/0.0005) Vergleiche von Mittelwerten aus fiktiven Spielzeiten eine solche Differenz existiert, obwohl kein Unterschied in den tatsächlichen Erwartungswerten vorhanden ist. Hierfür verantwortlich ist die nur endlich große Stichprobe.

Die oben dargestellten Daten zeigen alle Teams beider Spielzeiten zusammen und wie im Speziellen diese Daten bemerkenswerterweise nur schwach variieren. Betrachten wir als Beispiel Sprints und differenzieren in den Teams, so sehen wir, wie stark im Einzelnen sich die Daten der Teams verändern können.

Diese Variationen haben auf der einen Seite einen statistischen Ursprung aber bedeutender sind Änderungen, die durch neue Spieler, Verletzte und im Besonderen neue Trainer mit neuen Spielphilosophien bedingt sind. Aus dem Diagramm ersichtlich gibt es Teams, bei denen sich kaum etwas geändert hat, etwa #BVB, #FCA, #RBL und #WOB, dann Teams, bei denen sich etwas zum Positiven verändert hat, etwa #BMG, #FCB und #S04 und auch Teams bei denen es negative Veränderungen gegeben hat, wie ganz besonders sichtbar bei #SGE und #SVW.

Bei der Laufleistung ist etwas Interessantes zu beobachten, denn im Vergleich sind #BMG und #FCB leicht weniger gelaufen, sie haben also die Zahl der Sprints auf Kosten der Laufleistung erhöht. Anders verhält es sich bei #S04, die auch hier scheinbar signifikant zugelegt haben. Ganz besonders negativ fallen #F95 und wiederum #SVW auf, die beiden Teams mit der größten negativen Veränderung. Insgesamt und ohne an dieser Stelle schon auf Signifikanz einzugehen scheint Werder mindestens auch ein Laufproblem aufzuweisen, wenn man beachtet wie stark der Einfluss des Laufens sein kann.

Wir haben gesehen #BMG und #S04 mit neuen Trainer, gehören zu den Teams, bei denen sich viel geändert hat. Im Folgenden analysieren wir im Wesentlichen verschiedene Spieldaten dieser beiden Teams im Detail und schauen, wie sie sich in der gesamten Liga einordnen. Wir beginnen im ersten Teil mit Laufdaten.

Schauen wir uns zunächst wieder die Sprints an, so sehen wir, dass es bei #BMG in den beiden Halbsaisons 18/19 keine signifikante Änderung ($p=0.72$) diesbezüglich gegeben hat, jedoch zwischen den beiden Hinrunden 18/19 und 19/20 ($p=0.0019$) mit einem Zuwachs von Sprints um etwa 10%. Bei #S04 ist im Vergleich der beiden Halbserien 18/19 ebenfalls eine Veränderung um etwas weniger als 10% zu beobachten, aber mit einer größeren Schwankung, und demzufolge einem höheren Signifikanzwert von $p=0.029$, wir sprechen dann von schwach signifikant ($0.05 \lesssim p \lesssim 0.005$). Anders sieht es beim Vergleich der beiden Hinrunden aus, hier gibt es eine deutliche und signifikante ($p=0.0036$) Steigerung um etwa 10%. Noch deutlicher wird es, wenn man die komplette Saison 18/19 mit der Hinrunde 19/20 vergleicht.

#BMG und #S04

Bei der Laufleistung stellt sich das Bild differenzierter dar, diese hat sich bei #BMG nicht signifikant ($p=0.17$) im Vergleich 18/19 zu Hinrunde 19/20 verändert und ebenso gibt es keine signifikante Änderung zwischen beiden Hinrunden von #S04, aber eine deutlich signifikante ($p=0.00052$) Steigerung zwischen der Rückrunde unter H.Stevens und der Hinrunde unter D.Wagner.

Für beide Teams könnte man zusammenfassen, sie haben die Laufleistung in etwa konstant gehalten bzw. Schalke über die Saison betrachte leicht erhöht, aber die Zahl der Sprints signifikant erhöht; die Borussia von einem schwachen Niveau auf ein mittleres und Schalke von einem mittleren zu einem hohen Niveau. Dies zeigt insbesondere der Vergleich beider Spieldaten-Differenzen in einem Diagramm.

Differenzen von Spieldaten sind in den allermeisten Fällen deutlich bessere Messgrößen, da hier systematische Fehler, wie Außentemperatur, Witterung, Schiedsrichterstil, Platzverhältnisse usw für beide Teams gleich sind und deren Effekt in erster Näherung herausfällt.

FC Bayern München

Schauen wir uns zum Abschluss noch ein ganz markantes Beispiel von Veränderung an, welches durch einen Trainerwechsel initiiert wurde, und zwar den #FCB mit dem Trainerwechsel N.Kovac zu H.Flick.

Wichtig zu betonen ist, dass die Datenbasis deutlich kleiner und damit die statistischen Schwankungen größer sind und somit die Signifikanzwerte ebenso größer ausfallen. Für die Laufdaten bedeutet dies im konkreten Fall, es gibt eine schwach signifikante Steigerung um etwa 4% bei der Laufleistung und eine signifikante Steigerung ($p=0.0018$) bei den Sprints um fast 20%! Das ist sicherlich eine durch den Trainerwechsel bedingte Veränderung.

Betrachten wir als Nächstes das Zweikampfverhalten aller Teams um einen Eindruck zu bekommen wie groß Veränderungen in diesem Bereich sind. Es ist sofort zu erkennen, dass zum einen die einzelnen mittleren Zweikampfquoten deutlich schwächer variieren und zum anderen relativ dazu die Schwankungen vergleichsweise groß sind. Deswegen gibt es keine einzige signifikante Veränderungen! Dies ist verständlich, da die Zweikampfstärke eines Teams maßgeblich von der Spielerqualität abhängt und diese sich in der Regel nicht so schnell verändert.

Ein wenig anders sieht es bei den Foulspielen aus. Hier gibt es zwei schwach signifikante Veränderungen, zum einen beim #FCA mit knapp 20% weniger Fouls und bei #WOB mit knapp 40% mehr Fouls. Die einzig signifikante Änderung ($p=0.003$) betrifft #BMG mit einer Steigerung von etwa einem Drittel mehr Fouls im Vergleich zur Saison 18/19.

#BMG und #S04

Wie zuvor erwähnt, gibt es keine signifikanten Veränderungen in der Zweikampfquote über Halbspielzeiten zu beobachten, betrachten wir also die Zahl der Foulspiele.

Vergleicht man Foulspiele über die beiden Halbserien 18/19 miteinander so sieht man, dass diese konsistent bei etwa 9 Fouls pro Spiel liegen und unter Rose eine signifikante Erhöhung von ca 35% stattgefunden hat. Dies ist sicherlich auf das neuerworbene Pressing im Spiel der Borussia zurückzuführen und damit letztendlich eine Auswirkung des neuen Trainerteams. Bei #S04 gibt es keine signifikante Veränderung, hier liegt man exakt auf dem Niveau der Rückrunde unter H.Stevens.

Insgesamt liegen beide Teams bei der Zahl der begangenen Fouls im Mittelfeld der Liga, und die Borussia ist das Team, dass am meisten gefoult wurde.

Die Art des Passspiels lässt sich an der Ballbesitz- und Passquote statistisch quantifizieren. Allerdings sind beide Quoten miteinander korreliert, wie die folgende Grafik zeigt.

Hohe Ballbesitz- und Passquote sind oft kennzeichnend für dominante Teams, aber die Argumentationsketten sind hier genau umgekehrt, weil diese Teams dominant und formal stärker aufgestellt sind, überlässt man diesen Teams eher den Ball und versucht über andere Qualitäten dagegenzuhalten. Besitzt ein Team eine hohe Ballbesitzquote, so folgt dadurch in der Regel auch eine hohe Passquote, weil eben viele Pässe in Zonen geschehen in denen ballbesitzschwache Teams ihnen dies zugestehen.

In den beiden folgenden Grafiken sind Ballbesitz- und Passquote für alle Teams wieder im Saisonvergleich dargestellt.

Für das Passspiel gilt ähnliches wie für die Zweikampfquote, es gibt kaum signifikante Änderungen zwischen den Spielzeiten. Die einzigen bemerkenswerten Veränderungen gibt es beim #FCA und #RBL zu beobachten. Der Ballbesitz der Augsburger reduzierte sich signifikant ($p=0.009$) um relativ fast 20% und auch die Passquote ($p=0.053$) fiel nochmals auf nur noch 73%, womit der #FCA in beiden Quoten deutlich am Ende der Tabellen steht. Eine Besonderheit fällt bei den Leipzigern auf, der Ballbesitz hat sich nicht signifikant ($p=0.25$) verändert, aber die Passquote wurde deutlich und signifikant ($p=0.002$) um absolute 6% auf nun 84.2% gesteigert.

#BMG und #S04

Auch im Detailvergleich von Halbspielzeiten gibt es wenig Signifikantes zu beobachten. Beim Ballbesitz gibt es bei den Schalkern im Vergleich zum extrem defensiven Auftreten unter H.Stevens eine schwach signifikante ($p=0.02$) Steigerung um 5%.

Signifikant ($p=0.003$) hat sich die Passquote der Gladbacher von der letztjährigen Rückrunde zu dieser Hinrunde verschlechtert. Dies ist sicherlich auf das deutlich risikoreichere und schnellere Passspiel der Borussia zurückzuführen.

Trainerwechsel und Spielstiländerungen in der Saison 19/20

Box-Plots und Statistik

Laufdaten

#BMG und #S04

FC Bayern München

Zweikampf

#BMG und #S04

Passspiel

#BMG und #S04

4. Teil - Offensive

5. Teil - Defensive

BStat