xGoals Effizienz der Borussia im Vergleich

In einem früheren Artikel haben wir die Tor-Effizienz der Borussia analysiert. Dies wollen wir hier nun fortführen und der Frage nachgehen, wie die Borussia aber auch die anderen Mannschaften in dieser Saison abgeschnitten hätten, wenn sie entsprechend ihrer xGoals getroffen hätten.

Tore und Gegentore pro xGoals

Wie wir gesehen haben lag der Korrelationskoeffizient zwischen erzielter Tordifferenz und der xGoals-Differenz über 4 Jahre im Bereich von ~0.60-0.65. Die Analyse betraf die Tordifferenz, die Korrelation ist demnach vergleichsweise hoch. Hier wollen wir nun die Auswirkungen der Effizienz, sowohl in der Offensive als auch in der Defensive betrachten, und schauen wie sich dies auf mögliche die Platzierungen auswirkt. Zunächst betrachten wir die Effizienz-Daten des 19. Spieltages:

Wie wir sehen liegt die Borussia in beiden Wertungen auf Platz 12. In der Offensive erzielt sie genau so viele Tore, wie nach xGoals erwartet werden. In der Defensive bekommt sie etwas mehr Tore als es sein sollten. Dies sind die aufsummierten Werte, unabhängig vom Spielausgang. Nun ist es jedoch so, dass es lokal in einzelnen Spielen zu relativ großen Abweichungen in den gefallenen Toren zu den zugehörigen xGoals kommen kann. Die Mannschaften liegen dann über oder unter ihrer Leistung, über-performen bzw. unter-performen. Über eine Saison wird sich dies ausgleichen, wenn es statistisch verteilt ist. Liegt eine Mannschaft aber dauerhaft unter ihrer Leistung wird sie ein Defizit haben, liegt sie darüber wird sie effizient sein. Beide Effekte sollten in einer diesbezüglichen Tabelle beobachtet werden können.

Gerundete xGoals

Um eine solche Tabelle zu erzeugen müssen wir die xGoals (xG), die keine ganzen Zahlen sind, in Tore (T) also ganze Zahlen umwandeln. Die erste naheliegende Methode wäre einfach eine normale Rundung der xGoals (0-0.49 xG = 0T, 0.5-1.49 xG = 1T, …). Zunächst stellt man fest, dass insgesamt 455.9xG erzielt wurden, bei $S_T:=477$ tatsächlich geschossenen Toren. Rundet man wie angegeben, dann ergibt sich die gerundete Summe der xGoal-Einzelergebnisse zu:

$$ S_{xG}(0) := \sum_i R(T_i) = 445 $$

Hier sind die Spiele mit $i$ nummeriert und $R$ repräsentiert die Rundungsfunktion. Es ergeben sich damit nochmals deutlich weniger Tore. Dies wollen wir kompensieren. Addieren wir zu $T_i$ eine konstante Zahl $d>0$ und bilden die Summe:

$$ S_{xG}(d) := \sum_i R(T_i +d) $$

dann ist $d$ so etwas wie ein Effizienz-Term, der zum Beispiel berücksichtigt, dass Tore gelegentlich auch durch Zufall bzw. Glück fallen. Die Frage ist, wie wählt man $d$? Die Wahl ist offenbar willkürlich und es gibt kein a priori Kriterium. Wir wählen $d$, so dass gilt: $S_{xG}(d) \simeq S_{T}$ oder genauer:

$$ d = \min_{d'\in]0,1/2[} |S_T - S_{xG}(d') | $$

Damit wäre die Summe der gerundeten xGoals annähernd gleich der Summe der tatsächlich geschossenen Tore. Führt man dies durch, so gelangt man zu $d=0.06$ mit $S_{xG}(0.06) = 476$.

Schauen wir uns die Auswirkungen der beiden Rundungen auf die Extremfälle aller Spiele bis zum 19.Spieltag an. Das sind solche Spiele, bei denen sich das Ergebnis (für $d=0.06$) von einem Sieg zu einer Niederlagen umkehrt. Dies sind insgesamt 13 Spiele (5 Heimsiege und 8 Auswärtssiege):

Spiel Ergebnis xGoals-Ergebnis xG(d=0) xG(d=0.06)
HBS - VFB 2 : 0 0.44 : 0.88 0 : 1 1 : 1
TSG - FCB 2 : 0 0.61 : 1.51 1 : 2 1 : 2
M05 - HSV 3 : 2 1.25 : 1.99 1 : 2 1 : 2
VFB - BVB 2 : 1 1.14 : 1.79 1 : 2 1 : 2
VFB - HBS 1 : 0 0.28 : 0.53 0 : 1 0 : 1
FCK - EFR 0 : 1 1.84 : 1.33 2 : 1 2 : 1
BMG - LEV 1 : 5 2.50 : 2.24 3 : 2 3 : 2
BVB - FCB 1 : 3 1.89 : 1.28 2 : 1 2 : 1
HBS - EFR 1 : 2 1.15 : 0.42 1 : 0 1 : 0
BVB - WER 1 : 2 1.87 : 0.94 2 : 1 2 : 1
EFR - FCB 0 : 1 0.49 : 0.36 0 : 0 1 : 0
HSV - EFR 1 : 2 1.79 : 1.02 2 : 1 2 : 1
RBL - HBS 2 : 3 2.67 : 1.86 3 : 2 3 : 2

Der Borussia-Fan erinnert sich mit Grausen an das Heimspiel gegen Leverkusen. Dort war die Borussia in der ersten Hz drückend überlegen und erspielte sich zahlreiche Torchancen ohne diese entsprechend in Tore umzumünzen. In der zweiten Hz erzielte jedoch Leverkusen praktisch mit jedem Torschuss auch ein Tor und die Borussia stellte den Spielbetrieb weitgehend ein. Insgesamt ergab sich ein xGoal-Ergebnis von 2:50:2.24. Die Borussia hätte also sowohl für $d=0$ als auch $d=0.06$ das Spiel 3:2 gewinnen müssen/sollen.

Ein Unterschied in den Ergebnissen zwischen $d=0$ und $d=0.06$ liegt beim Spiel EFR-FCB vor. Nach der ersten Rundungsregel wäre das xGoal-Ergebnis 0:0, nach der zweiten 1:0. Tatsächlich hat Bayern 0:1 gewonnen, Bayern war also effizient, wenn man sich die xG-Daten ansieht.

Tabellen und xGoals-Tabellen

Schauen wir uns nun die Auswirkung der gerundeten xGoal-Ergebnisse im Vergleich an. Die erste Tabelle ist die des 19.Spieltages. Die anderen beiden Tabellen sind die gerundeten xGoals-Tabellen.

Bevor wir zur Analyse der Borussia kommen, schauen wir uns die insgesamt markantesten Änderungen an. Die absolut größte Verschiebung, die wahrscheinlich mit großer Sicherheit außerhalb einer rein statistischen Schwankung liegt, betrifft den BVB. Dieser hätte 16 bzw. 14 Punkte mehr und würde im ersteren Fall sogar an den Bayern vorbei ziehen. Erinnert man sich an viele Spiele der Dortmunder, in der sie unzählige Chancen haben liegen lassen, so ist dieses Ergebnis nachvollziehbar, in dieser Ausprägung jedoch mehr als erstaunlich. Dabei ist es interessant, dass es sowohl in den geschossenen Toren als auch in den Gegentoren große Verschiebungen gibt. Sie hat also nicht nur ein Offensiv-Problem, sondern auch ein Defensiv-Problem. Sagen wir so, sie hat die Spiele also nicht nur ver'aubameyang't sondern sicher auch ver'barta'rt bzw ver'zagadou'riert!

Erstaunlich ist, dass der HSV mit 8 bzw 9 Punkten in den xG-Tabellen besser liegt! Schaut man sich die Daten an, dann ist es beim HSV eindeutig ein Offensiv-Problem, da haben sich die verantwortlichen im Sturm vielleicht verhahnt.

Der nächst heftigste Fall betrifft die Mainzer, hier geht's jedoch in die andere Richtung. Mainz hat 7 bzw 6 Punkte weniger in den xG-Tabellen. Hier liegt es in erster Linie an den deutlich mehr erzielten Toren, sie haben offensiv über-performed. Ebenso über-performed hat Red Bull mit 4 bzw 5 Punkten mehr als erwartet. Für die so oft und mittlerweile sicher nicht mehr ganz gerechtfertigt bemitleideten Kölner, gibt es 5 bzw 3 Punkte mehr. Insgesamt sind die restlichen Verschiebungen im Rahmen von $\pm (1-3)$ Punkten. Diese Größenordnung ist vermutlich statistischer Natur. Schalke, RBL, die TSG, Hannover und Wolfsburg haben leicht über-performed [$\simeq +(3-5)P$] und Augsburg, HSV und Hertha leicht unter-performed [$\simeq - (3-5)P$].

Kommen wir abschließend zur Borussia. Die Borussia hätte einen Punkte weniger oder 2 Punkte mehr haben können und bei den Toren bleibt alles etwa so wie es nach der regulären Tabelle ist. Im Rahmen der zuvor diskutierten Ergebnisse kann man damit statistisch nicht schlussfolgern, dass die Borussia über- oder unter-performed hat, sie hat also anders als gefühlt nichts ver'hazard'iert.

Fazit

Bei der Borussia ist im Vergleich zu vielen anderen Mannschaften im Wesentlichen alles normal gelaufen. Die Leistung des BVB in dieser Saison ist jedoch statistisch außerhalb einer normalen Schwankung einfach schlecht, hier defiziert es praktisch von vorne bis hinten. Ähnlich, wenn auch nicht ganz so drastisch, sieht es beim HSV aus.

Bezüglich des Rundungsverfahren scheint es sinnvoller zu sein die zweite Rundung ($d=0.06$) zu verwenden. In diesem Fall sind die Schwankungen in der Tabelle kleiner und haben ein etwas geringeres Ausmaß in den Punktabweichungen. Deswegen werden wir in den Tabellen zukünftig die $xG(d=0.06)$-Tabellen zum Vergleich angeben. Nach dem Ende der Saison 2017/18 wird es eine erneute Überprüfung und Bewertung der Ergebnisse geben.


Zum Schluss sollte man jedoch frei nach Lodda sagen: Wäre, wäre - Fahrradkette

  • Zuletzt geändert: 2018/02/09 07:24
  • von admin