statistik:netzdiagramme

Ein Vergleich vieler verschiedener Spieldaten miteinander ist schwierig bis unmöglich, da zum einen Äpfel mit Birnen verglichen werden und zum anderen einige Spieldaten nicht mal eine große Relevanz bezüglich des Spielergebnisses besitzen. Eine geeignete Methode solche Vergleiche durchzuführen stellt das Netzdiagramm dar. Wir unterscheiden hier Netzdiagramme für Einzelspiele und Form-Netzdiagramme gemittelt über mehrere Spiele. Das Einzel-Netzdiagramm wollen wir derart gestalten, dass es den Charakter des Spiels darstellt, das Form-Netzdiagramm derart, dass es den Spielstil und die Form je zweier Teams miteinander vergleicht. Bei der Auswahl der Spieldaten ist zu bedenken, dass nicht für alle Wettbewerbe immer dieselben Spieldaten verfügbar sind.

Beim Einzelspiel-Netzdiagramm gilt es nun den Charakter des Spiels darzustellen. Nicht alle Spieldaten sind für das Spielergebnis gleich bedeutend. Einige der Spieldaten sind stark korreliert, nichtsdestotrotz werden wir auch solche Spieldaten aufnehmen, um einen umfassenden Eindruck des Spielcharakters zu erhalten. Aus den verfügbaren Spieldaten beschränken wir uns auf: Ballbesitz, Anzahl der Pässe, Passquote, Zweikampfquote, Zahl der begangenen Fouls, Zahl der Sprints, die Laufleistung in km, xGoals, Torschüsse und Ecken.

Bei der Konstruktion und späteren Interpretation des Netzdiagramms ist zum einen die Anordnung der Spieldaten wichtig, zum anderen die Größe der durch die Linien eingeschlossenen Fläche.

  • Wir wählen die Anordnung möglichst so, dass stärker korrelierte Daten nebeneinander liegen. Dadurch entsteht tendenziell ein runderes Diagramm.
  • Die Größe der Fläche soll so etwas wie Dominanz oder Überlegenheit ausdrücken. Das bedeutet, dass innen im Diagramm immer für das Spiel die schlechten Werte liegen und außen im Diagramm die guten. Das bedingt, dass für Foulspiele die Skala herumgedreht wird.
  • Einige der Spieldaten haben natürliche obere und untere Grenzen, etwa Ballbesitz und Zweikampfquote, andere haben nur eine untere Grenze. Allen Spieldaten gemein ist, dass sie eine natürliche Spannweite besitzen, die aber selbst bei den Spieldaten, die eine obere und untere Grenze besitzen, stark unterschiedlich ausgeprägt sein kann. Die Zweikampfquote variiert deutlich weniger als die Ballbesitzquote und spannt somit einen anderen Bereich auf. Bei den Spieldaten die keine obere Grenze haben sind wir gezwungen eine solche zu wählen. Um alle diese Aspekte zu vereinheitlichen, wählen wir die Grenzen des inneren und äußeren Rings, sodass etwa 90-95 % der Spieldaten innerhalb dieser beiden Ringe liegen. Liegt ein Wert außerhalb dieser Grenzen, so ist das absolut außergewöhnlich und damit direkt interpretierbar und springt direkt ins Auge. Zudem wird in dieser Form die komplette Fläche ausgenutzt und keine Flächen verschenkt.
  • Um eine leichtere Ablesbarkeit der Zahlen zu gewährleisten, ist zusätzlich darauf geachtet worden, dass die Stückelung der einzelnen Skalen und deren Unterteilungen schnell visuell erkennbar ist.

Aus den dargestellten Gründen folgt die Wahl der Skalen wie folgt:

  • Ballbesitz = 30, 40, … , 80
  • Pässe = 200, 300, … , 700
  • Passquote = 40, 50, … , 90
  • Zweikampfquote = 20, 30, … ,70
  • Fouls = 24, 20, … , 4
  • Sprints = 120, 160, … , 320
  • Laufleistung km = 100, 105, …, 125
  • xGoals = 0, 1, …, 5
  • Torschüsse = 6, 10, … 26
  • Ecken = 0, 3, … 15

Schauen wir uns kurz Konsequenzen dieser Wahl der Skalen und Anordnungen für zwei ausgewählte Spiele der Saison 2019/20 an.

Wer sich an das Spiel Borussia gegen Werder Bremen erinnert, hatte die Borussia über die gesamte Spieldauer etwas mehr Spielanteile und auch insgesamt die etwas besseren Torchancen, was sich durch den höheren xGoal-Wert widerspiegelt. Trotzdem hätte das Spiel durchaus auch 2:2 enden können, kein Team war wirklich dominant.

Ein gänzlich anderes Spiel zeigt das Netzdiagramm des Spiels FC Bayern gegen Bayer Leverkusen. Das Spiel wurde nach dem 1:2 der Leverkusener komplett durch die Bayern dominiert, was insgesamt durch das Diagramm klar repräsentiert wird und nicht dem scheinbar daraus ableitbaren Spielergebnis entspricht!

Beim Form-Netzdiagramm gilt es die Spielform beider Teams in den letzten fünf Spielen darzustellen. Die allgemeinen Leitlinien bei der Konstruktion sind dieselben wie im Einzelspiel-Netzdiagramm. Es gibt aber andere Aspekte zu berücksichtigen:

  • Durch die Mittelung von Spieldaten haben die Spieldaten zum Teil eine deutlich kleinere Spannweite von oberer zur unteren Grenze. Die sich daraus ergeben Grenzen wählen wir wieder so, dass 90-95% aller Spieldaten in den Grenzen liegen.
  • Da es in allen Ligen einen deutlichen Heimvorteil gibt, stellen wir die letzten 5 Heimspiele den letzten 5 Auswärtsspielen gegenüber.
  • Da die Form des Teams dargestellt werden soll, ersetzen wir die uninteressanteren und weniger relevanten Spieldaten Ecken, Torschüsse, Pässe und Passquote und wählen die folgenden Spieldaten
  • Ballbesitz = 30, 40, … , 80
  • Zweikampfquote = 46, 48, … , 56
  • Foul gespielt = 20, 17, … , 5
  • gefoult worden = 5, 8, … , 20
  • xGoals = 1, 1.5, …, 3.5
  • Tore = 1, 1.5, …, 3.5
  • Gegentore = 3.5, 3, …, 1
  • Gegen xGoals = 3.5, 3, …, 1
  • Laufleistung km = 105, 109, …, 125
  • Sprints = 160, 180, … , 260

Schauen wir uns wiederum die Konsequenzen dieser Wahl der Skalen und Anordnungen für ein ausgewähltes Spiel der Saison 2019/20 an.

Das Diagramm zeigt, dass der #FCB viele Sprints macht, einen hohen Ballbesitz aufweist und ein überragendes Zweikampfverhalten zeigt. Die #Borussia andererseits zu Hause in den letzten 5 Spielen eine überragende offensive Leistung gezeigt hat. Alle Werte liegen an der äußeren Grenze des Diagramms.

In Kontrast dazu steht das Diagramm des Spiels Werder gegen Paderborn.

Viele Werte beider Teams rangieren an der unteren Grenze und unterschreiten diese im Fall der Zweikampfquote der Paderborner sogar.

Die dargestellten Netzdiagrammen bilden eine Möglichkeit den Spielcharakter bzw. die Spielform in Fußballspielen mit den verfügbaren Spieldaten grafisch darzustellen. Andere Konstruktionen von Anordnungen, Skalen oder weiteren Spieldaten sind denkbar. Die Gründe für die vorliegende Wahl ist ausführlich begründet. Eine leichte Anpassung von Skalen im Laufe der Saison ist nicht ausgeschlossen.

  • Zuletzt geändert: 2019/12/07 08:56
  • von admin