DIE GRUNDLAGE
Die Positionsdaten sind die Basis für zahlreiche Statistiken im Fußball. Ein Besuch in der Erhebungszentrale für die Offiziellen Spieldaten in Köln, bei dem deutlich wird: Es kommt auf höchste Präzision an.
Text Mats Kosik
Fotos exklusiv für das DFL MAGAZIN Sabrina Weniger
Die Vorbereitungen beginnen bereits Stunden vor dem Spiel. Ob im Vorfeld der Begegnung Anfang April zwischen dem FC Bayern München und Borussia Dortmund oder jedes anderen Spiels in der Bundesliga und 2. Bundesliga. Der Prozess ist über Jahre erprobt, die Abläufe sind perfekt aufeinander abgestimmt.
An diesem Nachmittag checkt ein Operator (englisch: „Anwendende“ oder „Anwender“) aus der Erhebungszentrale für die Positionsdaten in Köln per Fernsteuerung als Erstes, ob alle 16 Tracking-Kameras in der Allianz Arena funktionieren. Jeweils sechs von ihnen hängen auf den Geraden, weit oben, um möglichst viel vom Spielfeld einfangen zu können, zwei weitere jeweils hinter den Toren. In manchen Stadien sind es sogar bis zu 20. Jede einzelne wird angesteuert, bewegt, das Kamerabild überprüft. Alles passt.
60 Minuten vor Spielbeginn startet der Operator dann den sogenannten Kalibrierungsprozess. Klick für Klick wird jedes Kamerabild über die Steuerungssoftware angewählt und anhand eines Markers mit Referenzpunkten an der Spielfeldmarkierung ausgerichtet, also zum Beispiel an allen vier Ecken des Spielfeldes. Um möglichen Bildausfällen vorzubeugen, werden immer jeweils zwei Kameras mit demselben Eckpunkt verknüpft, beispielsweise mit einer Ecke des Strafraums.
Am Ende der Kalibrierung entsteht so aus dem Spielfeld ein virtueller dreidimensionaler Raum, in dem die Spieler beider Mannschaften und der Ball getrackt werden.
Ballbesitzzeiten, Laufdistanzen, die Sprintanzahl oder auch verschiedene Bundesliga Match Facts wie der „Speed-Alarm“ oder die „Realformation“ – Grundlage für all diese Metriken sind die in Köln zusammenlaufenden Positionsdaten, die von der Sportec Solutions erhoben werden. Das Unternehmen nutzt dafür das TRACAB-System der gleichnamigen schwedischen Firma, die ihrerseits zu ChyronHego gehört. TRACAB ist ein automatisiertes Bilderkennungssystem, das mithilfe von künstlicher Intelligenz und Machine Learning aus Kamerabildern Daten erzeugt. Momentan ist in der Bundesliga und 2. Bundesliga die fünfte Generation des Systems im Einsatz – die ChyronHego gemeinsam mit der DFL und Sportec Solutions entwickelt und zuerst in der Bundesliga eingesetzt hat.
„ChyronHego und TRACAB haben seit mehr als zwei Jahrzehnten Erfahrung im Bereich des optischen Trackings. Wir haben damit im zehnten Jahr Partner an unserer Seite, die uns Daten in herausragender Tiefe und Güte, mit einer geringstmöglichen Latenz und der höchstmöglichen Präzision liefern – und darüber hinaus gemeinsam mit uns kontinuierlich an Innovationen arbeiten“, sagt Dr. Hendrik Weber, Direktor Sport-Technologie & Innovation der DFL.
Wenige Minuten vor dem Anpfiff prüft der Operator noch einmal, ob alle Referenzpunkte verbunden sind. Diese Momente, in denen es menschliches Zutun für die Datenerhebung braucht, werden aber immer seltener. 2015 waren noch drei Operator vor Ort im Stadion, um das Trackingsystem zu unterstützen, beispielsweise bei der Spielererkennung in undurchsichtigen Situationen wie dem kollektiven Torjubel eines Teams. Zusätzlich kontrollierten damals zwei weitere Operator im Erhebungszentrum in Köln die Daten einer Begegnung. Heute sind es insgesamt nur noch zwei Personen, die gemeinsam ein Spiel betreuen. Eine unterstützt die KI, die andere überprüft die erhobenen Daten – beide befinden sich in Köln. Das System ist eingespielt, die Kameras sind fest in den Stadien installiert und die Aufgaben klar verteilt. Dass durch die „Remote-Lösung“ die Reisewege deutlich geringer ausfallen, ist zudem im Sinne ökologischer Nachhaltigkeit förderlich.
Ab dem Anpfiff unterstützt ein Operator in der Erhebungszentrale die KI dabei, die Spieler richtig zuzuordnen. Das System ist in der Lage, die Rückennummern der Spieler zu erkennen und diese mit der in den Spielinformationsdaten hinterlegten Mannschaftsaufstellung abzugleichen. Innerhalb einer Minute nach Spielbeginn müssen der Operator und das System von ChyronHego alle Profis zuordnen, in der Regel hat die optische Bilderkennung das aber noch deutlich schneller erledigt. Erkennt der Operator während des Spiels, dass eine Zuordnung fehlerhaft ist, greift er korrigierend ein und tauscht per Klick die Verknüpfungen. Dabei gehen aber niemals Daten verloren, das System ist in der Lage fehlende Sekunden nach der erneuten Zuordnung rückwirkend wiederherzustellen.
Dann beginnt die eigentliche Datenerhebung: Die 16 HD-Kameras erfassen nun die Position der Spieler und des Balls alle 40 Millisekunden, umgerechnet also 25 Mal pro Sekunde, 1.500 Mal in einer Minute.
Per Glasfaser werden die Bilder an einen Server geschickt, dort verarbeitet und binnen weniger als einer Sekunde auf den Screens in der Erhebungszentrale angezeigt. Dort sieht der Operator das Spielgeschehen in einer 2-D-Darstellung: nummerierte Kreise, die eine weiße Kugel über ein grünes Spielfeld bewegen. Schon jetzt wird gecheckt: Sind die Zuteilungen der Spieler korrekt? Stimmen die erhobenen Daten mit den vorher festgelegten Schwellenwerten zum Beispiel für einen Sprint überein? Auch darauf kommt es an, schließlich sind für die einzelnen Datenkategorien in einem Katalog der DFL bis auf das kleinste Detail Definitionen hinterlegt, die zudem laufend auf Basis wissenschaftlicher Kenntnisse überprüft werden.
Beispiel gefällig? „Ein Sprint liegt vor, wenn ein Spieler mehr als zwei Sekunden mindestens 4,0 m/s läuft und während dieser Zeit mindestens 6,3 m/s läuft, wobei zwischen dem ersten und letzten Erreichen der 6,3 m/s-Schwelle mehr als eine Sekunde liegt. Ein Sprint ist zeitlich auf die Zeitspanne begrenzt, in der die 6,3 m/s-Schwelle das erste und das letzte Mal erreicht wird. Ein neuer Sprint kann erst dann vorliegen, wenn die Schwelle von 4,0 m/s unterschritten wird.“ So lautet beispielsweise die aktuelle Definition eines Sprints im Definitionskatalog.
Aber zurück nach Köln. Dort hilft das System dem Operator, indem es potenziell fehlerhafte Daten anzeigt, die daraufhin korrigiert werden können. Zeitgleich laufen die Daten in den Match Analysis Hub der DFL ein, der vor allem von Clubs der Bundesliga und 2. Bundesliga (siehe ab Seite 26) und Medienpartnern (siehe ab Seite 30) genutzt wird. Spielanalysten und Kommentatorinnen zum Beispiel können dort schon während des Spiels Daten einsehen, beispielsweise, ob ein Profi in einer bestimmten Zeit weniger als sonst läuft oder seine Sprintgeschwindigkeit unterschreitet.
Sportec Solutions lässt die geprüften Rohdaten außerdem in Statistiken zusammenfassen, diese werden zur Ausstrahlung an Medienpartner weitergegeben oder in den eigenen Kanälen veröffentlicht.
Nach Ende der Begegnungen werden die Daten nochmals auf Richtigkeit geprüft, gegebenenfalls auf Detailebene korrigiert und wieder ausgeliefert, vor allem in den Match Analysis Hub. Mit höchster und für höchste Präzision.
DER AUTOR Mats Kosik ist Redakteur beim DFL MAGAZIN.