Velocity and stroke rate reconstruction of canoe sprint team boats based on panned and zoomed video recordings

Diese Studie stellt ein automatisiertes, auf KI-basierendes Framework vor, das mittels YOLOv8, U-Net und optischem Fluss aus gepanzerten und herangezoomten Videoaufnahmen präzise Geschwindigkeits- und Schlagfrequenzprofile für Kanusprint-Teamboote rekonstruiert und damit eine GPS-unabhängige Leistungsanalyse ermöglicht.

Julian Ziegler, Daniel Matthes, Finn Gerdts, Patrick Frenzel, Torsten Warnke, Matthias Englert, Tina Koevari, Mirco Fuchs

Veröffentlicht 2026-02-27
📖 5 Min. Lesezeit🧠 Tiefgang

Each language version is independently generated for its own context, not a direct translation.

Titel: Wie man aus einem Videoband ein digitales Tacho- und Herzfrequenzgerät für Kanus macht

Stellen Sie sich vor, Sie schauen sich eine Kanuregatta am Fernseher an. Sie sehen die Boote, die wie Pfeile über das Wasser schießen. Aber was Sie nicht sehen, sind die genauen Zahlen: Wie schnell ist das Boot genau in diesem Moment? Wie oft schlägt der Paddler pro Minute? Und wie synchronisiert ist die Mannschaft?

Normalerweise braucht man dafür teure Sensoren an Bord der Boote oder GPS-Geräte, die oft nicht für alle Teilnehmer verfügbar sind. Die Forscher aus Leipzig haben nun eine Lösung entwickelt, die so etwas wie eine „magische Brille" für Videokameras ist. Sie können aus ganz normalen, oft gewackelten und herangezoomten Fernsehaufnahmen (wie man sie vom Ufer aus filmt) präzise Daten extrahieren.

Hier ist die Erklärung, wie das funktioniert, ohne Fachchinesisch:

1. Das Problem: Die „Verzerrte Linse"

Wenn Sie ein Boot vom Ufer aus filmen, das sich bewegt, passiert etwas Seltsames: Das Boot sieht am Anfang des Videos groß aus und am Ende klein, oder es wird schief dargestellt, weil die Kamera schwenkt.

  • Die Analogie: Stellen Sie sich vor, Sie schauen durch ein Fernglas, das Sie ständig bewegen. Ein Boot, das eigentlich geradeaus fährt, sieht auf dem Bildschirm wie eine schräge Linie aus. Wenn man das Boot manuell vermessen wollte, müsste man Stunden damit verbringen, Linien zu ziehen und zu rechnen – ein Albtraum für Trainer.

2. Die Lösung: Ein digitales Gitternetz (Homographie)

Die Forscher nutzen die Bojen im Wasser als Ankerpunkte.

  • Die Analogie: Stellen Sie sich das Wasser als ein riesiges, unsichtbares Schachbrett vor. Die Bojen sind die Eckpunkte der Felder. Die KI (ein Computerprogramm) lernt, wie dieses Schachbrett auf dem verzerrten Fernsehbild aussieht. Sobald sie weiß, wie die Bojen liegen, kann sie das gesamte Bild „geradebiegen" und jedem Punkt auf dem Wasser eine echte Koordinate zuweisen.
  • Das Ergebnis: Aus dem schiefen Video wird eine perfekte, gerade Landkarte.

3. Das neue Talent: Das Boot „am Kopf" erkennen

Früher haben die Forscher nur Einzelpaddler (K1/C1) vermessen. Bei Mannschaftsbooten (K2, K4) wird es kompliziert, weil mehrere Paddler nebeneinander sitzen und sich überlappen. Wo ist eigentlich die „Nase" des Bootes?

  • Die Analogie: Früher haben sie gesagt: „Der Paddler ist hier, also ist die Bootsnase 2,4 Meter weiter vorne." Das war wie eine Schätzung mit dem Daumen.
  • Die neue Methode: Sie haben eine spezielle KI (ein U-Net, nennen wir es den „Boot-Schnüffler") trainiert. Dieser Schnüffler schaut sich kleine Bildausschnitte an und sagt genau: „Aha, hier ist die spitze Nase des Bootes!" Er lernt für jedes Boot individuell, wie weit die Paddler von der Spitze entfernt sitzen. Das ist viel genauer als eine Faustregel.

4. Wenn jemand aus dem Bild fällt (Robustes Tracking)

Manchmal verdeckt eine Welle einen Paddler, oder die Kamera zoomt so stark, dass einer kurzzeitig unsichtbar ist. Was passiert dann?

  • Die Analogie: Stellen Sie sich vor, Sie verfolgen eine Gruppe von Freunden, die durch einen Park laufen. Wenn einer kurz hinter einem Baum verschwindet, wissen Sie trotzdem, wo er ist, weil Sie wissen, wie schnell die anderen laufen und in welcher Reihenfolge sie gehen.
  • Die Technik: Die KI nutzt einen „optischen Fluss". Das ist wie ein unsichtbarer Faden, der die Paddler von Bild zu Bild verbindet. Wenn ein Paddler kurz verschwindet, rechnet die KI aus, wo er sein müsste, basierend auf der Bewegung der anderen. So bleibt die Spur nie unterbrochen.

5. Der Taktgeber: Wie oft paddeln sie?

Neben der Geschwindigkeit wollen Trainer wissen: Wie schnell schlägt der Paddler?

  • Methode A (Der Profi): Die KI schaut sich die Schultern und Handgelenke der Paddler an (Pose Estimation). Sie misst den Abstand zwischen Schulter und Hand. Wenn die Hand nach vorne geht, ist das ein Schlag. Das ist sehr genau, aber rechenintensiv (wie ein hochauflösendes 3D-Modell).
  • Methode B (Der Schnellkochtopf): Die KI schaut nur auf den hellen Fleck, der durch das Paddeln im Bild entsteht. Das ist weniger genau, aber viel schneller.
  • Das Ergebnis: Die „Profi-Methode" ist fast so gut wie ein Sensor am Paddler selbst, aber sie braucht keine Hardware an Bord.

Warum ist das wichtig?

Stellen Sie sich vor, ein Trainer hat nur ein altes Handy und ein Videoband von einem Wettkampf. Früher konnte er nur sagen: „Das war ein gutes Rennen."
Mit dieser Methode kann er jetzt sagen: „Im letzten Viertel war das Boot 0,1 Sekunden pro Sekunde langsamer als geplant, und die Mannschaft hat ihre Schlagfrequenz zu früh erhöht."

Das ist wie ein digitaler Co-Trainer, der aus jedem Handyvideo ein hochpräzises Analyse-Tool macht. Es ist kostenlos (keine Sensoren nötig), funktioniert für alle Bootsklassen (von Solo bis 4-Mann-Team) und liefert Daten, die fast so gut sind wie teure Messgeräte.

Kurz gesagt: Die Forscher haben einen Weg gefunden, aus dem „chaotischen" Fernsehbild eine präzise mathematische Welt zu bauen, in der jeder Meter und jeder Paddelschlag genau gemessen werden kann.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →