Optimizing Split Learning Latency in TinyML-Based IoT Systems

Dieser Beitrag stellt den ersten experimentellen Latenz-Benchmark für TinyML-basiertes Split Learning auf ESP32-S3-Boards vor und zeigt, dass ein vorgeschlagener Beam-Search-basierter Algorithmus unter Verwendung des ESP-NOW-Protokolls die End-to-End-Inferenzlatenz durch Optimierung der Aufteilungspunkte über verschiedene Modelle und Kommunikationsprotokolle hinweg effektiv minimiert.

Ursprüngliche Autoren: Zied Jenhani, Mounir Bensalem, Jasenka Dizdarević, Admela Jukan

Veröffentlicht 2026-05-07
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Ursprüngliche Autoren: Zied Jenhani, Mounir Bensalem, Jasenka Dizdarević, Admela Jukan

Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst oder gebilligt. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie haben einen sehr intelligenten, aber winzigen Roboter (wie eine intelligente Kamera an einer Türklingel), der ein komplexes Rätsel lösen muss, etwa das Erkennen eines Gesichts. Das Problem ist, dass dieser Roboter klein ist, einen winzigen Akku und ein schwaches Gehirn hat. Wenn Sie ihn bitten, das gesamte Rätsel allein zu lösen, wird es ewig dauern, oder er könnte den Akku vor dem Abschluss verlieren.

Dieser Artikel untersucht einen cleveren Workaround namens Split Learning. Anstatt den winzigen Roboter alles erledigen zu lassen, teilen Sie die Aufgabe in zwei Hälften. Der Roboter erledigt den ersten, einfachen Teil des Rätsels und ruft dann die „Hinweise", die er gefunden hat, zu einem größeren, stärkeren Roboter in der Nähe (wie einem intelligenten Lautsprecher oder einem lokalen Server). Der größere Roboter beendet den schwierigen Teil des Rätsels und ruft die Antwort zurück.

Die Autoren dieses Artikels wollten herausfinden, welcher schnellste Weg ist, um dieses Rufen-und-Hören-Spiel mit echter, energieeffizienter Hardware zu realisieren (speziell ESP32-S3-Boards, die günstige, quelloffene Mikrocontroller sind).

Hier ist eine Aufschlüsselung ihrer Erkenntnisse mit einfachen Analogien:

1. Das „Rufen"-Problem: Die Wahl des richtigen Protokolls

Wenn der winzige Roboter seine Hinweise an den großen Roboter sendet, muss er eine „Sprache" oder eine „Zustellmethode" für die Datenübertragung wählen. Die Forscher testeten vier verschiedene Methoden, wie bei der Wahl zwischen verschiedenen Postdiensten:

  • UDP: Wie das Senden einer Postkarte. Es ist sehr schnell, weil Sie nicht auf eine Bestätigung warten müssen, aber wenn die Karte verloren geht, wissen Sie es nicht.
  • TCP: Wie ein Einschreiben. Es ist sehr zuverlässig (Sie erhalten eine Bestätigung), dauert aber länger wegen all des „Handshake"-Papierkrams vor dem Versenden des Briefes.
  • BLE (Bluetooth): Wie ein langsames, plapperndes Walkie-Talkie. Es verbindet sich gut, benötigt aber lange zum Aufbauen des Gesprächs und sendet Daten in sehr kleinen, fragmentierten Häppchen.
  • ESP-NOW: Wie ein spezialisierter, hochgeschwindigkeits-Walkie-Talkie, der keine formale Verbindung vorab aufbauen muss. Es schreit die Nachricht einfach heraus.

Der Gewinner: Überraschenderweise war ESP-NOW insgesamt am schnellsten. Obwohl es eine kleine „Umschlag"-Größenbegrenzung hat (es kann nicht riesige Datenblöcke auf einmal transportieren), spart es so viel Zeit durch das Überspringen des formalen Verbindungsaufbaus, dass es die anderen schlägt. Es schaffte die Hin-und-Rück-Reise (Hinweise senden und Antwort erhalten) in etwa 3,6 Sekunden, während Bluetooth über 10 Sekunden benötigte.

2. Das „Schneiden"-Problem: Wo wird die Aufgabe geteilt?

Die Forscher mussten auch entscheiden, genau wo das Rätsel geteilt wird.

  • Zu früh schneiden: Der winzige Roboter macht fast nichts, muss aber einen riesigen Haufen Hinweise an den großen Roboter senden. Dies verstopft das Netzwerk.
  • Zu spät schneiden: Der winzige Roboter macht fast alles, was für sein schwaches Gehirn zu lange dauert.

Sie testeten verschiedene „Schnittpunkte" in zwei beliebten KI-Modellen (MobileNet-V2 und ResNet50). Sie fanden heraus, dass der beste Ort zum Schneiden vom Modell und vom Netzwerk abhängt, aber im Allgemeinen wollten sie die „Goldilocks"-Zone finden, in der der winzige Roboter genau genug Arbeit leistet, ohne das Netzwerk zu überlasten.

3. Der „Intelligente Planer": Beam Search

Den perfekten Schnittpunkt zu finden, ist wie der Versuch, den besten Weg durch ein Labyrinth zu finden.

  • Brute Force: Jeden einzelnen möglichen Weg auszuprobieren. Dies garantiert den besten Weg, dauert aber ewig (Tage) zur Berechnung.
  • Greedy Search: Den ersten Weg zu nehmen, der gut aussieht. Es ist schnell, aber Sie könnten später in einer Sackgasse stecken bleiben.
  • Beam Search (Der Gewinner): Stellen Sie sich vor, Sie erkunden das Labyrinth, aber statt jeden Weg zu prüfen, behalten Sie zu jedem Zeitpunkt nur die top 3 vielversprechendsten Wege im Blick. Wenn ein Weg schlecht aussieht, verwerfen Sie ihn. Wenn ein Weg gut aussieht, behalten Sie ihn und erkunden ihn weiter.

Die Forscher entwickelten einen Algorithmus mit dieser Beam Search-Methode.

  • Das Ergebnis: Es fand fast sofort einen nahezu perfekten Weg (in etwa 0,1 Sekunden für eine Gruppe von 5 Geräten).
  • Warum es wichtig ist: Es ist schnell genug für den Einsatz in Echtzeitsystemen, im Gegensatz zur „Brute Force"-Methode, die Stunden oder Tage für die Berechnung desselben Ergebnisses benötigen würde.

Zusammenfassung des „Rezepts"

Der Artikel schließt mit einem einfachen Rezept, wie diese winzigen IoT-Geräte effizient zusammenarbeiten können:

  1. Verwenden Sie ESP-NOW für die Kommunikation, da es die langweiligen Einrichtungsschritte überspringt und für Hin-und-Rück-Reisen am schnellsten ist.
  2. Verwenden Sie den Beam Search-Algorithmus, um automatisch zu entscheiden, wo das KI-Modell geteilt wird. Dies stellt sicher, dass der winzige Roboter und der große Roboter die Arbeit auf die zeitlich effizienteste mögliche Weise teilen.

Durch die Kombination der richtigen „Rufmethode" (ESP-NOW) mit einem intelligenten „Planer" (Beam Search) gelang es ihnen, diese winzigen, energieeffizienten Geräte komplexe KI-Rätsel viel schneller als zuvor lösen zu lassen, ohne die Hardware upgraden zu müssen.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →