Rethinking Temporal Models for TinyML: LSTM versus 1D-CNN in Resource-Constrained Devices

Diese Studie zeigt, dass 1D-CNNs im Vergleich zu LSTMs für TinyML-Anwendungen auf ressourcenbeschränkten Mikrocontrollern aufgrund ihrer überlegenen Energieeffizienz, ihres geringeren Speicherbedarfs und ihrer deutlich schnelleren Inferenzzeit bei vergleichbarer oder höherer Genauigkeit die praktischere Wahl darstellen.

Bidyut Saha, Riya Samanta

Veröffentlicht 2026-03-06
📖 3 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie möchten ein kleines, batteriebetriebenes Gerät bauen – vielleicht eine Smartwatch oder einen Gesundheits-Sensor, der direkt am Körper getragen wird. Dieses Gerät soll in der Lage sein, Ihre Bewegungen zu erkennen (z. B. ob Sie laufen, sitzen oder tanzen) oder Ihren Herzschlag zu analysieren, ohne dass es Daten an die Cloud oder einen Server senden muss. Alles soll direkt auf dem kleinen Chip im Gerät passieren. Das nennt man TinyML.

Das Problem ist: Die Chips in diesen Geräten sind winzig und haben nur sehr wenig Speicher und Energie, genau wie ein kleiner Rucksack, der nur ein paar Dinge tragen kann.

Die Autoren dieses Papers, Bidyut Saha und Riya Samanta, haben sich gefragt: Welche Art von „Gehirn" passt am besten in diesen kleinen Rucksack?

Sie haben zwei berühmte Kandidaten verglichen:

  1. Der LSTM (Long Short-Term Memory): Stellen Sie sich diesen wie einen akribischen Historiker vor. Er liest jeden einzelnen Buchstaben einer Geschichte, merkt sich jeden Kontext und denkt lange nach, um das Muster zu verstehen. Er ist sehr schlau, aber er braucht einen riesigen Schreibtisch (viel Speicher) und sehr viel Zeit, um zu arbeiten.
  2. Der 1D-CNN (1D-Convolutional Neural Network): Dieser ist wie ein schneller Detektiv, der nach bestimmten Mustern sucht. Er scannt die Daten wie ein Suchbild: „Ah, hier ist ein Muster, das sieht aus wie Laufen!" Er ist weniger aufwendig, braucht weniger Platz und ist extrem schnell.

Was haben sie herausgefunden?

Die Forscher haben beide Modelle auf fünf verschiedenen Datensätzen getestet (von menschlichen Aktivitäten bis hin zu Herzdaten) und sie auf einem echten, kleinen Mikrochip (einem ESP32) laufen lassen. Das Ergebnis ist eindeutig:

  • Der Geschwindigkeitsunterschied:

    • Der LSTM-Historiker braucht für eine einzige Analyse etwa 2 Sekunden. Das ist wie ein Schneckentempo. Wenn Sie eine Smartwatch hätten, die 2 Sekunden braucht, um zu erkennen, dass Sie fallen, wäre es zu spät für einen Sturzschutz.
    • Der 1D-CNN-Detektiv braucht nur 0,027 Sekunden (27 Millisekunden). Das ist blitzschnell! Er erkennt die Bewegung sofort.
  • Der Platzbedarf (Speicher):

    • Der LSTM braucht viel mehr Platz im Rucksack (RAM und Flash-Speicher). Er ist schwer und sperrig.
    • Der 1D-CNN ist federleicht. Er braucht etwa 35 % weniger RAM und 25 % weniger Speicherplatz. Das ist, als würde man den Historiker durch einen schlanken Rucksack mit nur den wichtigsten Werkzeugen ersetzen.
  • Die Genauigkeit:

    • Man könnte denken: „Der Historiker ist doch schlauer, also ist er genauer." Aber nein! Der 1D-CNN war in fast allen Tests genauer (ca. 95 % Trefferquote) als der LSTM (ca. 89 %).
    • Besonders wichtig: Als die Forscher die Modelle für den kleinen Chip „komprimiert" haben (eine Technik namens Quantisierung, bei der man die Zahlen vereinfacht), wurde der LSTM noch dümmer und ungenauer. Der 1D-CNN blieb aber stabil und zuverlässig.

Die große Erkenntnis

Die Botschaft des Papers ist einfach: Für kleine, batteriebetriebene Geräte ist der 1D-CNN der klare Gewinner.

Der LSTM ist zwar ein mächtiges Werkzeug für große Computer, aber er ist wie ein Luxus-Sportwagen, der nicht auf einen schmalen Waldweg passt. Der 1D-CNN hingegen ist wie ein geländegängiges, sparsames Fahrrad: Er kommt überall hin, ist schnell, braucht wenig Kraft und erledigt die Aufgabe sogar besser.

Zusammengefasst: Wenn Sie intelligente Geräte bauen wollen, die direkt am Körper tragen und sofort reagieren (wie bei der Gesundheitsüberwachung oder Gestensteuerung), sollten Sie den 1D-CNN wählen. Er ist schneller, spart Batterie, braucht weniger Speicher und ist trotzdem sehr genau. Der LSTM ist für diese winzigen Geräte einfach zu schwerfällig.