Stress Classification from ECG Signals Using Vision Transformer

Diese Arbeit stellt eine neue Methode zur Stressklassifizierung aus ECG-Signalen vor, die Rohdaten in 2D-Spektrogramme umwandelt und mit einem Vision Transformer verarbeitet, um durch die Behandlung von Intersubjektivität eine überlegene Genauigkeit im Vergleich zu CNN-basierten Modellen und bisherigen State-of-the-Art-Methoden zu erzielen.

Zeeshan Ahmad, Naimul Khan

Veröffentlicht 2026-03-31
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Das große Problem: Jeder Herzschlag ist anders

Stellen Sie sich vor, Sie wollen einen Stress-Test für alle Menschen der Welt entwickeln. Das Problem ist: Jeder Mensch ist einzigartig.
Wenn Person A gestresst ist, schlägt ihr Herz vielleicht schnell und unregelmäßig. Person B wird bei Stress aber nur etwas ruhiger, aber mit einem anderen Rhythmus.

Frühere Computer-Modelle (die sogenannten „CNNs" oder Faltungsnetzwerke) waren wie starre Schablonen. Sie suchten nach einem ganz bestimmten Muster. Wenn das Muster bei Person A passte, aber bei Person B leicht anders aussah, war das Modell verwirrt und machte Fehler. Das nennt man „Zwischen-Personen-Variabilität". Es ist, als würde man versuchen, mit einem einzigen Schlüssel alle Türen auf der Welt zu öffnen – das funktioniert einfach nicht.

Die Lösung: Ein neuer Blickwinkel (Der Vision Transformer)

Die Forscher aus diesem Papier haben eine geniale Idee gehabt: Warum versuchen wir nicht, das Herzsignal wie ein Bild zu betrachten?

  1. Der Verwandlungszauber (Von 1D zu 2D):
    Normalerweise ist ein EKG-Signal eine flache Linie (1D). Die Forscher haben diese Linie in ein Schaubild umgewandelt (ein Spektrogramm).

    • Die Analogie: Stellen Sie sich vor, Sie haben ein Musikstück. Wenn Sie nur die Lautstärke über die Zeit aufschreiben, hören Sie nichts. Aber wenn Sie ein Klangbild (wie ein Regenbogen aus Farben) erstellen, sehen Sie sofort, welche Töne (Frequenzen) wann laut oder leise sind.
    • Bei Stress sieht dieses „Herz-Klangbild" anders aus als bei Entspannung. Die wichtigen Informationen sind jetzt als Muster und Formen sichtbar, nicht nur als Zahlenreihe.
  2. Der neue Detektiv (Der Vision Transformer):
    Hier kommt der Held des Papers ins Spiel: Der Vision Transformer.

    • Die Analogie: Stellen Sie sich einen alten Detektiv (das alte CNN) vor, der nur auf die Form eines Objekts achtet. Wenn der Täter eine Jacke trägt, die er sonst nicht trägt, erkennt er ihn nicht.
    • Der Vision Transformer ist wie ein super-intelligenter Detektiv mit einem magischen Suchscheinwerfer (Aufmerksamkeits-Mechanismus). Er schaut sich das ganze Bild an und fragt sich: „Wo sind hier die wirklich wichtigen Details? Was ist nur Hintergrundrauschen?"
    • Er ignoriert die kleinen Unterschiede zwischen den Personen (z. B. ob Person A etwas schneller atmet als Person B) und konzentriert sich nur auf das, was wirklich Stress bedeutet.

Wie haben sie es getestet?

Die Forscher haben zwei große Datensätze benutzt (WESAD und RML), in denen viele verschiedene Menschen unter Stress gesetzt wurden (z. B. durch schwierige Aufgaben oder lustige Videos).

  • Der Test: Sie haben das Modell trainiert, indem sie Daten von fast allen Personen benutzt haben, und dann getestet, ob es die eine Person erkennt, die es noch nie gesehen hat. Das ist der härteste Test von allen (man nennt das „Leave-One-Subject-Out").
  • Das Ergebnis:
    • Die alten Modelle (CNNs) haben oft gescheitert, weil sie von Person zu Person verwirrt waren.
    • Der neue Vision Transformer war ein Gewinner. Er hat die Stress-Signale so gut erkannt, dass er alle bisherigen Rekorde gebrochen hat.
    • Die Zahlen: Bei der Unterscheidung von „Entspannt", „Mittel gestresst" und „Hoch gestresst" lag die Trefferquote bei über 76 % (bei WESAD) und 71 % (bei RML). Bei der einfachen Frage „Stress oder kein Stress?" lag sie sogar bei 88 %.

Warum ist das wichtig?

Stellen Sie sich vor, Sie tragen eine Smartwatch wie eine Apple Watch.

  • Heute: Diese Uhren können oft nur grob sagen, ob Ihr Puls hoch ist. Sie wissen nicht genau, ob Sie nervös sind, weil Sie einen Termin haben, oder weil Sie gerade Sport machen.
  • Zukunft: Mit dieser neuen Methode könnte die Uhr den Stress wirklich verstehen, auch wenn Sie eine Person sind, die bei Stress einen ganz anderen Herzschlag hat als Ihr Nachbar. Der Computer lernt, das „wichtige Signal" vom „persönlichen Rauschen" zu trennen.

Zusammenfassung in einem Satz

Die Forscher haben das Herzsignal in ein Bild verwandelt und einen KI-Algorithmus (Vision Transformer) benutzt, der wie ein scharfer Beobachter die echten Stress-Signale findet, egal wie unterschiedlich die Herzen der Menschen schlagen – und damit alle bisherigen Methoden deutlich übertroffen.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →