OmniFall: From Staged Through Synthetic to Wild, A Unified Multi-Domain Dataset for Robust Fall Detection

Deze paper introduceert OmniFall, een unificerend benchmarkdataset met 80 uur aan gefaseerde, synthetische en echte valvideo's, om robuuste en privacy-bewuste valdetectiemodellen te trainen die goed generaliseren naar onbeheerde omgevingen.

David Schneider, Zdravko Marinov, Zeyun Zhong, Alexander Jaus, Rodi Düger, Rafael Baur, M. Saquib Sarfraz, Rainer Stiefelhagen

Gepubliceerd 2026-03-02
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een robot wilt bouwen die kan zien als iemand valt, zodat hij direct een ambulance kan bellen. Dit is een droom voor de zorg, vooral voor ouderen. Maar tot nu toe was het bouwen van zo'n robot een beetje als het leren zwemmen in een zwembad met perfect helder water, en dan plotseling het zwemmen in de ruige, koudere zee moeten leren.

Deze paper introduceert OmniFall, een nieuw "zwembad" voor computers om te leren vallen te herkennen. Het is een enorme verzameling video's die drie verschillende werelden combineert om de robot zo goed mogelijk voor te bereiden op de echte wereld.

Hier is hoe het werkt, vertaald naar alledaags taal:

1. Het Drie-Werelden Concept

OmniFall is opgebouwd uit drie delen, net als een trainingskamp voor een atleet:

  • De Oefensessie (OF-Staged):
    Dit is het traditionele deel. Denk aan een filmset waar acteurs veilig vallen in een studio. Alles is gecontroleerd: het licht is perfect, de camera's staan stil, en de "slachtoffers" zijn jonge, gezonde mensen die weten wat ze doen.

    • Het probleem: In de echte wereld valt iemand niet in een studio. Het licht is slecht, de camera schudt, en de persoon is misschien oud en draagt een dikke trui. Robots die alleen hierop trainen, raken in de war zodra ze de studio verlaten.
    • OmniFall's oplossing: Ze hebben acht verschillende oude datasets samengevoegd tot één grote, gestandaardiseerde set. Alsof je alle oude trainingsboeken in één dik naslagwerk stopt.
  • De Digitale Poppenkast (OF-Synthetic):
    Dit is het meest innovatieve deel. In plaats van echte mensen te laten vallen (wat ethisch lastig en gevaarlijk is voor ouderen), hebben ze een AI-generator gebruikt om 12.000 video's te maken.

    • De analogie: Stel je voor dat je een videogame maakt waarin je kunt kiezen voor elke leeftijd, huidskleur, lichaamsvorm en kledingstijl, en dan in elke denkbare kamer kunt laten vallen. Dat is wat ze hebben gedaan.
    • Het verrassende resultaat: De paper ontdekte dat deze kunstmatige video's soms zelfs beter werken om de robot voor te bereiden op de echte wereld dan de echte studio-video's. Waarom? Omdat je in de computerwereld precies kunt variëren wat er in de echte wereld vaak ontbreekt: diversiteit.
  • De Echte Zee (OF-In-the-Wild):
    Dit is de "examenhal". Hier zitten geen acteurs en geen computersimulaties. Dit zijn echte ongelukken die op straat of in huizen zijn opgenomen (gehaald van een andere dataset genaamd OOPS).

    • Het doel: Dit is de test. Als de robot hier goed presteert, betekent het dat hij echt iets kan. In deze video's is het vaak donker, wazig, en valt iemand misschien niet netjes, maar chaotisch.

2. Waarom is dit zo belangrijk?

Vroeger was het zo:

  • Je trainde je robot op een studio-video.
  • Je testte hem op een andere studio-video.
  • De robot scoorde 99% goed! "Super!" dachten we.
  • Je zette hem in een verpleeghuis.
  • De robot faalde, omdat de ouder anders bewoog, het licht anders was, of de camera anders stond.

Met OmniFall doen ze het anders:

  • Ze trainen de robot op een mix van studio-video's én die 12.000 AI-video's.
  • Ze testen hem alleen op de echte, chaotische ongelukken (de "In-the-Wild" test).
  • Het resultaat: Robots die getraind zijn met deze mix, werken veel beter in de echte wereld. Sterker nog, de AI-video's bleken soms zelfs effectiever te zijn dan de echte studio-video's, omdat ze de robot leerden omgaan met verschillende soorten mensen en omgevingen zonder dat er iemand echt pijn deed.

3. De "Tijdslijn" (Timeline Segmentation)

De paper gaat niet alleen over het moment van vallen ("Oeps, hij valt!"). Ze kijken ook naar wat er na het vallen gebeurt.

  • De analogie: Het is het verschil tussen zien dat iemand op de grond tikt, en zien dat iemand blijft liggen en niet meer kan opstaan.
  • Dit laatste is cruciaal. Als iemand urenlang op de grond ligt ("long-lie"), kan dat dodelijk zijn. OmniFall heeft video's zo gedetailleerd gemerkt (frame-per-frame) dat de robot niet alleen het vallen ziet, maar ook weet: "Ah, hij zit nu, hij ligt nu, hij probeert op te staan."

Samenvatting in één zin

OmniFall is een revolutionaire trainingsset die robots leert vallen te herkennen door ze te laten oefenen in een veilige studio, in een gevarieerde virtuele wereld, en ze vervolgens te testen op de ruwe realiteit, zodat ze in het echt kunnen helpen wanneer het er echt toe doet.

Het is een stap in de richting van zorgrobots die niet alleen slim zijn in theorie, maar ook betrouwbaar in de praktijk.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →