Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

Dit paper introduceert een versterkingsleerbenadering die door middel van dichtheidsinvariante observatiecodering en trainingsrandomisatie veilige navigatie in dichte menigten mogelijk maakt zonder te bevriezen of te crashen, zelfs bij onbekende, hogere dichtheden dan tijdens de training.

Jiefu Zhang, Yang Xu, Vaneet Aggarwal

Gepubliceerd Tue, 10 Ma
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je door een drukke supermarkt loopt. Als er maar een paar mensen zijn, is het makkelijk: je ziet ze, je wijkt uit en je loopt door. Maar wat als de winkel ineens vol zit met honderden mensen die allemaal tegelijk bewegen? Dan wordt het een chaos.

Dit is precies het probleem dat robotontwikkelaars hebben met robots die door menigten moeten lopen. De meeste robots die we nu hebben, zijn getraind in "rustige" supermarkten. Als ze plotseling in een "drukke" supermarkt terechtkomen (bijvoorbeeld tijdens een uitverkoop of een shiftwisseling in een ziekenhuis), gebeuren er twee dingen:

  1. De "Bevries"-robot: De robot wordt zo bang om ergens tegenaan te lopen, dat hij volledig stopt. Hij blijft als een standbeeld staan, terwijl de mensen eromheen hem omver duwen. Dit noemen onderzoekers het "Freezing Robot Problem".
  2. De "Crash"-robot: De robot probeert door te gaan, maar omdat hij niet gewend is aan zoveel mensen, raakt hij in de war, berekent verkeerde routes en botst erop los.

De auteurs van dit paper, Jiefu Zhang en zijn collega's, hebben een slimme oplossing bedacht: PSS-Social. Ze hebben een robot getraind die niet alleen veilig is, maar ook slim genoeg om te "groeien" met de menigte. Hier is hoe ze dat doen, vertaald in alledaagse taal:

1. De Slimme Bril: "Kijk naar de dichtstbijzijnde, niet naar iedereen"

Stel je voor dat je een bril opzet die je helpt om in een drukke menigte te focussen.

  • Het oude probleem: Veel robots proberen iedereen in de winkel tegelijk te zien. Als er 10 mensen zijn, kijken ze naar 10 personen. Als er er plotseling 20 zijn, raakt hun "brein" overbelast. Het is alsof je probeert 20 gesprekken tegelijk te voeren; je vergeet alles.
  • De nieuwe oplossing: De robot van deze paper kijkt alleen naar de K dichtstbijzijnde mensen (bijvoorbeeld de 5 mensen die het dichtst bij hem staan).
    • De analogie: Het is alsof je in een drukke kamer alleen kijkt naar de mensen die je direct aanraken of die je in je directe gezichtsveld hebt. Je negeert de mensen in de verte.
    • De truc: De robot sorteert deze mensen op afstand. De eerste "plek" in zijn hoofd is altijd voor de dichtstbijzijnde persoon, de tweede plek voor de op één na dichtstbijzijnde, enzovoort. Zelfs als er meer mensen bijkomen, blijft de structuur hetzelfde. De robot hoeft niet te leren "hoeveel" mensen er zijn, hij leert alleen "wie" het dichtstbij is. Dit zorgt ervoor dat hij niet in de war raakt als de menigte groter wordt dan tijdens zijn training.

2. De "Druk-Regelaar": Niet te bang worden als het drukker wordt

Dit is misschien wel het slimste deel.

  • Het probleem: Als een robot ziet dat er heel veel mensen om hem heen zijn, denkt hij vaak: "Oh nee, te gevaarlijk, ik stop maar!" (Bevriezen). Of hij krijgt een enorme straf voor elke kleine afstand die hij niet perfect houdt.
  • De oplossing: De onderzoekers hebben een slimme beloningssysteem (reward shaping) bedacht.
    • De analogie: Stel je voor dat je een danspartner hebt. Als jullie alleen dansen, moet je heel precies op de voet van je partner letten. Maar als jullie in een volle dansvloer staan, is het normaal dat je wat meer ruimte nodig hebt en dat je niet perfect op de voet van je partner hoeft te staan, zolang je maar niet tegen elkaar aan stoot.
    • De robot leert: "Als het heel druk is, mag ik iets minder precies zijn, zolang ik maar veilig blijf en vooruit kom." De straf voor "niet perfect zijn" wordt automatisch minder zwaar naarmate de menigte dichter wordt. Dit voorkomt dat de robot bevriest uit angst.

Wat leverde dit op?

Ze hebben de robot getraind in een zaaltje met 11 tot 16 mensen. Vervolgens hebben ze hem getest in een zaaltje met 21 mensen (dat is 30% dichter dan hij ooit had gezien).

  • Andere robots: De meeste andere robots (die getraind zijn met oude methoden) botsten erop los of bleven stilstaan.
  • Deze robot: Hij haalde zijn doel in 99% van de gevallen en botste bijna nooit. Hij was zelfs veiliger dan de "wiskundige" robots die bekend staan om hun perfecte berekeningen, maar die vaak stopten uit angst.

Conclusie

Kortom: Deze robot is niet "slimmer" in de zin van een supercomputer, maar hij is slimmer in hoe hij kijkt en hoe hij denkt.

  1. Hij kijkt alleen naar de mensen die er echt toe doen (de dichtstbijzijnde).
  2. Hij past zijn regels aan aan de drukte: in een volle menigte is hij iets relaxter, maar nog steeds veilig.

Dit zorgt ervoor dat robots in de toekomst echt veilig door drukke ziekenhuizen, stations of winkelcentra kunnen lopen, zelfs als er ineens veel meer mensen zijn dan verwacht. Ze bevriezen niet en ze crashen niet. Ze zijn gewoon goed in het "dansje" door de menigte.