Agile in the Face of Delay: Asynchronous End-to-End Learning for Real-World Aerial Navigation

Deze paper introduceert een asynchroon versterkingsleerframework met een tijdelijke coderingsmodule dat de perceptie en besturing van autonome vliegende voertuigen ontkoppelt, waardoor robuuste navigatie met een hoge frequentie mogelijk is ondanks vertragingen in sensorupdates, wat succesvol is geverifieerd in simulaties en een echte vluchttest.

Yude Li, Zhexuan Zhou, Huizhe Li, Youmin Gong, Jie Mei

Gepubliceerd 2026-03-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een drone bestuurt die door een dicht, wirwar van bomen moet vliegen. Om dit veilig te doen, moet de drone razendsnel beslissingen nemen: "Links af!" of "Omhoog!" (ongeveer 100 keer per seconde). Dit is de besturing.

Maar de drone heeft ook een camera en een laser-sensor (LiDAR) om te zien waar de bomen staan. Het probleem? Deze sensors zijn traag. Ze updaten maar 10 keer per seconde, en het verwerken van die beelden kost ook tijd.

Het Dilemma: De Snelle Bestuurder en de Trage Navigator
In de traditionele manier van werken, moet de "bestuurder" (de besturing) wachten tot de "navigator" (de sensor) een nieuw kaartje heeft getekend. Omdat de navigator traag is, moet de bestuurder ook traag worden. Dat is gevaarlijk in een snelle vlucht; de drone zou dan te langzaam reageren op een plotseling opduikende tak.

De Oplossing: Een Asynchrone Dans
De onderzoekers uit dit paper hebben een slimme oplossing bedacht: Laat ze los van elkaar!

Stel je voor dat je een danspartner hebt die trager is dan jij.

  • De oude manier: Jij wacht tot je partner klaar is met zijn stap voordat jij de volgende doet. Je dans is traag en saai.
  • De nieuwe manier (Asynchroon): Jij blijft dansen op je eigen snelle ritme (100 keer per seconde). Je gebruikt je eigen gevoel en je laatste kennis van de muziek om te weten wat je moet doen. Je partner (de sensor) geeft af en toe een nieuwe tip: "Let op, links is een boom!"

Maar hier zit een addertje onder het gras: als je partner een tip geeft, is die tip misschien al 0,1 seconde oud. In de wereld van drones is dat een eeuwigheid. De boom waar je partner over sprak, is misschien al voorbij of je bent al te dichtbij. Dit noemen ze verouderde informatie.

De Magische Brillen: De "Tijds-Encoder"
Hoe los je dat op? De onderzoekers hebben een speciaal onderdeel in het brein van de drone gebouwd, de Temporal Encoding Module (TEM).

Stel je voor dat deze module een bril is die de drone opzet. Deze bril vertelt de drone niet alleen wat hij ziet, maar ook hoe oud dat beeld is.

  • Als de drone een tak ziet die "nu" is, zegt de bril: "Dit is vers, doe iets!"
  • Als de drone een tak ziet die "oud" is (bijvoorbeeld 0,1 seconde geleden), zegt de bril: "Oeps, dit beeld is verouderd. Reken erop dat je nu al een stukje verder bent gevlogen. Pas je reactie daarop aan!"

Door deze bril te dragen, kan de drone razendsnel blijven vliegen en beslissingen nemen, zelfs als zijn camera's traag zijn. Hij "voelt" zich niet verblind door oude informatie, maar gebruikt die slim om zijn eigen positie te voorspellen.

Hoe hebben ze het getraind? (De Twee-Fase Oefening)
Je kunt een drone niet zomaar in het echte bos gooien en hopen dat het werkt. Ze hebben een slim trainingsplan gebruikt:

  1. Fase 1: De Ideale Wereld. Eerst trainen ze de drone in een virtuele wereld waar alles perfect en supersnel is. De camera's zijn hier net zo snel als de besturing. De drone leert de basis: "Hoe vlieg ik veilig?"
  2. Fase 2: De Realistische Wereld. Vervolgens maken ze de training moeilijker. Ze vertragen de camera's en voegen de "oude informatie" toe. De drone moet nu leren om zijn "Tijds-bril" te gebruiken. Omdat hij de basis al kent, leert hij snel hoe hij de vertraging moet compenseren.

Het Resultaat: Vliegen in het Echte Bos
Toen ze dit systeem op een echte drone zetten (met een kleine computer aan boord), gebeurde er iets wonderlijks:

  • De drone vloog zonder enige aanpassing (zero-shot) van de computer naar het echte bos.
  • Hij vloog razendsnel door dichte bossen en binnenruimtes.
  • Hij bleef 100 keer per seconde sturen, terwijl zijn camera's maar 10 keer per seconde beelden gaven.

Samenvattend in één zin:
De onderzoekers hebben een drone bedacht die niet wacht op zijn trage camera's, maar leert om te dansen op zijn eigen snelle ritme, terwijl hij slim gebruikmaakt van een "tijd-bril" om te weten hoe oud zijn informatie is, zodat hij veilig en wendbaar kan vliegen door het dichte struikgewas.