Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Diese Arbeit stellt einen datengesteuerten Ansatz vor, der auf Control Barrier Functions und differenzierbarer Optimierung basiert, um die Verantwortungszuweisung von Agenten in multi-agenten Interaktionen zu lernen und so ein quantitatives Verständnis dafür zu gewinnen, wie stark Akteure ihr Verhalten anpassen, um die Sicherheit anderer zu gewährleisten.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Prognostics for Autonomous Deep-Space Habitat Health Management under Multiple Unknown Failure Modes

Diese Arbeit stellt einen unüberwachten Prognostik-Rahmen vor, der mittels eines Expectation-Maximization-Algorithmus und gewichteter funktionaler Regression sowohl latente Ausfallmodi identifiziert als auch informative Sensoren auswählt, um die verbleibende Nutzungsdauter in autonomen Tiefraumhabitaten unter Bedingungen ungelabelter Daten und unbekannter Ausfallmechanismen präzise vorherzusagen.

Benjamin Peters, Ayush Mohanty, Xiaolei Fang, Stephen K. Robinson, Nagi GebraeelWed, 11 Ma🤖 cs.LG

Dampening parameter distributional shifts under robust control and gain scheduling

Dieser Artikel stellt eine Methode vor, die durch die Formulierung als konvexes semidefinites Programm die Verteilungsverschiebungen von Modellparametern unter robusten Steuerungs- und Gain-Scheduling-Ansätzen bei nichtlinearen Systemen eindämmt, indem sie den geschlossenen Regelkreis mit den Lern-Daten konsistent hält und Änderungen im Zustands-Eingangsraum verlangsamt.

Mohammad Ramadan, Mihai AnitescuWed, 11 Ma⚡ eess

CONQURE: A Co-Execution Environment for Quantum and Classical Resources

Das Papier stellt CONQURE vor, eine Open-Source-Cloud-Warteschlangen-Infrastruktur, die eine nahtlose Co-Execution von klassischen und quantenmechanischen Ressourcen ermöglicht, indem sie OpenMP-Quantum-Kernels über eine effiziente API auf Quantenprozessoren auslagert und so die Lücke zwischen Quantenalgorithmen und praktischer Hochleistungsrechner-Integration schließt.

Atulya Mahesh, Swastik Mittal, Frank MuellerWed, 11 Ma⚛️ quant-ph

Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking

Diese Arbeit stellt einen hybriden Regler vor, der Deep Reinforcement Learning mit robuster, modellunabhängiger Extremwertregelung kombiniert, um die Leistungsfähigkeit von Steuerungssystemen für nichtlineare, zeitvariierende Prozesse zu verbessern und gleichzeitig deren Robustheit gegenüber schnellen Modelländerungen zu gewährleisten.

Shaifalee Saxena, Alan Williams, Rafael Fierro, Alexander ScheinkerWed, 11 Ma🤖 cs.LG

Personalized Collaborative Learning with Affinity-Based Variance Reduction

Die Arbeit stellt AffPCL vor, einen personalisierten kollaborativen Lernrahmen für heterogene Agenten, der durch affinitätsbasierte Varianzreduktion und Korrekturmechanismen die Stichprobenkomplexität im Vergleich zum unabhängigen Lernen um einen Faktor von max{n1,δ}\max\{n^{-1}, \delta\} senkt und dabei nahtlos zwischen linearem Speedup bei Homogenität und unabhängiger Lernleistung bei Heterogenität interpoliert, ohne dass Vorwissen über das System erforderlich ist.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

From Demonstrations to Safe Deployment: Path-Consistent Safety Filtering for Diffusion Policies

Die Arbeit stellt PACS vor, einen sicherheitsfilternden Ansatz für Diffusions-Policies, der durch pfadkonsistente Bremsmanöver und mengenbasierte Erreichbarkeitsanalysen formale Sicherheitsgarantien in dynamischen Umgebungen bietet, ohne dabei die Aufgabenerfolgsrate im Vergleich zu reaktiven Methoden wie Control Barrier Functions signifikant zu beeinträchtigen.

Ralf Römer, Julian Balletshofer, Jakob Thumm, Marco Pavone, Angela P. Schoellig, Matthias AlthoffWed, 11 Ma⚡ eess

Do Spatial Descriptors Improve Multi-DoF Finger Movement Decoding from HD sEMG?

Die Studie zeigt, dass der neuartige MLD-BFM-Ansatz zur räumlichen Merkmalsextraktion zwar die höchste Genauigkeit bei der Dekodierung von fünf Fingerbewegungen aus HD-sEMG-Signalen erreicht, jedoch keine statistisch signifikante Verbesserung gegenüber herkömmlichen zeitbasierten Merkmalen bietet, was darauf hindeutet, dass die räumliche Auflösung der HD-sEMG-Aufzeichnung für eine präzise Mehrfreiheitsgrad-Regression entscheidender ist als die Verwendung komplexer räumlicher Deskriptoren.

Ricardo Gonçalves Molinari, Leonardo Abdala EliasWed, 11 Ma🤖 cs.LG

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

Die Arbeit stellt EMFusion vor, ein bedingtes diffusionsbasiertes Framework zur probabilistischen Vorhersage frequenzselektiver elektromagnetischer Felder in drahtlosen Netzen, das durch die Integration kontextueller Faktoren und einer Imputations-basierten Stichprobenstrategie sowohl präzise multivariate Prognosen als auch verlässliche Unsicherheitsquantifizierung ermöglicht.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca ChiaraviglioWed, 11 Ma🤖 cs.AI

Reactive Slip Control in Multifingered Grasping: Hybrid Tactile Sensing and Internal-Force Optimization

Diese Arbeit stellt einen hybriden lernbasierten und modellgestützten Ansatz vor, der multimodale Taktile Sensoren mit einer internen Kraftoptimierung kombiniert, um das Abrutschen von Objekten in multifingrigen Greifern durch eine geschlossene Regelkreisstabilisierung mit einer Gesamtverzögerung von unter 50 ms reaktiv zu verhindern.

Théo Ayral, Saifeddine Aloui, Mathieu GrossardWed, 11 Ma⚡ eess