RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

Das Paper stellt RL-100 vor, ein leistungsfähiges Reinforcement-Learning-Framework für Roboter, das durch die Kombination von Diffusion-Policies mit PPO und Konsistenz-Distillation in acht realen Aufgaben eine 100-prozentige Erfolgsrate erzielt und dabei menschliche Operateure in Geschwindigkeit und Robustheit übertrifft.

Kun Lei, Huanyu Li, Dongjie Yu, Zhenyu Wei, Lingxiao Guo, Zhennan Jiang, Ziyu Wang, Shiyu Liang, Huazhe XuWed, 11 Ma🤖 cs.AI

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

Die Arbeit stellt FALCON vor, ein neues Paradigma für Vision-Language-Action-Modelle, das durch die Integration von räumlichen Grundwissen aus 3D-Spatial-Foundation-Modellen in den Aktionskopf die Lücke zwischen 2D-Vision und 3D-Aktion schließt und damit in Simulationen sowie realen Umgebungen neue Maßstäbe in Bezug auf Generalisierung und Robustheit setzt.

Zhengshen Zhang, Hao Li, Yalun Dai, Zhengbang Zhu, Lei Zhou, Chenchen Liu, Dong Wang, Francis E. H. Tay, Sijin Chen, Ziwei Liu, Yuxiao Liu, Xinghang Li, Pan ZhouWed, 11 Ma🤖 cs.AI

Research and Prototyping Study of an LLM-Based Chatbot for Electromagnetic Simulations

Diese Studie stellt einen auf dem Large Language Model Google Gemini 2.0 Flash basierenden Chatbot vor, der mithilfe von Python, Gmsh und GetDP den Prozess der Einrichtung und Lösung von zweidimensionalen elektromagnetischen Wirbelstrom-Simulationen mit variablen Leitergeometrien und benutzerdefinierten Nachverarbeitungsroutinen automatisiert, um die Vorbereitungszeit erheblich zu verkürzen.

Albert Piwonski, Mirsad HadžiefendicWed, 11 Ma🤖 cs.AI

Mitigating Long-Tail Bias in HOI Detection via Adaptive Diversity Cache

Die vorgestellte Arbeit führt den modularen, trainingsfreien „Adaptive Diversity Cache" (ADC) ein, der durch die dynamische Ansammlung und Anpassung vielfältiger Merkmalsdarstellungen während der Inferenz die langschwänzige Verzerrung bei der Erkennung von Mensch-Objekt-Interaktionen (HOI) effektiv reduziert und dabei die Leistung seltener Kategorien auf etablierten Datensätzen signifikant verbessert.

Yuqiu Jiang, Xiaozhen Qiao, Yifan Chen, Ye Zheng, Zhe Sun, Xuelong LiWed, 11 Ma🤖 cs.AI

When Robots Obey the Patch: Universal Transferable Patch Attacks on Vision-Language-Action Models

Die Studie stellt UPA-RFAS vor, ein universelles und übertragbares Angriffsframework für Vision-Language-Action-Modelle, das durch eine physikalische Patch-Attacke in der Lage ist, Roboter unter verschiedenen Architekturen und Umgebungen zu manipulieren, indem es Repräsentationsverschiebungen und spezifische VLA-Schwachstellen ausnutzt.

Hui Lu, Yi Yu, Yiming Yang, Chenyu Yi, Qixin Zhang, Bingquan Shen, Alex C. Kot, Xudong JiangWed, 11 Ma🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Diese Arbeit stellt ein generalisiertes Multi-Agenten-Reinforcement-Learning-Framework vor, das verlustbehaftete und verlustfreie Kommunikation durch einen kommunikationsbeschränkten Prior und eine duale gegenseitige Informations-Schätzung modelliert, um die Robustheit und Skalierbarkeit kooperativer Strategien in komplexen, dynamischen Umgebungen zu verbessern.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

Diese Studie stellt ELERAG vor, eine für den Bildungssektor optimierte Retrieval-Augmented-Generation-Architektur, die durch die Integration von Entity Linking und einer hybriden Neuordnung auf Basis von Reciprocal Rank Fusion die faktenbasierte Genauigkeit bei der Beantwortung von Fragen auf Italienisch in domänenspezifischen Kontexten signifikant verbessert.

Francesco Granata, Francesco Poggi, Misael MongiovìWed, 11 Ma🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

Die Arbeit stellt EMFusion vor, ein bedingtes diffusionsbasiertes Framework zur probabilistischen Vorhersage frequenzselektiver elektromagnetischer Felder in drahtlosen Netzen, das durch die Integration kontextueller Faktoren und einer Imputations-basierten Stichprobenstrategie sowohl präzise multivariate Prognosen als auch verlässliche Unsicherheitsquantifizierung ermöglicht.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca ChiaraviglioWed, 11 Ma🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

Die Arbeit stellt SAGE vor, ein Reinforcement-Learning-Framework, das durch sequenzielle Rollouts und eine integrierte Belohnungsfunktion die Selbstverbesserung von LLM-Agenten mittels einer dynamischen Skill-Bibliothek ermöglicht und dabei sowohl die Erfolgsrate als auch die Effizienz im Vergleich zu bestehenden Ansätzen signifikant steigert.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee CheongWed, 11 Ma🤖 cs.AI