Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Dit paper introduceert een datagedreven aanpak op basis van differentieerbare optimalisatie en controle-barrièrefuncties om verantwoordelijkheidsallocaties voor veilige multi-agent-interacties te leren, waardoor een interpreteerbaar inzicht wordt verkregen in hoe agenten hun gedrag aanpassen om de veiligheid van anderen te waarborgen.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Deze paper introduceert \texttt{RQRE-OVI}, een nieuw algoritme dat Risk-Sensitive Quantal Response Equilibrium (RQRE) berekent in grote Markov-games met lineaire functiebenadering, waardoor een unieke en stabiele oplossing wordt gevonden die een waardevolle afweging biedt tussen prestatie en robuustheid ten opzichte van traditionele Nash-evenwichten.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

ToolRosetta is een geautomatiseerd framework dat open-source code repositories en API's omzet in MCP-compatibele tools, waardoor LLM-agenten complexe taken kunnen uitvoeren met minimale menselijke tussenkomst en verbeterde prestaties.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs