AGMARL-DKS: An Adaptive Graph-Enhanced Multi-Agent Reinforcement Learning for Dynamic Kubernetes Scheduling

L'article propose AGMARL-DKS, un planificateur Kubernetes dynamique basé sur l'apprentissage par renforcement multi-agents et les réseaux de neurones graphiques, qui améliore la tolérance aux pannes, l'utilisation des ressources et la réduction des coûts grâce à une approche décentralisée et une politique d'ordonnancement lexicographique adaptée au stress du système.

Hamed HamzehFri, 13 Ma🤖 cs.LG

Conflict-Based Search as a Protocol: A Multi-Agent Motion Planning Protocol for Heterogeneous Agents, Solvers, and Independent Tasks

Cet article présente un protocole basé sur la recherche de conflits (CBS) permettant de coordonner efficacement des agents hétérogènes dotés de planificateurs de mouvement indépendants et variés (tels que A*, RRT, ou l'apprentissage par renforcement) pour exécuter des tâches autonomes dans un environnement partagé sans collision.

Rishi Veerapaneni, Alvin Tang, Haodong He + 9 more2026-03-06💻 cs

GRAND: Guidance, Rebalancing, and Assignment for Networked Dispatch in Multi-Agent Path Finding

L'article présente GRAND, une méthode hybride combinant un apprentissage par renforcement pour la guidance globale et des solveurs d'optimisation pour le rééquilibrage et l'affectation locale, permettant d'augmenter le débit des flottes robotiques jusqu'à 500 agents de 10 % tout en respectant des contraintes de temps réel strictes.

Johannes Gaber, Meshal Alharbi, Daniele Gammelli + 1 more2026-03-06💻 cs

EmboTeam: Grounding LLM Reasoning into Reactive Behavior Trees via PDDL for Embodied Multi-Robot Collaboration

Le papier présente EmboTeam, un cadre de planification pour des équipes de robots hétérogènes qui combine les capacités de raisonnement des grands modèles de langage avec la rigueur des planificateurs classiques et des arbres de comportement pour exécuter des tâches complexes, validé par une amélioration significative des taux de réussite sur le nouveau benchmark MACE-THOR.

Haishan Zeng, Mengna Wang, Peng Li2026-03-06💻 cs

Assessing Risks of Large Language Models in Mental Health Support: A Framework for Automated Clinical AI Red Teaming

Cette étude présente un cadre d'évaluation par « red teaming » clinique automatisé qui, grâce à des simulations de thérapie avec des agents patients dynamiques, révèle des risques iatrogènes critiques dans l'utilisation des modèles de langage pour le soutien en santé mentale et valide un outil de visualisation pour auditer ces systèmes auprès de diverses parties prenantes.

Ian Steenstra, Paola Pedrelli, Weiyan Shi + 2 more2026-03-06💻 cs

Graph-theoretic Agreement Framework for Multi-agent LLM Systems

Cet article propose un cadre théorique rigoureux fondé sur la théorie des graphes pour analyser et sécuriser la coordination dans les systèmes multi-agents LLM, en démontrant comment la stabilité du consensus dépend de l'équilibre structurel des réseaux d'interaction et en résolvant les deadlocks causés par des états latents non observables grâce à des restrictions topologiques et des perturbations spectrales.

Muhammad Umar Javed2026-03-06💻 cs

From Spark to Fire: Modeling and Mitigating Error Cascades in LLM-Based Multi-Agent Collaboration

Cet article propose un modèle de dynamique de propagation et une couche de gouvernance basée sur un graphe généalogique pour détecter et atténuer les cascades d'erreurs dans les systèmes multi-agents basés sur les grands modèles de langage, améliorant ainsi considérablement le taux de succès de la défense sans modifier l'architecture de collaboration.

Yizhe Xie, Congcong Zhu, Xinyue Zhang + 5 more2026-03-06💻 cs