cs.MA articles | Gist.Science

AGMARL-DKS: An Adaptive Graph-Enhanced Multi-Agent Reinforcement Learning for Dynamic Kubernetes Scheduling

L'article propose AGMARL-DKS, un planificateur Kubernetes dynamique basé sur l'apprentissage par renforcement multi-agents et les réseaux de neurones graphiques, qui améliore la tolérance aux pannes, l'utilisation des ressources et la réduction des coûts grâce à une approche décentralisée et une politique d'ordonnancement lexicographique adaptée au stress du système.

Hamed HamzehFri, 13 Ma🤖 cs.LG

Module checking of pushdown multi-agent systems

Cet article établit que la vérification de module des systèmes multi-agents à pile (PMS) est 2EXPTIME-complète pour ATL, mais 4EXPTIME-complète pour ATL*, ce qui constitue un cas rare d'un problème de décision élémentaire dont la complexité dépasse le temps tri-exponentiel.

Laura Bozzelli, Aniello Murano, Adriano Peron2026-03-11💻 cs

Agent based decision making for Integrated Air Defense system

Ce papier présente un système de défense aérienne intégré autonome basé sur des agents BDI capables de détecter, évaluer les menaces et allouer des armes sans intervention humaine, offrant ainsi une solution avancée pour la guerre en réseau du futur.

Sumanta Kumar Das, Sumant Mukherjee2026-03-10💻 cs

Computing Evolutionarily Stable Strategies in Multiplayer Games

Cet article présente un algorithme permettant de calculer toutes les stratégies évolutivement stables dans les jeux non dégénérés à forme normale impliquant trois joueurs ou plus.

Sam Ganzfried2026-03-10📈 econ

Real-Time BDI Agents: a model and its implementation

Cet article propose une redéfinition de la boucle de contrôle des agents BDI intégrant explicitement la gestion des contraintes temporelles et des ressources pour garantir des réactions en temps réel, validée par une implémentation dans un jeu vidéo de collecte de ressources.

Andrea Traldi, Francesco Bruschetti, Marco Robol + 3 more2026-03-06💻 cs

Foam-Agent: Towards Automated Intelligent CFD Workflows

Le papier présente Foam-Agent, un cadre multi-agents basé sur les modèles de langage qui automatise l'ensemble du flux de travail de la dynamique des fluides computationnelle (CFD) à partir d'une simple requête en langage naturel, atteignant un taux de réussite de 88,2 % et réduisant ainsi les barrières d'expertise.

Ling Yue, Nithin Somasekharan, Tingwen Zhang + 4 more2026-03-06💻 cs

Conflict-Based Search as a Protocol: A Multi-Agent Motion Planning Protocol for Heterogeneous Agents, Solvers, and Independent Tasks

Cet article présente un protocole basé sur la recherche de conflits (CBS) permettant de coordonner efficacement des agents hétérogènes dotés de planificateurs de mouvement indépendants et variés (tels que A*, RRT, ou l'apprentissage par renforcement) pour exécuter des tâches autonomes dans un environnement partagé sans collision.

Rishi Veerapaneni, Alvin Tang, Haodong He + 9 more2026-03-06💻 cs

GRAND: Guidance, Rebalancing, and Assignment for Networked Dispatch in Multi-Agent Path Finding

L'article présente GRAND, une méthode hybride combinant un apprentissage par renforcement pour la guidance globale et des solveurs d'optimisation pour le rééquilibrage et l'affectation locale, permettant d'augmenter le débit des flottes robotiques jusqu'à 500 agents de 10 % tout en respectant des contraintes de temps réel strictes.

Johannes Gaber, Meshal Alharbi, Daniele Gammelli + 1 more2026-03-06💻 cs

EmboTeam: Grounding LLM Reasoning into Reactive Behavior Trees via PDDL for Embodied Multi-Robot Collaboration

Le papier présente EmboTeam, un cadre de planification pour des équipes de robots hétérogènes qui combine les capacités de raisonnement des grands modèles de langage avec la rigueur des planificateurs classiques et des arbres de comportement pour exécuter des tâches complexes, validé par une amélioration significative des taux de réussite sur le nouveau benchmark MACE-THOR.

Haishan Zeng, Mengna Wang, Peng Li2026-03-06💻 cs

Neural Network-Based Parameter Estimation of a Labour Market Agent-Based Model

Cette étude démontre qu'un cadre d'inférence basé sur les simulations utilisant des réseaux de neurones permet d'estimer efficacement les paramètres d'un modèle agent-based du marché du travail, surpassant les méthodes bayésiennes traditionnelles en précision et en rapidité.

M Lopes Alves, Joel Dyer, Doyne Farmer + 2 more2026-03-06💻 cs

Assessing Risks of Large Language Models in Mental Health Support: A Framework for Automated Clinical AI Red Teaming

Cette étude présente un cadre d'évaluation par « red teaming » clinique automatisé qui, grâce à des simulations de thérapie avec des agents patients dynamiques, révèle des risques iatrogènes critiques dans l'utilisation des modèles de langage pour le soutien en santé mentale et valide un outil de visualisation pour auditer ces systèmes auprès de diverses parties prenantes.

Ian Steenstra, Paola Pedrelli, Weiyan Shi + 2 more2026-03-06💻 cs

Graph-theoretic Agreement Framework for Multi-agent LLM Systems

Cet article propose un cadre théorique rigoureux fondé sur la théorie des graphes pour analyser et sécuriser la coordination dans les systèmes multi-agents LLM, en démontrant comment la stabilité du consensus dépend de l'équilibre structurel des réseaux d'interaction et en résolvant les deadlocks causés par des états latents non observables grâce à des restrictions topologiques et des perturbations spectrales.

Muhammad Umar Javed2026-03-06💻 cs

TritonDFT: Automating DFT with a Multi-Agent Framework

Le papier présente TritonDFT, un cadre multi-agents automatisant l'exécution complète des calculs de théorie de la fonctionnelle de la densité (DFT) grâce à une conception de flux de travail experte et à une optimisation des compromis coût-précision, accompagné du benchmark DFTBench pour évaluer ces capacités multidimensionnelles.

Zhengding Hu, Kuntal Talit, Zhen Wang + 8 more2026-03-06🔬 cond-mat.mtrl-sci

Dual-Interaction-Aware Cooperative Control Strategy for Alleviating Mixed Traffic Congestion

Cet article propose une stratégie de contrôle coopératif appelée DIACC, basée sur l'apprentissage par renforcement multi-agents, qui améliore l'efficacité du trafic mixte en intégrant une perception adaptative des interactions locales et globales entre véhicules automatisés et humains.

Zhengxuan Liu, Yuxin Cai, Yijing Wang + 3 more2026-03-06💻 cs

Do Mixed-Vendor Multi-Agent LLMs Improve Clinical Diagnosis?

Cette étude démontre que les systèmes multi-agents de diagnostic clinique composés de modèles de différents fournisseurs surpassent les équipes homogènes en combinant des biais inductifs complémentaires pour améliorer la précision et le rappel des diagnostics médicaux.

Grace Chang Yuan, Xiaoman Zhang, Sung Eun Kim + 1 more2026-03-06💻 cs

Auction-Based RIS Allocation With DRL: Controlling the Cost-Performance Trade-Off

Cet article propose un mécanisme d'enchères ascendantes couplé à l'apprentissage par renforcement profond pour allouer dynamiquement des surfaces intelligentes reconfigurables (RIS) entre des stations de base, permettant ainsi d'optimiser le compromis entre coût et performance spectrale dans les réseaux sans fil multi-cellules.

Martin Mark Zan, Stefan Schwarz2026-03-06💻 cs

SkillNet: Create, Evaluate, and Connect AI Skills

Le papier présente SkillNet, une infrastructure open-source qui permet de créer, évaluer et connecter des compétences d'IA à grande échelle via une ontologie unifiée, améliorant ainsi significativement les performances des agents en évitant la redécouverte constante de solutions.

Yuan Liang, Ruobin Zhong, Haoming Xu + 46 more2026-03-06💻 cs

Beyond Input Guardrails: Reconstructing Cross-Agent Semantic Flows for Execution-Aware Attack Detection

Ce papier présente \SysName, un cadre de détection d'attaques pour les systèmes multi-agents qui remplace le filtrage statique par une analyse exécution-consciente reconstruisant les flux sémantiques inter-agents pour identifier les anomalies comportementales et les vecteurs d'attaque complexes.

Yangyang Wei, Yijie Xu, Zhenyuan Li, Xiangmin Shen, Shouling Ji2026-03-06🔒 cs.CR

From Spark to Fire: Modeling and Mitigating Error Cascades in LLM-Based Multi-Agent Collaboration

Cet article propose un modèle de dynamique de propagation et une couche de gouvernance basée sur un graphe généalogique pour détecter et atténuer les cascades d'erreurs dans les systèmes multi-agents basés sur les grands modèles de langage, améliorant ainsi considérablement le taux de succès de la défense sans modifier l'architecture de collaboration.

Yizhe Xie, Congcong Zhu, Xinyue Zhang + 5 more2026-03-06💻 cs

Adaptive Memory Admission Control for LLM Agents

Ce papier présente A-MAC, un cadre de contrôle d'admission de mémoire adaptatif et interprétable pour les agents LLM qui, en décomposant la valeur de la mémoire en cinq facteurs, améliore la précision et réduit la latence par rapport aux systèmes natifs.

Guilin Zhang, Wei Jiang, Xiejiashan Wang + 5 more2026-03-06💻 cs

← Précédent Suivant →