Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

이 논문은 부분 관측성과 희소한 보상 신호 하에서 분산형 환경에 있는 이종 다중 에이전트의 협력을 향상시키기 위해 그래프 신경망 (GNN) 기반의 내재적 보상을 활용하는 'CoHet' 알고리즘을 제안하고, 이를 통해 기존 최첨단 방법보다 우수한 성능을 입증합니다.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

이 논문은 제어 장벽 함수와 미분 가능 최적화를 기반으로 한 데이터 중심 접근법을 통해 다중 에이전트 상호작용에서 안전성을 보장하기 위해 에이전트가 얼마나 자신의 행동을 조정하는지 (책임 할당) 를 학습하고 해석 가능한 정량적 통찰을 제공하는 방법을 제시합니다.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

이 논문은 자연어 쿼리를 관계 대수 (Relational Algebra) 를 통한 중간 표현으로 변환하여 실행 가능한 코드를 생성하는 'GateLens'라는 LLM 에이전트 아키텍처를 제안함으로써, 자동차 소프트웨어 릴리스 분석에서 기존 CoT 기반 시스템보다 복잡한 질의 처리 정확도와 속도를 획기적으로 개선하고 분석 시간을 80% 이상 단축하는 성과를 입증했습니다.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

이 논문은 협력적 다중 에이전트 강화학습의 신용 할당 문제를 해결하기 위해 협력 게임 이론의 코어 (core) 개념을 도입하여 연합별 기여도를 평가하고 할당하는 CORA 알고리즘을 제안하며, 이를 통해 에이전트 간 조율된 최적 행동을 유도하고 기존 방법들보다 우수한 성능을 입증합니다.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

이 논문은 생성형 에이전트와 가상 민족지 방법을 통합하여 연구자가 가상 사회 환경에 직접 참여하고 개입할 수 있도록 하는 CMASE 프레임워크를 제안하며, 이를 통해 복잡한 사회 현상의 통계적 패턴과 인과적 메커니즘을 동시에 설명하고 예측하는 새로운 사회과학 연구 방법론을 제시합니다.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Personalized Collaborative Learning with Affinity-Based Variance Reduction

이 논문은 이질적인 다중 에이전트 환경에서 에이전트 간 유사도 (affinity) 에 기반한 편향 및 중요도 보정 메커니즘을 통해 독립 학습 대비 샘플 복잡도를 줄이면서도 개인화와 협업의 이점을 자동으로 조절하는 'AffPCL' 프레임워크를 제안하고, 이질성이 높은 상황에서도 선형 속도 향상을 달성할 수 있음을 이론적으로 증명합니다.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Polynomial-time Configuration Generator for Connected Unlabeled Multi-Agent Pathfinding

이 논문은 군집 로봇의 연결성 유지가 필수적인 '연결된 라벨 없는 다중 에이전트 경로 찾기 (CUMAPF)' 문제를 해결하기 위해, 기존 정수 선형 계획법 (ILP) 의 확장성 한계를 극복하고 수백 개의 에이전트로 구성된 문제를 O(n2)O(n^2) 시간 복잡도로 빠르게 해결하는 완전한 알고리즘 'PULL'을 제안합니다.

Takahiro Suzuki, Keisuke OkumuraWed, 11 Ma💻 cs

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

이 논문은 다양한 시나리오의 통신 조건을 통합적으로 모델링하고 손실 유무 메시지를 구분하여 학습 사전 지식으로 활용함으로써, 손실 통신 환경에서도 협력적 다중 에이전트 강화학습의 확장성과 견고성을 향상시키는 새로운 프레임워크를 제안합니다.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

이 논문은 희소하거나 편향된 보상 환경에서 기존 Dec-MCTS 의 한계를 극복하기 위해, 단일 에이전트 MCTS 에서 연구된 볼츠만 탐색을 다중 에이전트 시스템에 최초로 적용한 '조정된 볼츠만 MCTS(CB-MCTS)'를 제안하고, 이를 통해 기만적 시나리오에서 우수한 성능을 보이며 표준 벤치마크에서도 경쟁력 있는 강건한 분산 다중 에이전트 계획 솔루션을 제공함을 보여줍니다.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

이 논문은 메모리-연산 간 데이터 전송 오버헤드를 줄이는 컴퓨트 인 메모리 (CIM) 아키텍처의 설계 공간 탐색 (DSE) 주기를 단축하고 최적 설계를 자동화하기 위해, 대규모 언어 모델 (LLM) 기반 에이전트 프레임워크인 ChatNeuroSim 과 설계 공간 가지치기 기법을 제안합니다.

Ming-Yen Lee, Shimeng YuWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

이 논문은 유권자 선호 분포 시나리오를 기반으로 다양한 선거 제도를 시뮬레이션하고 비교하는 오픈 소스 파이썬 프레임워크인 `electoral_sim`을 소개하며, 기존 제도부터 볼츠만 소프트맥스 커널을 활용한 새로운 가상의 메커니즘까지 다양한 방식의 선거 결과와 유권자 분포의 기하학적 중앙값 간 거리를 분석합니다.

Sumit MukherjeeWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

이 논문은 자연어 지시에서 작업 관련 정보를 추출하여 불필요한 정보를 필터링하고 구조화된 그래프 탐색을 통해 효율적인 장기 계획 생성을 가능하게 하는 확장 가능한 다중 로봇 팀 작업 계획 프레임워크인 'Scale-Plan'을 제안하고, 이를 통해 기존 LLM 기반 접근법의 한계를 극복하고 신뢰성과 확장성을 향상시켰음을 보여줍니다.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

이 논문은 다중 에이전트 LLM 시스템의 효율성과 거버넌스를 향상시키기 위해 모델 정체성, 점진적 페이로드, 통제된 세션, 구조화된 출처 추적, 신뢰 도메인 등 다섯 가지 메커니즘을 도입한 AI 네이티브 통신 프로토콜인 LDP(LLM Delegate Protocol) 를 제안하고, 이를 통해 지연 시간 감소와 토큰 효율성 증대 등의 효과를 입증했습니다.

Sunil PrakashWed, 11 Ma🤖 cs.AI

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

이 논문은 LLM 기반 다중 에이전트 시스템의 기업용 사이버 보안 통합을 위해 공격 표면을 체계적으로 분석하고, 도구 오케스트레이션과 메모리 관리를 핵심 신뢰 경계로 삼아 5 가지 방어 원칙을 정립하고 SOC 워크플로우에 적용하여 신뢰 경계를 72% 이상 축소하는 'AgenticCyOps' 프레임워크를 제안합니다.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

이 논문은 대규모 상태 공간에서 일반합 마르코프 게임의 균형 계산을 위해 선형 함수 근사를 활용한 'RQRE-OVI' 알고리즘을 제안하며, 합리성과 위험 민감도 매개변수 간의 균형을 통해 나시 균형 대비 계산적 효율성과 강건성을 동시에 확보하는 이론적·실증적 성과를 입증합니다.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

이 논문은 오픈소스 코드 저장소를 자동으로 표준화하여 LLM 에이전트가 신뢰성 있게 실행할 수 있는 MCP 호환 도구를 생성하고, 이를 통해 인간의 개입을 최소화하면서 다양한 과학 분야에서 작업 수행 능력을 향상시키는 'ToolRosetta' 프레임워크를 제안합니다.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs