TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size

이 논문은 단일 분산 정책으로 다양한 팀 크기와 물체 기하학적 구조를 가진 인간 - 물체 상호작용 (HOI) 을 가능하게 하는 Transformer 기반의 TeamHOI 프레임워크를 제안하며, 단일 인간 모션을 기반으로 한 마스킹된 적대적 운동 우선순위 (AMP) 전략과 형성 보상을 통해 현실적이고 일관된 협력 행동을 학습합니다.

Stefan Lionar, Gim Hee LeeTue, 10 Ma💻 cs

Less is More: Robust Zero-Communication 3D Pursuit-Evasion via Representational Parsimony

이 논문은 통신 지연과 부분 관측성 환경에서 3 차원 추격 - 도주 문제를 해결하기 위해, 불필요한 에이전트 간 정보 채널을 제거하고 국소적 기여도 기반의 신용 할당 기법을 도입함으로써 오히려 시스템의 강건성과 성공률을 향상시킬 수 있음을 보여줍니다.

Jialin Ying, Zhihao Li, Zicheng Dong, Guohua Wu, Yihuan LiaoTue, 10 Ma💻 cs

IronEngine: Towards General AI Assistant

이 논문은 데스크톱 UI, API, 로컬/클라우드 모델 백엔드, 지속적 메모리, 재사용 가능한 스킬, MCP 호환 확장성 및 하드웨어 통합을 하나의 통합 오케스트레이션 코어로 연결하고, 3 단계 파이프라인과 적응형 모델 관리 시스템을 통해 계획의 질과 실행 능력을 분리하여 설계된 범용 AI 어시스턴트 플랫폼 'IronEngine'의 아키텍처, 성능, 및 비교 분석을 제시합니다.

Xi MoTue, 10 Ma🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

이 논문은 자연어 기반의 대규모 신경망 '사회'가 상호작용하여 단일 모델의 한계를 극복하고 다양한 AI 과제를 해결하는 '마인드스톰' 개념을 제안하며, 이를 통해 미래 인공지능의 사회적 구조와 경제 원리 등 새로운 연구 과제를 제시합니다.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen SchmidhuberThu, 12 Ma💬 cs.CL

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

이 논문은 기존 1 단계 역게임 이론의 한계를 극복하기 위해, 다중 에이전트 간 상호작용에서 각 에이전트가 상대방의 목표에 대해 어떻게 추론하는지를 파악하는 2 단계 역게임 추론 프레임워크를 제안하고, 이를 통해 실제 시나리오에서 발생하는 목표 불일치를 효과적으로 규명합니다.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

이 논문은 기존 한아비 (Hanabi) 환경의 한계를 극복하고 제로샷 조율 (ZSC) 연구의 새로운 표준이 될 수 있도록, 불확실한 힌트와 이동하는 카드를 추적하며 공유된 신념을 구축해야 하는 새로운 다중 에이전트 강화학습 벤치마크인 '요카이 학습 환경 (YLE)'을 제안하고 기존 최첨단 방법론들의 한계를 입증합니다.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas BullingThu, 12 Ma🤖 cs.AI

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

이 논문은 리더 - 팔로워 상호작용에 Pearl 의 인과 계층을 도입한 순차적 인과적 다중 에이전트 시스템 (S-CMAS) 을 제안하고 이론적 분석을 수행했으나, 50 회 이상의 시뮬레이션과 합성 예시를 통해 합리적 최선 대응을 전제로 한 역산 (backward induction) 하에서는 고전적 스택버그 균형 대비 후생 개선 효과가 전혀 나타나지 않는다는 부정적 결론을 도출하여, 합리적 선택에 기반한 고전적 게임 이론 프레임워크가 인과적 추론의 이점을 포착하는 데 근본적인 한계가 있음을 시사합니다.

Dennis ThummThu, 12 Ma📊 stat

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

이 논문은 기존 시스템의 비효율적인 리소스 관리를 해결하기 위해 LLM 프로그램을 추상화하고 프로그램 인식 스케줄러 및 도구 리소스 관리자를 도입하여 KV 캐시 히트율과 처리량을 극대화하는 'ThunderAgent'라는 새로운 에이전트 추론 시스템을 제안합니다.

Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran AroraThu, 12 Ma💻 cs

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

이 논문은 다중 에이전트 시스템의 복잡해지는 메모리 요구사항을 컴퓨터 아키텍처 관점에서 재정의하여 공유 및 분산 메모리 패러다임을 구분하고 3 계층 구조를 제안하며, 특히 다중 에이전트 간 메모리 일관성 문제를 해결해야 할 핵심 과제로 강조합니다.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen ZhaoThu, 12 Ma🤖 cs.AI

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

이 논문은 GPU 커널 최적화에서 기존 LLM 의 암묵적 휴리스틱을 대체하여 지식 기반의 전문가 기술과 이중 수준 메모리 구조를 갖춘 다중 에이전트 프레임워크인 KernelSkill 을 제안하고, 이를 통해 Torch Eager 대비 최대 5.44 배의 속도 향상과 높은 성공률을 달성했음을 보여줍니다.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang LiuThu, 12 Ma🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

이 논문은 그리드, 로드맵, 연속 공간 등 다양한 추상화 수준에서 동일한 작업을 실행할 수 있는 통합된 2D 시뮬레이터 및 벤치마크인 'GRACE'를 제안하여, 다중 로봇 경로 계획 연구의 투명성, 재현성, 그리고 표현 수준 간 비교 가능성을 높이는 것을 목표로 합니다.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang HönigThu, 12 Ma🤖 cs.AI

OA-Bug: An Olfactory-Auditory Augmented Bug Algorithm for Swarm Robots in a Denied Environment

이 논문은 GNSS, 매핑, 데이터 공유, 중앙 처리가 불가능한 배제 환경에서 군집 로봇의 탐색 성능을 향상시키기 위해 동물의 후각 및 청각 신호 모방 방식을 적용한 'OA-Bug' 알고리즘을 제안하고, 시뮬레이션 및 실제 로봇 실험을 통해 기존 알고리즘 대비 96.93% 에 달하는 높은 탐색 커버리지를 입증했습니다.

Siqi Tan, Xiaoya Zhang, Jingyao Li, Ruitao Jing, Mufan Zhao, Yang Liu, Quan QuanMon, 09 Ma💻 cs

Aligning Compound AI Systems via System-level DPO

이 논문은 비미분 가능한 구성 요소 간 상호작용과 시스템 수준의 선호도 정렬의 어려움을 해결하기 위해, 컴파운드 AI 시스템을 방향성 비순환 그래프 (DAG) 로 모델링하고 직접 선호도 최적화 (DPO) 를 확장한 새로운 프레임워크인 'SysDPO'를 제안하여 시스템 전체의 인간 선호도 정렬을 가능하게 합니다.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi KoyejoMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

이 논문은 데이터 레이크의 복잡하고 불완전한 데이터에서 통찰력을 도출하는 전 과정을 평가하기 위해 고안된 'KramaBench' 벤치마크를 소개하고, 현재 AI 에이전트 시스템이 개별 데이터 작업은 수행할 수 있으나 이를 통합한 종단간 (end-to-end) 파이프라인을 성공적으로 구축하는 데는 여전히 큰 한계가 있음을 보여줍니다.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature

이 논문은 화학 문헌의 복잡한 멀티모달 정보를 추출하기 위해 대형 언어 모델의 추론 능력과 전문 도구를 결합한 멀티 에이전트 시스템을 개발하여, 기존 최첨단 모델보다 성능을 크게 향상시키고 다양한 정보 추출 작업에 적용 가능함을 입증했습니다.

Yufan Chen, Ching Ting Leung, Bowen Yu, Jianwei Sun, Yong Huang, Linyan Li, Hao Chen, Hanyu GaoMon, 09 Ma🤖 cs.AI

Symmetry-Breaking in Multi-Agent Navigation: Winding Number-Aware MPC with a Learned Topological Strategy

이 논문은 분산형 다중 에이전트 내비게이션에서 발생하는 대칭성 유도 정체를 해결하기 위해 위상 불변량인 감김 수 (winding number) 를 기반으로 한 강화학습 플래너와 모델 기반 컨트롤러를 결합한 계층적 방법론인 WNumMPC 를 제안하고, 이를 통해 밀집된 환경에서도 충돌과 정체를 효과적으로 방지하며 시뮬레이션과 실제 로봇 실험에서 우수한 성능을 입증했습니다.

Tomoki Nakao, Kazumi Kasaura, Tadashi KozunoMon, 09 Ma💻 cs