Less is More: Robust Zero-Communication 3D Pursuit-Evasion via Representational Parsimony

Este artigo demonstra que a simplificação das representações observacionais e a implementação de um mecanismo de atribuição de crédito local (CGCA) permitem uma coordenação robusta e sem comunicação em cenários de perseguição-evasão 3D, superando abordagens dependentes de comunicação em termos de sucesso e resiliência a atrasos e ruídos.

Jialin Ying, Zhihao Li, Zicheng Dong, Guohua Wu, Yihuan LiaoTue, 10 Ma💻 cs

Mindstorms in Natural Language-Based Societies of Mind

Este artigo apresenta as Sociedades de Mentes Baseadas em Linguagem Natural (NLSOMs), um sistema modular onde múltiplos agentes de inteligência artificial interagem por meio de linguagem natural para resolver tarefas complexas de multimodalidade, ao mesmo tempo que explora questões fundamentais sobre a estrutura social, governança e economia dessas sociedades emergentes de mentes heterogêneas.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen SchmidhuberThu, 12 Ma💬 cs.CL

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Este artigo apresenta o Yokai Learning Environment (YLE), um novo benchmark de código aberto para coordenação zero-shot que supera as limitações do Hanabi Learning Environment ao exigir que agentes cooperantes construam terreno comum através do rastreamento de crenças sobre cartas móveis e do raciocínio sob dicas ambíguas, revelando que os métodos de IA de última geração que dominam o Hanabi falham em manter modelos internos consistentes com parceiros desconhecidos no YLE.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas BullingThu, 12 Ma🤖 cs.AI

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

O artigo apresenta o ThunderAgent, um sistema de inferência ágil e consciente de programas que unifica o gerenciamento de recursos heterogêneos (como cache KV e ferramentas externas) para otimizar fluxos de trabalho de agentes LLM, resultando em ganhos significativos de throughput e economia de memória em comparação com sistemas existentes.

Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran AroraThu, 12 Ma💻 cs

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

Este artigo de posição enquadra a memória de sistemas multiagentes como um problema de arquitetura de computadores, propondo uma hierarquia de três camadas e destacando a consistência da memória como o desafio mais urgente para garantir a confiabilidade e escalabilidade desses sistemas.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen ZhaoThu, 12 Ma🤖 cs.AI

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

O KernelSkill é um framework multiagente que otimiza kernels de GPU substituindo heurísticas implícitas de modelos de linguagem por habilidades de especialistas baseadas em conhecimento e uma arquitetura de memória dupla, alcançando sucesso de 100% e acelerações significativas em relação ao Torch Eager e a métodos anteriores.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang LiuThu, 12 Ma🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

O artigo apresenta o GRACE, um simulador e conjunto de benchmarks unificado para planejamento de trajetórias de múltiplos robôs em 2D, que permite comparações justas e reprodutíveis entre diferentes níveis de abstração (grade, mapa de rotas e contínuo) para avaliar as compensações entre fidelidade e escalabilidade.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang HönigThu, 12 Ma🤖 cs.AI

Aligning Compound AI Systems via System-level DPO

O artigo apresenta o SysDPO, um framework que alinha sistemas de IA compostos com preferências humanas ao modelá-los como grafos acíclicos direcionados e estender a Otimização Direta de Preferências (DPO) para superar desafios como interações não diferenciáveis e a dificuldade de traduzir preferências de nível de sistema para componentes individuais.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi KoyejoMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

O artigo apresenta o KramaBench, um benchmark composto por 104 desafios curados manualmente para avaliar a capacidade de sistemas de IA em orquestrar pipelines completos de dados a insights em lagos de dados, revelando que, embora os modelos atuais consigam identificar tarefas individuais, eles ainda têm dificuldade significativa em gerar e executar pipelines funcionais de ponta a ponta.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature

Este trabalho apresenta um sistema multiagente baseado em modelos de linguagem grandes multimodais (MLLM) que supera significativamente o estado da arte na extração automática e robusta de informações químicas complexas de gráficos e textos da literatura, facilitando a construção de bancos de dados estruturados para impulsionar a pesquisa química orientada por IA.

Yufan Chen, Ching Ting Leung, Bowen Yu, Jianwei Sun, Yong Huang, Linyan Li, Hao Chen, Hanyu GaoMon, 09 Ma🤖 cs.AI

MARLIN: Multi-Agent Reinforcement Learning with Murmuration Intelligence and LLM Guidance for Reservoir Management

O artigo apresenta o MARLIN, um framework descentralizado de aprendizado por reforço multiagente inspirado no comportamento de murmuração de estorninhos e guiado por LLMs, que otimiza a gestão de reservatórios sob incertezas climáticas, melhorando a coordenação global, reduzindo custos computacionais e acelerando a resposta a inundações.

Heming Fu, Shan Lin, Guojun XiongMon, 09 Ma💻 cs

Symmetry-Breaking in Multi-Agent Navigation: Winding Number-Aware MPC with a Learned Topological Strategy

O artigo apresenta o WNumMPC, um método hierárquico de navegação multiagente que combina aprendizado por reforço e controle baseado em modelo para resolver impasses causados por simetria em cenários densos, utilizando o número de enrolamento como invariante topológico para coordenar estratégias de passagem e garantir transferência robusta da simulação para a realidade.

Tomoki Nakao, Kazumi Kasaura, Tadashi KozunoMon, 09 Ma💻 cs