cs.MA artigos | Gist.Science

TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size

O artigo apresenta o TeamHOI, uma política descentralizada baseada em Transformers que permite a coordenação escalável e realista de interações cooperativas humano-objeto entre um número variável de agentes, utilizando uma estratégia de Adversarial Motion Prior mascarado para superar a escassez de dados e garantir movimentos fisicamente plausíveis.

Stefan Lionar, Gim Hee LeeTue, 10 Ma💻 cs

Modeling the Senegalese artisanal fisheries migrations

Este estudo utiliza um modelo multiagente para demonstrar que, embora as mudanças climáticas tenham um impacto limitado, a redução do esforço de pesca é essencial para evitar o colapso da pesca artesanal no Senegal e promover migrações sustentáveis, fornecendo assim uma ferramenta de apoio à decisão para políticas de gestão regional.

Alassane Bah (ESP, UMMISCO), Timothée Brochier (UMMISCO, IRD [Ile-de-France])Tue, 10 Ma💻 cs

Less is More: Robust Zero-Communication 3D Pursuit-Evasion via Representational Parsimony

Este artigo demonstra que a simplificação das representações observacionais e a implementação de um mecanismo de atribuição de crédito local (CGCA) permitem uma coordenação robusta e sem comunicação em cenários de perseguição-evasão 3D, superando abordagens dependentes de comunicação em termos de sucesso e resiliência a atrasos e ruídos.

Jialin Ying, Zhihao Li, Zicheng Dong, Guohua Wu, Yihuan LiaoTue, 10 Ma💻 cs

IronEngine: Towards General AI Assistant

O artigo apresenta o IronEngine, uma plataforma de assistente de IA geral que integra uma orquestração unificada, memória persistente e execução de ferramentas através de um pipeline de três fases, demonstrando desempenho superior em tarefas heterogêneas e posicionando-se como uma base orientada a sistemas para assistentes pessoais e automação.

Xi MoTue, 10 Ma🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

Este artigo apresenta as Sociedades de Mentes Baseadas em Linguagem Natural (NLSOMs), um sistema modular onde múltiplos agentes de inteligência artificial interagem por meio de linguagem natural para resolver tarefas complexas de multimodalidade, ao mesmo tempo que explora questões fundamentais sobre a estrutura social, governança e economia dessas sociedades emergentes de mentes heterogêneas.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen SchmidhuberThu, 12 Ma💬 cs.CL

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Este artigo propõe um framework de inferência de nível 2 para inferir as estimativas que os agentes fazem dos objetivos uns dos outros, superando as limitações dos métodos tradicionais de nível 1 que assumem conhecimento completo mútuo em cenários descentralizados como a condução urbana.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Este artigo apresenta o Yokai Learning Environment (YLE), um novo benchmark de código aberto para coordenação zero-shot que supera as limitações do Hanabi Learning Environment ao exigir que agentes cooperantes construam terreno comum através do rastreamento de crenças sobre cartas móveis e do raciocínio sob dicas ambíguas, revelando que os métodos de IA de última geração que dominam o Hanabi falham em manter modelos internos consistentes com parceiros desconhecidos no YLE.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas BullingThu, 12 Ma🤖 cs.AI

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

O artigo propõe uma extensão teórica dos jogos causais para cenários sequenciais, mas conclui, através de extensa análise empírica e teórica, que essa abordagem não oferece qualquer vantagem de bem-estar em relação ao equilíbrio de Stackelberg clássico sob racionalidade, indicando a necessidade de novos quadros teóricos além do equilíbrio de Nash para agentes de IA.

Dennis ThummThu, 12 Ma📊 stat

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

O artigo apresenta o ThunderAgent, um sistema de inferência ágil e consciente de programas que unifica o gerenciamento de recursos heterogêneos (como cache KV e ferramentas externas) para otimizar fluxos de trabalho de agentes LLM, resultando em ganhos significativos de throughput e economia de memória em comparação com sistemas existentes.

Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran AroraThu, 12 Ma💻 cs

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

Este artigo de posição enquadra a memória de sistemas multiagentes como um problema de arquitetura de computadores, propondo uma hierarquia de três camadas e destacando a consistência da memória como o desafio mais urgente para garantir a confiabilidade e escalabilidade desses sistemas.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen ZhaoThu, 12 Ma🤖 cs.AI

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

O KernelSkill é um framework multiagente que otimiza kernels de GPU substituindo heurísticas implícitas de modelos de linguagem por habilidades de especialistas baseadas em conhecimento e uma arquitetura de memória dupla, alcançando sucesso de 100% e acelerações significativas em relação ao Torch Eager e a métodos anteriores.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang LiuThu, 12 Ma🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

O artigo apresenta o GRACE, um simulador e conjunto de benchmarks unificado para planejamento de trajetórias de múltiplos robôs em 2D, que permite comparações justas e reprodutíveis entre diferentes níveis de abstração (grade, mapa de rotas e contínuo) para avaliar as compensações entre fidelidade e escalabilidade.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang HönigThu, 12 Ma🤖 cs.AI

LLMGreenRec: LLM-Based Multi-Agent Recommender System for Sustainable E-Commerce

O artigo apresenta o LLMGreenRec, um novo sistema de recomendação baseado em agentes múltiplos e modelos de linguagem (LLMs) que promove o consumo sustentável ao identificar intenções ecológicas dos usuários e reduzir a pegada de carbono digital, preenchendo a lacuna entre a intenção verde e a ação no comércio eletrônico.

Hao N. Nguyen, Hieu M. Nguyen, Son Van Nguyen, Nguyen Thi HanhThu, 12 Ma💻 cs

COMIC: Agentic Sketch Comedy Generation

O artigo propõe um sistema de IA totalmente automatizado que utiliza uma população de agentes inspirados em papéis de estúdio e críticos de LLM alinhados a preferências reais para gerar vídeos de comédia esboçada de alta qualidade, alcançando desempenho próximo ao de produções profissionais.

Susung Hong, Brian Curless, Ira Kemelmacher-Shlizerman, Steve SeitzThu, 12 Ma💬 cs.CL

OA-Bug: An Olfactory-Auditory Augmented Bug Algorithm for Swarm Robots in a Denied Environment

Este artigo propõe o algoritmo OA-Bug, que utiliza sinais olfativos e auditivos para permitir que enxames de robôs autônomos explorem ambientes negados com alta eficiência de cobertura (96,93%), superando métodos anteriores tanto em simulação quanto em experimentos com robôs reais.

Siqi Tan, Xiaoya Zhang, Jingyao Li, Ruitao Jing, Mufan Zhao, Yang Liu, Quan QuanMon, 09 Ma💻 cs

Aligning Compound AI Systems via System-level DPO

O artigo apresenta o SysDPO, um framework que alinha sistemas de IA compostos com preferências humanas ao modelá-los como grafos acíclicos direcionados e estender a Otimização Direta de Preferências (DPO) para superar desafios como interações não diferenciáveis e a dificuldade de traduzir preferências de nível de sistema para componentes individuais.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi KoyejoMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

O artigo apresenta o KramaBench, um benchmark composto por 104 desafios curados manualmente para avaliar a capacidade de sistemas de IA em orquestrar pipelines completos de dados a insights em lagos de dados, revelando que, embora os modelos atuais consigam identificar tarefas individuais, eles ainda têm dificuldade significativa em gerar e executar pipelines funcionais de ponta a ponta.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature

Este trabalho apresenta um sistema multiagente baseado em modelos de linguagem grandes multimodais (MLLM) que supera significativamente o estado da arte na extração automática e robusta de informações químicas complexas de gráficos e textos da literatura, facilitando a construção de bancos de dados estruturados para impulsionar a pesquisa química orientada por IA.

Yufan Chen, Ching Ting Leung, Bowen Yu, Jianwei Sun, Yong Huang, Linyan Li, Hao Chen, Hanyu GaoMon, 09 Ma🤖 cs.AI

MARLIN: Multi-Agent Reinforcement Learning with Murmuration Intelligence and LLM Guidance for Reservoir Management

O artigo apresenta o MARLIN, um framework descentralizado de aprendizado por reforço multiagente inspirado no comportamento de murmuração de estorninhos e guiado por LLMs, que otimiza a gestão de reservatórios sob incertezas climáticas, melhorando a coordenação global, reduzindo custos computacionais e acelerando a resposta a inundações.

Heming Fu, Shan Lin, Guojun XiongMon, 09 Ma💻 cs

Symmetry-Breaking in Multi-Agent Navigation: Winding Number-Aware MPC with a Learned Topological Strategy

O artigo apresenta o WNumMPC, um método hierárquico de navegação multiagente que combina aprendizado por reforço e controle baseado em modelo para resolver impasses causados por simetria em cenários densos, utilizando o número de enrolamento como invariante topológico para coordenar estratégias de passagem e garantir transferência robusta da simulação para a realidade.

Tomoki Nakao, Kazumi Kasaura, Tadashi KozunoMon, 09 Ma💻 cs

← Anterior Próximo →