cs.MA artículos | Gist.Science

TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size

El artículo presenta TeamHOI, un marco que utiliza una política descentralizada basada en Transformers y un prior adversarial de movimiento enmascarado para permitir que un número variable de agentes humanoides realicen interacciones cooperativas humano-objeto realistas y estables mediante una sola política unificada.

Stefan Lionar, Gim Hee LeeTue, 10 Ma💻 cs

Modeling the Senegalese artisanal fisheries migrations

Mediante un modelo multiagente, este estudio demuestra que la reducción del esfuerzo pesquero es crucial para alcanzar un equilibrio sostenible en la pesca artesanal senegalesa, mientras que el cambio climático tiene un impacto menor en comparación con la sobreexplotación que provoca migraciones masivas.

Alassane Bah (ESP, UMMISCO), Timothée Brochier (UMMISCO, IRD [Ile-de-France])Tue, 10 Ma💻 cs

Less is More: Robust Zero-Communication 3D Pursuit-Evasion via Representational Parsimony

Este artículo demuestra que la eliminación de canales de comunicación redundantes y el uso de una asignación de crédito local en entornos de persecución-evasión 3D mejoran la robustez y el rendimiento en comparación con enfoques que dependen de información más rica y acoplada.

Jialin Ying, Zhihao Li, Zicheng Dong, Guohua Wu, Yihuan LiaoTue, 10 Ma💻 cs

IronEngine: Towards General AI Assistant

El artículo presenta IronEngine, una plataforma de asistente de IA general que integra una arquitectura unificada de orquestación, gestión adaptativa de modelos y ejecución de herramientas para lograr una alta tasa de completitud en tareas heterogéneas mediante un pipeline de tres fases que separa la planificación de la ejecución.

Xi MoTue, 10 Ma🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

Este trabajo presenta las Sociedades de Mente Basadas en Lenguaje Natural (NLSOMs), un marco inspirado en las teorías de Minsky y Schmidhuber donde múltiples agentes de redes neuronales colaboran mediante lenguaje natural para resolver tareas complejas de IA multimodal, al tiempo que explora las implicaciones sociales y económicas de escalar estos sistemas hacia sociedades de miles de millones de agentes.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen SchmidhuberThu, 12 Ma💬 cs.CL

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Este artículo propone un marco de inferencia de nivel 2 para deducir las estimaciones que los agentes tienen sobre los objetivos de los demás, superando las limitaciones de los métodos tradicionales de nivel 1 que asumen un conocimiento compartido perfecto en interacciones estratégicas descentralizadas.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Este artículo presenta el Entorno de Aprendizaje Yokai (YLE), un nuevo benchmark de código abierto para la coordinación cero-shot que supera las limitaciones del entorno Hanabi al requerir que los agentes cooperen mediante el seguimiento de creencias sobre cartas móviles y el razonamiento bajo pistas ambiguas, revelando así que los métodos de vanguardia que dominan Hanabi fallan en mantener modelos internos consistentes con socios desconocidos en este nuevo entorno.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas BullingThu, 12 Ma🤖 cs.AI

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

Este artículo demuestra que, aunque la extensión de los juegos causales normales a entornos secuenciales es teóricamente elegante, no ofrece ninguna mejora en el bienestar social respecto al equilibrio de Stackelberg clásico bajo racionalidad, lo que sugiere la necesidad de nuevos marcos teóricos más allá del equilibrio de Nash para la inteligencia artificial agéntica.

Dennis ThummThu, 12 Ma📊 stat

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

ThunderAgent es un sistema de inferencia ágil y consciente del programa que unifica la gestión de recursos heterogéneos mediante la abstracción de flujos de trabajo como "programas LLM", logrando mejoras significativas en el rendimiento y la eficiencia de memoria en comparación con los sistemas existentes.

Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran AroraThu, 12 Ma💻 cs

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

Este artículo de posición enmarca la memoria de los sistemas multiagente como un problema de arquitectura informática, proponiendo una jerarquía de tres capas y destacando la consistencia de la memoria como el desafío crítico más urgente para garantizar sistemas escalables y fiables.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen ZhaoThu, 12 Ma🤖 cs.AI

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

El artículo presenta KernelSkill, un marco de trabajo multiagente que mejora la optimización de kernels de GPU mediante el uso de habilidades de expertos guiadas por conocimiento y una arquitectura de memoria dual, logrando aceleraciones significativas y una tasa de éxito del 100% en comparación con métodos anteriores basados en LLM.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang LiuThu, 12 Ma🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

El artículo presenta GRACE, un simulador y conjunto de pruebas unificado en 2D que permite comparaciones transparentes y reproducibles entre diferentes niveles de abstracción (cuadrícula, mapa de rutas y continuo) para la planificación de trayectorias multiagente, facilitando así el estudio de las compensaciones entre fidelidad y escalabilidad en la investigación de robots múltiples.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang HönigThu, 12 Ma🤖 cs.AI

LLMGreenRec: LLM-Based Multi-Agent Recommender System for Sustainable E-Commerce

El artículo presenta LLMGreenRec, un nuevo sistema de recomendación multiagente basado en modelos de lenguaje grande que fomenta el consumo sostenible en el comercio electrónico al identificar intenciones ecológicas de los usuarios y reducir simultáneamente la huella de carbono digital.

Hao N. Nguyen, Hieu M. Nguyen, Son Van Nguyen, Nguyen Thi HanhThu, 12 Ma💻 cs

COMIC: Agentic Sketch Comedy Generation

El artículo presenta COMIC, un sistema automatizado de IA que genera videos de comedia tipo sketch mediante una población de agentes inspirados en roles de producción y críticos de LLM alineados con preferencias reales de audiencia, logrando resultados de calidad profesional y rendimiento de vanguardia en la generación de video.

Susung Hong, Brian Curless, Ira Kemelmacher-Shlizerman, Steve SeitzThu, 12 Ma💬 cs.CL

OA-Bug: An Olfactory-Auditory Augmented Bug Algorithm for Swarm Robots in a Denied Environment

Este artículo presenta el algoritmo OA-Bug, una estrategia de enjambre aumentada con señales olfativas y auditivas que permite a los robots explorar entornos denegados sin GNSS ni comunicación centralizada, logrando una cobertura de búsqueda del 96,93% en simulaciones y validándose experimentalmente con robots reales.

Siqi Tan, Xiaoya Zhang, Jingyao Li, Ruitao Jing, Mufan Zhao, Yang Liu, Quan QuanMon, 09 Ma💻 cs

Aligning Compound AI Systems via System-level DPO

El artículo presenta SysDPO, un marco que extiende la Optimización Directa de Preferencias (DPO) a sistemas de IA compuestos modelados como grafos acíclicos dirigidos, permitiendo su alineación conjunta a nivel de sistema a pesar de las interacciones no diferenciables y la dificultad de transformar preferencias globales en locales.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi KoyejoMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

El artículo presenta KramaBench, un nuevo benchmark que evalúa la capacidad de los sistemas de IA para orquestar pipelines completos de "datos a conocimientos" sobre lagos de datos reales, revelando que, aunque los sistemas actuales pueden generar borradores plausibles, su precisión para ejecutar pipelines integrales y funcionales sigue siendo limitada.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature

Este trabajo presenta un sistema multiagente basado en modelos de lenguaje grandes multimodales que supera significativamente al estado del arte en la extracción automatizada y robusta de información química de la literatura, logrando un puntaje F1 del 76,27% en gráficos de reacciones complejos y demostrando una amplia versatilidad en diversas tareas de extracción de datos.

Yufan Chen, Ching Ting Leung, Bowen Yu, Jianwei Sun, Yong Huang, Linyan Li, Hao Chen, Hanyu GaoMon, 09 Ma🤖 cs.AI

MARLIN: Multi-Agent Reinforcement Learning with Murmuration Intelligence and LLM Guidance for Reservoir Management

El marco MARLIN, inspirado en la inteligencia de las murmuraciones de estorninos y guiado por modelos de lenguaje grandes, optimiza la gestión descentralizada de embalses bajo incertidumbre climática, logrando una coordinación global emergente que mejora la respuesta ante inundaciones y reduce la carga computacional en comparación con los métodos tradicionales.

Heming Fu, Shan Lin, Guojun XiongMon, 09 Ma💻 cs

Symmetry-Breaking in Multi-Agent Navigation: Winding Number-Aware MPC with a Learned Topological Strategy

El artículo presenta WNumMPC, un método de navegación jerárquico que combina un planificador de aprendizaje por refuerzo y un controlador basado en modelos para resolver los bloqueos de simetría en la navegación multiagente mediante el uso de números de giro como invariantes topológicos para coordinar el paso de los agentes.

Tomoki Nakao, Kazumi Kasaura, Tadashi KozunoMon, 09 Ma💻 cs

← Anterior Siguiente →