Mindstorms in Natural Language-Based Societies of Mind

Este trabajo presenta las Sociedades de Mente Basadas en Lenguaje Natural (NLSOMs), un marco inspirado en las teorías de Minsky y Schmidhuber donde múltiples agentes de redes neuronales colaboran mediante lenguaje natural para resolver tareas complejas de IA multimodal, al tiempo que explora las implicaciones sociales y económicas de escalar estos sistemas hacia sociedades de miles de millones de agentes.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen SchmidhuberThu, 12 Ma💬 cs.CL

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Este artículo presenta el Entorno de Aprendizaje Yokai (YLE), un nuevo benchmark de código abierto para la coordinación cero-shot que supera las limitaciones del entorno Hanabi al requerir que los agentes cooperen mediante el seguimiento de creencias sobre cartas móviles y el razonamiento bajo pistas ambiguas, revelando así que los métodos de vanguardia que dominan Hanabi fallan en mantener modelos internos consistentes con socios desconocidos en este nuevo entorno.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas BullingThu, 12 Ma🤖 cs.AI

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

ThunderAgent es un sistema de inferencia ágil y consciente del programa que unifica la gestión de recursos heterogéneos mediante la abstracción de flujos de trabajo como "programas LLM", logrando mejoras significativas en el rendimiento y la eficiencia de memoria en comparación con los sistemas existentes.

Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran AroraThu, 12 Ma💻 cs

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

Este artículo de posición enmarca la memoria de los sistemas multiagente como un problema de arquitectura informática, proponiendo una jerarquía de tres capas y destacando la consistencia de la memoria como el desafío crítico más urgente para garantizar sistemas escalables y fiables.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen ZhaoThu, 12 Ma🤖 cs.AI

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

El artículo presenta KernelSkill, un marco de trabajo multiagente que mejora la optimización de kernels de GPU mediante el uso de habilidades de expertos guiadas por conocimiento y una arquitectura de memoria dual, logrando aceleraciones significativas y una tasa de éxito del 100% en comparación con métodos anteriores basados en LLM.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang LiuThu, 12 Ma🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

El artículo presenta GRACE, un simulador y conjunto de pruebas unificado en 2D que permite comparaciones transparentes y reproducibles entre diferentes niveles de abstracción (cuadrícula, mapa de rutas y continuo) para la planificación de trayectorias multiagente, facilitando así el estudio de las compensaciones entre fidelidad y escalabilidad en la investigación de robots múltiples.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang HönigThu, 12 Ma🤖 cs.AI

OA-Bug: An Olfactory-Auditory Augmented Bug Algorithm for Swarm Robots in a Denied Environment

Este artículo presenta el algoritmo OA-Bug, una estrategia de enjambre aumentada con señales olfativas y auditivas que permite a los robots explorar entornos denegados sin GNSS ni comunicación centralizada, logrando una cobertura de búsqueda del 96,93% en simulaciones y validándose experimentalmente con robots reales.

Siqi Tan, Xiaoya Zhang, Jingyao Li, Ruitao Jing, Mufan Zhao, Yang Liu, Quan QuanMon, 09 Ma💻 cs

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

El artículo presenta KramaBench, un nuevo benchmark que evalúa la capacidad de los sistemas de IA para orquestar pipelines completos de "datos a conocimientos" sobre lagos de datos reales, revelando que, aunque los sistemas actuales pueden generar borradores plausibles, su precisión para ejecutar pipelines integrales y funcionales sigue siendo limitada.

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

A Multi-Agent System Enables Versatile Information Extraction from the Chemical Literature

Este trabajo presenta un sistema multiagente basado en modelos de lenguaje grandes multimodales que supera significativamente al estado del arte en la extracción automatizada y robusta de información química de la literatura, logrando un puntaje F1 del 76,27% en gráficos de reacciones complejos y demostrando una amplia versatilidad en diversas tareas de extracción de datos.

Yufan Chen, Ching Ting Leung, Bowen Yu, Jianwei Sun, Yong Huang, Linyan Li, Hao Chen, Hanyu GaoMon, 09 Ma🤖 cs.AI

MARLIN: Multi-Agent Reinforcement Learning with Murmuration Intelligence and LLM Guidance for Reservoir Management

El marco MARLIN, inspirado en la inteligencia de las murmuraciones de estorninos y guiado por modelos de lenguaje grandes, optimiza la gestión descentralizada de embalses bajo incertidumbre climática, logrando una coordinación global emergente que mejora la respuesta ante inundaciones y reduce la carga computacional en comparación con los métodos tradicionales.

Heming Fu, Shan Lin, Guojun XiongMon, 09 Ma💻 cs