Strategic Interactions in Multi-Level Stackelberg Games with Non-Follower Agents and Heterogeneous Leaders

Este artículo presenta un marco de juego de Stackelberg de tres niveles que incorpora agentes no seguidores y líderes heterogéneos para modelar interacciones estratégicas en sistemas congestionados, demostrando cómo ignorar a los agentes que no participan directamente en la competencia distorsiona las predicciones de equilibrio, tal como se ilustra en el contexto de la infraestructura de carga de vehículos eléctricos.

Niloofar Aminikalibar, Farzaneh Farhadi, Maria Chli2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

El artículo presenta iAgentBench, un nuevo benchmark dinámico que evalúa la capacidad de los agentes de búsqueda para realizar un sentido de la información integrando evidencia de múltiples fuentes en temas de alto tráfico, superando así las limitaciones de las pruebas actuales que solo requieren recuperar un único fragmento de texto.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

LLM-Guided Decentralized Exploration with Self-Organizing Robot Teams

Este estudio propone un método de exploración descentralizado para enjambres de robots que combina algoritmos de autoorganización para la formación dinámica de equipos con una estrategia novedosa basada en modelos de lenguaje grandes (LLM) para la selección autónoma de objetivos de exploración, validando su eficacia mediante simulaciones a gran escala.

Hiroaki Kawashima, Shun Ikejima, Takeshi Takai + 2 more2026-03-06💻 cs

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

Este artículo presenta un marco de aprendizaje por refuerzo multioperador que integra la teoría de elección discreta para optimizar conjuntamente la fijación de precios y el reequilibrio de flotas en sistemas competitivos de movilidad bajo demanda, demostrando mediante datos reales que la competencia altera fundamentalmente las estrategias aprendidas hacia precios más bajos y patrones de posicionamiento distintos en comparación con los entornos monopolísticos.

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

RepoLaunch es un agente pionero que automatiza la compilación, la resolución de dependencias y la ejecución de pruebas en repositorios de código de cualquier lenguaje y plataforma, permitiendo la creación escalable de conjuntos de datos para la investigación en ingeniería de software asistida por IA con intervención humana mínima.

Kenan Li, Rongzhi Li, Linghao Zhang + 17 more2026-03-06🤖 cs.LG

Jagarin: A Three-Layer Architecture for Hibernating Personal Duty Agents on Mobile

El artículo presenta Jagarin, una arquitectura de tres capas que resuelve el dilema de ejecutar agentes de IA personales en móviles mediante un hibernado estructurado y un despertar bajo demanda, integrando un motor de alerta local (DAWN), un proxy de identidad de correo (ARIA) y un protocolo de comunicación máquina a máquina (ACE) para gestionar obligaciones sin comprometer la batería ni la privacidad.

Ravi Kiran Kadaboina2026-03-06🤖 cs.AI

Greedy-based Value Representation for Optimal Coordination in Multi-agent Reinforcement Learning

Este artículo propone la representación de valor basada en la codicia (GVR), un método que garantiza la consistencia óptima en el aprendizaje por refuerzo multiagente al transformar el nodo óptimo en un único punto de convergencia mediante la conformación de objetivos inferiores y la eliminación de nodos no óptimos mediante replay de experiencias superiores, superando así las limitaciones de sobre-generalización relativa de los enfoques de descomposición de valor existentes.

Lipeng Wan, Zeyang Liu, Xingyu Chen + 2 more2026-03-05💻 cs

\aleph-IPOMDP: Mitigating Deception in a Cognitive Hierarchy with Off-Policy Counterfactual Anomaly Detection

El artículo presenta \aleph-IPOMDP, un marco computacional que mitiga la manipulación de agentes sociales con modelos de oponentes limitados mediante la detección de anomalías contrafácticas y políticas fuera de creencia, permitiendo identificar engaños y disuadir a oponentes más sofisticados en juegos mixtos y de suma cero.

Nitay Alon, Joseph M. Barnby, Stefan Sarkadi + 3 more2026-03-05💻 cs

HAMLET: A Hierarchical and Adaptive Multi-Agent Framework for Live Embodied Theatrics

El artículo presenta HAMLET, un marco jerárquico y adaptativo de agentes múltiples que utiliza modelos de lenguaje grandes para generar y ejecutar obras de teatro inmersivas e interactivas en tiempo real, donde los actores autónomos improvisan diálogos y manipulan objetos físicos en un entorno escénico, todo ello evaluado mediante un modelo crítico especializado.

Shufan Jiang, Sizhou Chen, Chi Zhang + 2 more2026-03-05🤖 cs.AI

SEVADE: Self-Evolving Multi-Agent Analysis with Decoupled Evaluation for Hallucination-Resistant Irony Detection

El artículo presenta SEVADE, un marco innovador de análisis multiagente autoevolutivo con evaluación desacoplada que supera las limitaciones de los modelos actuales en la detección de ironía al lograr un rendimiento superior y una mayor resistencia a las alucinaciones mediante un motor de razonamiento dinámico y un adjudicador de justificaciones separado.

Ziqi Liu, Ziyang Zhou, Yilin Li + 4 more2026-03-05💬 cs.CL

Principled Learning-to-Communicate with Quasi-Classical Information Structures

Este artículo formaliza el aprendizaje para comunicarse en entornos parcialmente observables mediante estructuras de información cuasi-clásicas, demostrando su intratabilidad computacional general y proponiendo algoritmos de planificación y aprendizaje con complejidad cuasi-polinomial para casos que preservan dicha estructura tras el intercambio de información.

Xiangyu Liu, Haoyi You, Kaiqing Zhang2026-03-05🤖 cs.LG