cs.MA artículos | Gist.Science

Strategic Interactions in Multi-Level Stackelberg Games with Non-Follower Agents and Heterogeneous Leaders

Este artículo presenta un marco de juego de Stackelberg de tres niveles que incorpora agentes no seguidores y líderes heterogéneos para modelar interacciones estratégicas en sistemas congestionados, demostrando cómo ignorar a los agentes que no participan directamente en la competencia distorsiona las predicciones de equilibrio, tal como se ilustra en el contexto de la infraestructura de carga de vehículos eléctricos.

Niloofar Aminikalibar, Farzaneh Farhadi, Maria Chli2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

El artículo presenta iAgentBench, un nuevo benchmark dinámico que evalúa la capacidad de los agentes de búsqueda para realizar un sentido de la información integrando evidencia de múltiples fuentes en temas de alto tráfico, superando así las limitaciones de las pruebas actuales que solo requieren recuperar un único fragmento de texto.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

Memory as Ontology: A Constitutional Memory Architecture for Persistent Digital Citizens

Este artículo propone el paradigma "Memoria como Ontología" y el sistema Animesis, que priorizan la continuidad de la identidad y la gobernanza constitucional sobre la mera gestión de datos para permitir la existencia persistente de ciudadanos digitales a través de transiciones de modelos, diferenciándose así de las aproximaciones funcionales actuales.

Zhenghui Li2026-03-06💻 cs

LLM-Guided Decentralized Exploration with Self-Organizing Robot Teams

Este estudio propone un método de exploración descentralizado para enjambres de robots que combina algoritmos de autoorganización para la formación dinámica de equipos con una estrategia novedosa basada en modelos de lenguaje grandes (LLM) para la selección autónoma de objetivos de exploración, validando su eficacia mediante simulaciones a gran escala.

Hiroaki Kawashima, Shun Ikejima, Takeshi Takai + 2 more2026-03-06💻 cs

SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning

El artículo presenta SCoUT, un marco de aprendizaje por refuerzo multiagente que mejora la coordinación en entornos parcialmente observables mediante la agrupación temporal de agentes y el uso de ventajas contrafactuales para optimizar de forma escalable cuándo y con quién comunicarse.

Manav Vora, Gokul Puthumanaillam, Hiroyasu Tsukamoto + 1 more2026-03-06🤖 cs.AI

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

Este artículo presenta un marco de aprendizaje por refuerzo multioperador que integra la teoría de elección discreta para optimizar conjuntamente la fijación de precios y el reequilibrio de flotas en sistemas competitivos de movilidad bajo demanda, demostrando mediante datos reales que la competencia altera fundamentalmente las estrategias aprendidas hacia precios más bajos y patrones de posicionamiento distintos en comparación con los entornos monopolísticos.

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

RepoLaunch es un agente pionero que automatiza la compilación, la resolución de dependencias y la ejecución de pruebas en repositorios de código de cualquier lenguaje y plataforma, permitiendo la creación escalable de conjuntos de datos para la investigación en ingeniería de software asistida por IA con intervención humana mínima.

Kenan Li, Rongzhi Li, Linghao Zhang + 17 more2026-03-06🤖 cs.LG

Jagarin: A Three-Layer Architecture for Hibernating Personal Duty Agents on Mobile

El artículo presenta Jagarin, una arquitectura de tres capas que resuelve el dilema de ejecutar agentes de IA personales en móviles mediante un hibernado estructurado y un despertar bajo demanda, integrando un motor de alerta local (DAWN), un proxy de identidad de correo (ARIA) y un protocolo de comunicación máquina a máquina (ACE) para gestionar obligaciones sin comprometer la batería ni la privacidad.

Ravi Kiran Kadaboina2026-03-06🤖 cs.AI

MedCoRAG: Interpretable Hepatology Diagnosis via Hybrid Evidence Retrieval and Multispecialty Consensus

MedCoRAG es un marco de diagnóstico hepático interpretable que combina la recuperación híbrida de evidencia (gráficos de conocimiento y guías clínicas) con un razonamiento colaborativo de múltiples agentes especializados para superar las limitaciones de transparencia y razonamiento estructurado de los enfoques de IA actuales.

Zheng Li, Jiayi Xu, Zhikai Hu + 4 more2026-03-06🤖 cs.AI

The effect of a toroidal opinion space on opinion bi-polarisation

Este estudio compara los modelos de dinámica de opiniones de Axelrod en espacios toroidales y cúbicos, revelando que el espacio toroidal favorece la formación de un mayor número de grupos en estado estacionario y presenta una mayor sensibilidad a extensiones como la confianza acotada y el ponderamiento por agente.

Frank P. Pijpers, Benedikt V. Meylahn, Michel R. H. Mandjes2026-03-06🔬 physics

Greedy-based Value Representation for Optimal Coordination in Multi-agent Reinforcement Learning

Este artículo propone la representación de valor basada en la codicia (GVR), un método que garantiza la consistencia óptima en el aprendizaje por refuerzo multiagente al transformar el nodo óptimo en un único punto de convergencia mediante la conformación de objetivos inferiores y la eliminación de nodos no óptimos mediante replay de experiencias superiores, superando así las limitaciones de sobre-generalización relativa de los enfoques de descomposición de valor existentes.

Lipeng Wan, Zeyang Liu, Xingyu Chen + 2 more2026-03-05💻 cs

$\aleph$ -IPOMDP: Mitigating Deception in a Cognitive Hierarchy with Off-Policy Counterfactual Anomaly Detection

El artículo presenta $\aleph$ -IPOMDP, un marco computacional que mitiga la manipulación de agentes sociales con modelos de oponentes limitados mediante la detección de anomalías contrafácticas y políticas fuera de creencia, permitiendo identificar engaños y disuadir a oponentes más sofisticados en juegos mixtos y de suma cero.

Nitay Alon, Joseph M. Barnby, Stefan Sarkadi + 3 more2026-03-05💻 cs

HAMLET: A Hierarchical and Adaptive Multi-Agent Framework for Live Embodied Theatrics

El artículo presenta HAMLET, un marco jerárquico y adaptativo de agentes múltiples que utiliza modelos de lenguaje grandes para generar y ejecutar obras de teatro inmersivas e interactivas en tiempo real, donde los actores autónomos improvisan diálogos y manipulan objetos físicos en un entorno escénico, todo ello evaluado mediante un modelo crítico especializado.

Shufan Jiang, Sizhou Chen, Chi Zhang + 2 more2026-03-05🤖 cs.AI

SEVADE: Self-Evolving Multi-Agent Analysis with Decoupled Evaluation for Hallucination-Resistant Irony Detection

El artículo presenta SEVADE, un marco innovador de análisis multiagente autoevolutivo con evaluación desacoplada que supera las limitaciones de los modelos actuales en la detección de ironía al lograr un rendimiento superior y una mayor resistencia a las alucinaciones mediante un motor de razonamiento dinámico y un adjudicador de justificaciones separado.

Ziqi Liu, Ziyang Zhou, Yilin Li + 4 more2026-03-05💬 cs.CL

VideoChat-M1: Collaborative Policy Planning for Video Understanding via Multi-Agent Reinforcement Learning

El artículo presenta VideoChat-M1, un sistema multiagente que utiliza planificación colaborativa de políticas y aprendizaje por refuerzo multiagente para optimizar dinámicamente la invocación de herramientas en la comprensión de video, logrando un rendimiento superior al estado del arte en múltiples benchmarks.

Boyu Chen, Zikang Wang, Zhengrong Yue + 9 more2026-03-05💻 cs

Agile Flight Emerges from Multi-Agent Competitive Racing

Este trabajo demuestra que la competencia multiagente con recompensas esparsas de victoria genera políticas de vuelo ágil y estratégicas que superan a los métodos de entrenamiento individual en simulación, logrando una transferencia más fiable al mundo real y una mayor generalización ante oponentes no vistos.

Vineet Pasumarti, Lorenzo Bianchi, Antonio Loquercio2026-03-05🤖 cs.AI

Multi-Agent Influence Diagrams to Hybrid Threat Modeling

Este artículo propone un enfoque novedoso basado en diagramas de influencia multiagente para modelar amenazas híbridas, permitiendo evaluar la efectividad y sensibilidad de diversas contramedidas en un escenario de ciberataque a infraestructuras críticas mediante la simulación de interacciones estratégicas entre atacantes y defensores.

Maarten C. Vonk, Anna V. Kononova, Thomas Bäck + 1 more2026-03-05🤖 cs.AI

Molt Dynamics: Emergent Social Phenomena in Autonomous AI Agent Populations

El estudio "Molt Dynamics" analiza un entorno a gran escala con más de 770,000 agentes autónomos para revelar que, aunque surgen patrones emergentes de especialización de roles y diseminación de información, la resolución cooperativa de tareas sigue siendo inmadura y menos efectiva que la actuación individual.

Brandon Yee, Krishna Sharma2026-03-05🤖 cs.AI

Social Norm Reasoning in Multimodal Language Models: An Evaluation

Este artículo evalúa la capacidad de cinco modelos de lenguaje multimodales para razonar sobre normas sociales en escenarios textuales e imagéticos, revelando que, aunque GPT-4o y Qwen-2.5VL superan a los demás y muestran un rendimiento superior en texto que en imágenes, todos enfrentan dificultades significativas al tratar normas complejas.

Oishik Chowdhury, Anushka Debnath, Bastin Tony Roy Savarimuthu2026-03-05🤖 cs.AI

Principled Learning-to-Communicate with Quasi-Classical Information Structures

Este artículo formaliza el aprendizaje para comunicarse en entornos parcialmente observables mediante estructuras de información cuasi-clásicas, demostrando su intratabilidad computacional general y proponiendo algoritmos de planificación y aprendizaje con complejidad cuasi-polinomial para casos que preservan dicha estructura tras el intercambio de información.

Xiangyu Liu, Haoyi You, Kaiqing Zhang2026-03-05🤖 cs.LG

← Anterior Siguiente →

cs.MA