cs.MA artículos | Gist.Science

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

El artículo presenta CoHet, un algoritmo que utiliza motivación intrínseca basada en Redes Neuronales de Grafos para mejorar la cooperación descentralizada entre agentes heterogéneos en entornos de aprendizaje por refuerzo multiagente con observabilidad parcial y recompensas escasas.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Este trabajo propone un enfoque de optimización diferenciable basado en funciones de barrera de control para aprender de forma eficiente y cuantitativa la asignación de responsabilidad de los agentes en interacciones multiagente, permitiendo modelar su disposición a ajustar su comportamiento para garantizar la seguridad de los demás.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Characterizations of voting rules based on majority margins

Este artículo demuestra que una regla de votación basada en márgenes se caracteriza normativamente si y solo si satisface el principio de Igualdad Preferencial, el cual establece que el cambio de preferencia entre dos candidatos por parte de cualquier votante debe tener el mismo efecto en el resultado electoral.

Yifeng Ding, Wesley H. Holliday, Eric PacuitWed, 11 Ma📈 econ

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

El artículo presenta GateLens, un agente de IA basado en modelos de lenguaje que utiliza el álgebra relacional como representación intermedia formal para traducir consultas en lenguaje natural a código Python optimizado, logrando así un análisis de datos tabulares más rápido, transparente y preciso en el contexto de la industria automotriz en comparación con los enfoques tradicionales.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Este trabajo propone CORA, un método de asignación de ventajas en el aprendizaje por refuerzo multiagente cooperativo que utiliza la teoría de juegos cooperativos y el concepto de "núcleo" para asignar créditos basados en las contribuciones de las coaliciones, mejorando así la optimización de las políticas y el comportamiento coordinado.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

Este artículo presenta CMASE, un marco de experimentación computacional que integra agentes generativos y métodos etnográficos virtuales para permitir que los investigadores se inserten como participantes activos en entornos sociales simulados, logrando así una modelización intervencionista que combina rigor estadístico con profundidad interpretativa y poder explicativo causal.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Personalized Collaborative Learning with Affinity-Based Variance Reduction

El artículo presenta AffPCL, un marco de aprendizaje colaborativo personalizado que utiliza mecanismos de corrección de sesgo e importancia para lograr una reducción adaptativa de la complejidad de muestreo en entornos heterogéneos, interpolando automáticamente entre la aceleración lineal y el aprendizaje independiente sin requerir conocimiento previo de la heterogeneidad del sistema.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Polynomial-time Configuration Generator for Connected Unlabeled Multi-Agent Pathfinding

El artículo presenta PULL, un algoritmo completo y eficiente en tiempo polinómico que supera las limitaciones de escalabilidad de los enfoques basados en programación lineal entera para resolver el problema de búsqueda de caminos multiagente no etiquetado y conectado (CUMAPF) en robótica de enjambre.

Takahiro Suzuki, Keisuke OkumuraWed, 11 Ma💻 cs

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Los autores proponen un marco generalizado de aprendizaje por refuerzo multiagente que utiliza un prior de comunicación restringida y un estimador de información mutua dual para distinguir entre mensajes con y sin pérdidas, desacoplar sus impactos en la toma de decisiones distribuida y cuantificar su efecto en la recompensa global, demostrando así su eficacia en entornos complejos y dinámicos con limitaciones de comunicación.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Este artículo introduce un diseño de meta-juego para evaluar el riesgo de colusión algorítmica en entornos de prueba, modelando agentes con políticas preentrenadas y reglas de adaptación para analizar cómo emergen la cooperación o la competencia bajo restricciones de tiempo y configuraciones asimétricas.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Este trabajo presenta Coordinated Boltzmann MCTS (CB-MCTS), un nuevo enfoque de búsqueda en árboles de Monte Carlo descentralizado que utiliza una política estocástica basada en Boltzmann y una bonificación de entropía decreciente para superar las limitaciones de la exploración en entornos de recompensa dispersa o engañosa, demostrando un rendimiento superior frente a métodos existentes como Dec-MCTS.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

Este trabajo presenta ChatNeuroSim, un marco de agentes basado en modelos de lenguaje grande que automatiza el despliegue y la optimización de aceleradores de memoria en cómputo (CIM) mediante la gestión integral del flujo de trabajo y una técnica de poda del espacio de diseño que reduce significativamente el tiempo de ejecución en comparación con los métodos tradicionales.

Ming-Yen Lee, Shimeng YuWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Este artículo presenta \texttt{electoral\_sim}, un marco de código abierto en Python que simula y compara diversos sistemas electorales en diferentes distribuciones de preferencias de votantes, evaluando su rendimiento mediante la distancia euclidiana al mediano geométrico e incluyendo un mecanismo hipotético basado en un kernel softmax de Boltzmann como referencia teórica.

Sumit MukherjeeWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

El artículo presenta Scale-Plan, un marco escalable que combina modelos de lenguaje grandes con planificación simbólica para generar representaciones de problemas compactas y relevantes, superando así los desafíos de alucinación y escalabilidad en la planificación de tareas a largo plazo para equipos de robots heterogéneos.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

Este artículo presenta el Protocolo de Delegación de LLM (LDP), un protocolo nativo de IA que introduce mecanismos de identidad, negociación y trazabilidad para mejorar la eficiencia, la seguridad y la gobernanza en sistemas multiagente, demostrando mediante su implementación que estas primitivas reducen significativamente la latencia y el uso de tokens en tareas específicas.

Sunil PrakashWed, 11 Ma🤖 cs.AI

Latent World Models for Automated Driving: A Unified Taxonomy, Evaluation Framework, and Open Challenges

Este artículo propone un marco unificado y una taxonomía para los modelos de mundo latentes en la conducción automatizada que organizan las representaciones latentes y los mecanismos internos, estableciendo directrices de evaluación y desafíos de investigación para lograr sistemas más robustos, generalizables y eficientes.

Rongxiang Zeng, Yongqi DongWed, 11 Ma🤖 cs.AI

Chaotic Dynamics in Multi-LLM Deliberation

El estudio demuestra que los sistemas de deliberación multi-LLM exhiben inestabilidad caótica y sensibilidad a las condiciones iniciales incluso en configuraciones deterministas, identificando la diferenciación de roles y la heterogeneidad de modelos como causas principales de divergencia y subrayando la necesidad de auditorías de estabilidad en el diseño de estos sistemas.

Hajime Shimao, Warut Khern-am-nuai, Sung Joo KimWed, 11 Ma🤖 cs.AI

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

El artículo presenta AgenticCyOps, un marco de seguridad arquitectónico que protege la integración de sistemas multiagente en operaciones cibernéticas empresariales mediante la definición de cinco principios defensivos y la reducción de fronteras de confianza explotables en un 72% para mitigar vectores de ataque en la orquestación de herramientas y la gestión de memoria.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Este artículo presenta \texttt{RQRE-OVI}, un algoritmo de iteración de valor optimista con aproximación de funciones lineales que calcula de manera eficiente y robusta el Equilibrio de Respuesta Cuantitativa Sensible al Riesgo (RQRE) en juegos de Markov de suma general, logrando un equilibrio único y estable que supera la fragilidad del equilibrio de Nash mediante un compromiso cuantificable entre rendimiento y robustez.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

El artículo presenta ToolRosetta, un marco unificado que automatiza la conversión de repositorios de código de código abierto en herramientas estandarizadas compatibles con el Protocolo de Contexto de Modelo (MCP), permitiendo a los agentes de modelos de lenguaje grandes ejecutar tareas complejas de extremo a extremo con mínima intervención humana y garantizando la seguridad.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs