Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Este trabajo propone un enfoque de optimización diferenciable basado en funciones de barrera de control para aprender de forma eficiente y cuantitativa la asignación de responsabilidad de los agentes en interacciones multiagente, permitiendo modelar su disposición a ajustar su comportamiento para garantizar la seguridad de los demás.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

El artículo presenta GateLens, un agente de IA basado en modelos de lenguaje que utiliza el álgebra relacional como representación intermedia formal para traducir consultas en lenguaje natural a código Python optimizado, logrando así un análisis de datos tabulares más rápido, transparente y preciso en el contexto de la industria automotriz en comparación con los enfoques tradicionales.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Este trabajo propone CORA, un método de asignación de ventajas en el aprendizaje por refuerzo multiagente cooperativo que utiliza la teoría de juegos cooperativos y el concepto de "núcleo" para asignar créditos basados en las contribuciones de las coaliciones, mejorando así la optimización de las políticas y el comportamiento coordinado.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

Este artículo presenta CMASE, un marco de experimentación computacional que integra agentes generativos y métodos etnográficos virtuales para permitir que los investigadores se inserten como participantes activos en entornos sociales simulados, logrando así una modelización intervencionista que combina rigor estadístico con profundidad interpretativa y poder explicativo causal.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Personalized Collaborative Learning with Affinity-Based Variance Reduction

El artículo presenta AffPCL, un marco de aprendizaje colaborativo personalizado que utiliza mecanismos de corrección de sesgo e importancia para lograr una reducción adaptativa de la complejidad de muestreo en entornos heterogéneos, interpolando automáticamente entre la aceleración lineal y el aprendizaje independiente sin requerir conocimiento previo de la heterogeneidad del sistema.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Los autores proponen un marco generalizado de aprendizaje por refuerzo multiagente que utiliza un prior de comunicación restringida y un estimador de información mutua dual para distinguir entre mensajes con y sin pérdidas, desacoplar sus impactos en la toma de decisiones distribuida y cuantificar su efecto en la recompensa global, demostrando así su eficacia en entornos complejos y dinámicos con limitaciones de comunicación.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Este trabajo presenta Coordinated Boltzmann MCTS (CB-MCTS), un nuevo enfoque de búsqueda en árboles de Monte Carlo descentralizado que utiliza una política estocástica basada en Boltzmann y una bonificación de entropía decreciente para superar las limitaciones de la exploración en entornos de recompensa dispersa o engañosa, demostrando un rendimiento superior frente a métodos existentes como Dec-MCTS.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

Este trabajo presenta ChatNeuroSim, un marco de agentes basado en modelos de lenguaje grande que automatiza el despliegue y la optimización de aceleradores de memoria en cómputo (CIM) mediante la gestión integral del flujo de trabajo y una técnica de poda del espacio de diseño que reduce significativamente el tiempo de ejecución en comparación con los métodos tradicionales.

Ming-Yen Lee, Shimeng YuWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Este artículo presenta \texttt{electoral\_sim}, un marco de código abierto en Python que simula y compara diversos sistemas electorales en diferentes distribuciones de preferencias de votantes, evaluando su rendimiento mediante la distancia euclidiana al mediano geométrico e incluyendo un mecanismo hipotético basado en un kernel softmax de Boltzmann como referencia teórica.

Sumit MukherjeeWed, 11 Ma💻 cs

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

El artículo presenta AgenticCyOps, un marco de seguridad arquitectónico que protege la integración de sistemas multiagente en operaciones cibernéticas empresariales mediante la definición de cinco principios defensivos y la reducción de fronteras de confianza explotables en un 72% para mitigar vectores de ataque en la orquestación de herramientas y la gestión de memoria.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Este artículo presenta \texttt{RQRE-OVI}, un algoritmo de iteración de valor optimista con aproximación de funciones lineales que calcula de manera eficiente y robusta el Equilibrio de Respuesta Cuantitativa Sensible al Riesgo (RQRE) en juegos de Markov de suma general, logrando un equilibrio único y estable que supera la fragilidad del equilibrio de Nash mediante un compromiso cuantificable entre rendimiento y robustez.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

El artículo presenta ToolRosetta, un marco unificado que automatiza la conversión de repositorios de código de código abierto en herramientas estandarizadas compatibles con el Protocolo de Contexto de Modelo (MCP), permitiendo a los agentes de modelos de lenguaje grandes ejecutar tareas complejas de extremo a extremo con mínima intervención humana y garantizando la seguridad.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs