Context Engineering: From Prompts to Corporate Multi-Agent Architecture

Este artículo propone la ingeniería de contexto como una disciplina fundamental que, junto con la ingeniería de intención y especificación, forma un modelo de madurez en pirámide para gestionar la complejidad de los sistemas de agentes corporativos autónomos, superando las limitaciones de la ingeniería de prompts tradicional mediante el diseño estructurado del entorno informativo, los objetivos organizacionales y las políticas corporativas.

Vera V. VishnyakovaWed, 11 Ma🤖 cs.AI

FetalAgents: A Multi-Agent System for Fetal Ultrasound Image and Video Analysis

El artículo presenta FetalAgents, el primer sistema multiagente diseñado para analizar imágenes y videos de ecografías fetales mediante la coordinación dinámica de expertos visuales especializados, logrando un rendimiento superior en diagnóstico, medición y segmentación, además de generar informes clínicos estructurados a partir de flujos de video completos.

Xiaotian Hu, Junwei Huang, Mingxuan Liu, Kasidit Anmahapong, Yifei Chen, Yitong Luo, Yiming Huang, Xuguang Bai, Zihan Li, Yi Liao, Haibo Qu, Qiyuan TianWed, 11 Ma💻 cs

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

El artículo propone un Sistema de Coherencia de Capacidades (CCS) que mapea modelos de consistencia de memoria a la revocación de autorizaciones multiagente, demostrando mediante simulación que la estrategia de coherencia dirigida por consistencia de lanzamiento (RCC) reduce drásticamente las operaciones no autorizadas en comparación con los métodos basados en tiempo, garantizando la seguridad independientemente de la velocidad de los agentes.

Vladyslav ParakhinWed, 11 Ma💻 cs

The Illusion of Collusion

Este estudio demuestra que los agentes algorítmicos que utilizan aprendizaje por refuerzo sin conocimiento previo de la estructura del juego pueden desarrollar una "colusión ingenua" basada en la sincronización de sus acciones, un fenómeno cuya probabilidad de ocurrencia depende críticamente de la política de comportamiento específica (estocástica, determinista o híbrida) que empleen los algoritmos.

Connor Douglas, Foster Provost, Arun SundararajanTue, 10 Ma💻 cs

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

El estudio demuestra que, aunque es posible inferir con gran precisión las motivaciones de agentes LLM a escala, la identificación de sus sistemas de creencias enfrenta un límite fundamental de asimetría informativa que, incluso con arquitecturas avanzadas, impide clasificar correctamente más de la mitad de los perfiles debido a una zona de ambigüedad conductual.

Jason Starace, Terence SouleTue, 10 Ma🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

El marco SelfOrg propone un sistema de autoorganización estocástica para agentes basados en LLMs que, mediante el uso de valores de Shapley aproximados y la construcción dinámica de grafos acíclicos dirigidos, optimiza la comunicación entre agentes sin supervisión externa, logrando mejoras significativas en el rendimiento, especialmente en configuraciones con modelos débiles.

Nurbek Tastan, Samuel Horvath, Karthik NandakumarTue, 10 Ma🤖 cs.LG

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

El artículo presenta MAS-Orchestra, un marco de entrenamiento que optimiza la orquestación de sistemas multiagente mediante aprendizaje por refuerzo y abstracción funcional, junto con MASBENCH, una métrica controlada que demuestra que los beneficios de los sistemas multiagente dependen críticamente de la estructura de la tarea, logrando mejoras consistentes y una eficiencia superior a la de las bases de referencia existentes.

Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Jiayu Wang, Semih Yavuz, Caiming Xiong, Shafiq JotyTue, 10 Ma💬 cs.CL

LatentMem: Customizing Latent Memory for Multi-Agent Systems

El artículo presenta LatentMem, un marco de memoria multiagente aprendible que supera las limitaciones de homogeneización y sobrecarga de información mediante la síntesis de memorias latentes específicas para cada agente y la optimización de políticas, logrando mejoras significativas en el rendimiento sin modificar los sistemas existentes.

Muxin Fu, Xiangyuan Xue, Yafu Li, Zefeng He, Siyuan Huang, Xiaoye Qu, Yu Cheng, Yang YangTue, 10 Ma🤖 cs.LG

Characterizing MARL for Energy Control: A Multi-KPI Benchmark on the CityLearn Environment

Este artículo establece un nuevo estándar de evaluación para el Aprendizaje por Refuerzo Multiagente (MARL) en la gestión energética urbana mediante el entorno CityLearn, demostrando que los enfoques de entrenamiento descentralizado superan a los centralizados y proponiendo nuevas métricas clave que revelan la resiliencia y sostenibilidad de las políticas aprendidas.

Aymen Khouja, Imen Jendoubi, Oumayma Mahjoub, Oussama Mahfoudhi, Ruan De Kock, Siddarth Singh, Claude FormanekTue, 10 Ma🤖 cs.LG

Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions

Este artículo aborda los desafíos del aprendizaje por refuerzo multiagente en la asignación de recursos para redes V2X mediante la creación de un conjunto de tareas de benchmarking controladas y datos generados en SUMO, revelando que la generalización y robustez de las políticas son los obstáculos principales y proporcionando recursos de código abierto para futuras investigaciones.

Siyuan Wang, Lei Lei, Pranav Maheshwari, Sam Bellefeuille, Kan Zheng, Dusit NiyatoTue, 10 Ma🤖 cs.LG

Evaluating Multi-Agent LLM Architectures for Rare Disease Diagnosis

Este estudio evalúa cuatro topologías de agentes en modelos de lenguaje para el diagnóstico de enfermedades raras, revelando que la topología jerárquica supera ligeramente a las demás, mientras que el modelo adversarial degrada el rendimiento debido a un exceso de duda artificial, lo que demuestra que una mayor complejidad del sistema no garantiza una mejor razonamiento y sugiere la necesidad de una selección dinámica de topologías.

Ahmed AlmasoudTue, 10 Ma💻 cs

NarrativeLoom: Enhancing Creative Storytelling through Multi-Persona Collaborative Improvisation

El sistema de co-creación narrativa "NarrativeLoom", basado en la teoría de variación ciega y retención selectiva, mejora significativamente la originalidad, diversidad y calidad de las historias generadas por usuarios al combinar la generación de opciones diversas mediante múltiples personas de IA con la curación humana, demostrando beneficios especialmente marcados para escritores novatos.

Yuxi Ma, Yongqian Peng, Fengyuan Yang, Siyu Zha, Chi Zhang, Zixia Jia, Zilong Zheng, Yixin ZhuTue, 10 Ma💻 cs