cs.MA artículos | Gist.Science

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

Este artículo propone la ingeniería de contexto como una disciplina fundamental que, junto con la ingeniería de intención y especificación, forma un modelo de madurez en pirámide para gestionar la complejidad de los sistemas de agentes corporativos autónomos, superando las limitaciones de la ingeniería de prompts tradicional mediante el diseño estructurado del entorno informativo, los objetivos organizacionales y las políticas corporativas.

Vera V. VishnyakovaWed, 11 Ma🤖 cs.AI

FetalAgents: A Multi-Agent System for Fetal Ultrasound Image and Video Analysis

El artículo presenta FetalAgents, el primer sistema multiagente diseñado para analizar imágenes y videos de ecografías fetales mediante la coordinación dinámica de expertos visuales especializados, logrando un rendimiento superior en diagnóstico, medición y segmentación, además de generar informes clínicos estructurados a partir de flujos de video completos.

Xiaotian Hu, Junwei Huang, Mingxuan Liu, Kasidit Anmahapong, Yifei Chen, Yitong Luo, Yiming Huang, Xuguang Bai, Zihan Li, Yi Liao, Haibo Qu, Qiyuan TianWed, 11 Ma💻 cs

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

El artículo propone un Sistema de Coherencia de Capacidades (CCS) que mapea modelos de consistencia de memoria a la revocación de autorizaciones multiagente, demostrando mediante simulación que la estrategia de coherencia dirigida por consistencia de lanzamiento (RCC) reduce drásticamente las operaciones no autorizadas en comparación con los métodos basados en tiempo, garantizando la seguridad independientemente de la velocidad de los agentes.

Vladyslav ParakhinWed, 11 Ma💻 cs

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

Este artículo propone un marco innovador que trata los prompts como acciones parametrizadas para influir en el comportamiento de sistemas multiagente basados en LLMs sin necesidad de entrenamiento, demostrando mediante experimentos que este enfoque controla eficazmente la dinámica conversacional y facilita la simulación social.

Hongbo Bo, Jingyu Hu, Weiru LiuWed, 11 Ma🤖 cs.AI

Emotional Modulation in Swarm Decision Dynamics

Este artículo extiende la ecuación de las abejas a un modelo basado en agentes que incorpora la valencia y la excitación emocional como moduladores de las tasas de interacción, demostrando cómo la contagio emocional y los puntos de inflexión estructurales influyen en la velocidad y el resultado de la toma de decisiones colectivas.

David Freire-ObregónWed, 11 Ma🤖 cs.AI

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

Esta encuesta examina la aplicación de la teoría de la utilidad en el modelado cognitivo de sistemas robóticos, analizando su evolución desde arquitecturas cognitivas y sistemas de valores hasta su impacto en la toma de decisiones, la cooperación multiagente y la interacción humano-robot, mientras propone direcciones futuras y problemas abiertos en el campo.

Qin YangTue, 10 Ma💻 cs

The Illusion of Collusion

Este estudio demuestra que los agentes algorítmicos que utilizan aprendizaje por refuerzo sin conocimiento previo de la estructura del juego pueden desarrollar una "colusión ingenua" basada en la sincronización de sus acciones, un fenómeno cuya probabilidad de ocurrencia depende críticamente de la política de comportamiento específica (estocástica, determinista o híbrida) que empleen los algoritmos.

Connor Douglas, Foster Provost, Arun SundararajanTue, 10 Ma💻 cs

Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

El artículo propone un método de verificación auto-ancorada (SGV) que mitiga el sesgo de acuerdo en los modelos de lenguaje multimodal (MLLM), mejorando significativamente la detección de errores y el rendimiento de agentes autónomos en tareas complejas como la navegación web y la robótica.

Moises Andrade, Joonhyuk Cha, Brandon Ho, Vriksha Srihari, Karmesh Yadav, Zsolt KiraTue, 10 Ma🤖 cs.LG

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

El estudio demuestra que, aunque es posible inferir con gran precisión las motivaciones de agentes LLM a escala, la identificación de sus sistemas de creencias enfrenta un límite fundamental de asimetría informativa que, incluso con arquitecturas avanzadas, impide clasificar correctamente más de la mitad de los perfiles debido a una zona de ambigüedad conductual.

Jason Starace, Terence SouleTue, 10 Ma🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

El marco SelfOrg propone un sistema de autoorganización estocástica para agentes basados en LLMs que, mediante el uso de valores de Shapley aproximados y la construcción dinámica de grafos acíclicos dirigidos, optimiza la comunicación entre agentes sin supervisión externa, logrando mejoras significativas en el rendimiento, especialmente en configuraciones con modelos débiles.

Nurbek Tastan, Samuel Horvath, Karthik NandakumarTue, 10 Ma🤖 cs.LG

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

El artículo presenta FOR-Prompting, un protocolo de prompting asimétrico que mejora el razonamiento y la auto-revisión de los modelos de lenguaje mediante un debate estructurado entre un Defensor, un Debatedor y un Anfitrión, logrando resultados superiores o comparables a métodos existentes sin necesidad de entrenamiento adicional.

He Zhang, Anzhou Zhang, Jian DaiTue, 10 Ma💬 cs.CL

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

El artículo presenta CRAwDAD, un marco de debate entre dos agentes que mejora significativamente la precisión de los modelos de razonamiento en inferencia causal al simular un diálogo crítico entre hipótesis alternativas, logrando aumentos notables en la exactitud tanto en preguntas contrafactuales como generales.

Finn G. Vamosi, Nils D. ForkertTue, 10 Ma🤖 cs.LG

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

El artículo presenta MAS-Orchestra, un marco de entrenamiento que optimiza la orquestación de sistemas multiagente mediante aprendizaje por refuerzo y abstracción funcional, junto con MASBENCH, una métrica controlada que demuestra que los beneficios de los sistemas multiagente dependen críticamente de la estructura de la tarea, logrando mejoras consistentes y una eficiencia superior a la de las bases de referencia existentes.

Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Jiayu Wang, Semih Yavuz, Caiming Xiong, Shafiq JotyTue, 10 Ma💬 cs.CL

LatentMem: Customizing Latent Memory for Multi-Agent Systems

El artículo presenta LatentMem, un marco de memoria multiagente aprendible que supera las limitaciones de homogeneización y sobrecarga de información mediante la síntesis de memorias latentes específicas para cada agente y la optimización de políticas, logrando mejoras significativas en el rendimiento sin modificar los sistemas existentes.

Muxin Fu, Xiangyuan Xue, Yafu Li, Zefeng He, Siyuan Huang, Xiaoye Qu, Yu Cheng, Yang YangTue, 10 Ma🤖 cs.LG

Characterizing MARL for Energy Control: A Multi-KPI Benchmark on the CityLearn Environment

Este artículo establece un nuevo estándar de evaluación para el Aprendizaje por Refuerzo Multiagente (MARL) en la gestión energética urbana mediante el entorno CityLearn, demostrando que los enfoques de entrenamiento descentralizado superan a los centralizados y proponiendo nuevas métricas clave que revelan la resiliencia y sostenibilidad de las políticas aprendidas.

Aymen Khouja, Imen Jendoubi, Oumayma Mahjoub, Oussama Mahfoudhi, Ruan De Kock, Siddarth Singh, Claude FormanekTue, 10 Ma🤖 cs.LG

Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions

Este artículo aborda los desafíos del aprendizaje por refuerzo multiagente en la asignación de recursos para redes V2X mediante la creación de un conjunto de tareas de benchmarking controladas y datos generados en SUMO, revelando que la generalización y robustez de las políticas son los obstáculos principales y proporcionando recursos de código abierto para futuras investigaciones.

Siyuan Wang, Lei Lei, Pranav Maheshwari, Sam Bellefeuille, Kan Zheng, Dusit NiyatoTue, 10 Ma🤖 cs.LG

Evaluating Multi-Agent LLM Architectures for Rare Disease Diagnosis

Este estudio evalúa cuatro topologías de agentes en modelos de lenguaje para el diagnóstico de enfermedades raras, revelando que la topología jerárquica supera ligeramente a las demás, mientras que el modelo adversarial degrada el rendimiento debido a un exceso de duda artificial, lo que demuestra que una mayor complejidad del sistema no garantiza una mejor razonamiento y sugiere la necesidad de una selección dinámica de topologías.

Ahmed AlmasoudTue, 10 Ma💻 cs

Randomise Alone, Reach as a Team

Este artículo estudia juegos concurrentes en grafos con aleatorización distribuida, demostrando que las estrategias sin memoria son suficientes para problemas de umbral y casi seguros, estableciendo su complejidad computacional, introduciendo la lógica IRATL y presentando un solucionador práctico.

Léonard Brice, Thomas A. Henzinger, Alipasha Montaseri, Ali Shafiee, K. S. ThejaswiniTue, 10 Ma💻 cs

NarrativeLoom: Enhancing Creative Storytelling through Multi-Persona Collaborative Improvisation

El sistema de co-creación narrativa "NarrativeLoom", basado en la teoría de variación ciega y retención selectiva, mejora significativamente la originalidad, diversidad y calidad de las historias generadas por usuarios al combinar la generación de opciones diversas mediante múltiples personas de IA con la curación humana, demostrando beneficios especialmente marcados para escritores novatos.

Yuxi Ma, Yongqian Peng, Fengyuan Yang, Siyu Zha, Chi Zhang, Zixia Jia, Zilong Zheng, Yixin ZhuTue, 10 Ma💻 cs

Learning When to Cooperate Under Heterogeneous Goals

Este artículo presenta un enfoque jerárquico que combina aprendizaje por imitación y refuerzo para enseñar a agentes a decidir cuándo cooperar o actuar solos en entornos con objetivos heterogéneos, demostrando un rendimiento superior al de los métodos existentes y analizando cómo la modelización de los compañeros varía según la información observable disponible.

Max Taylor-Davies, Neil Bramley, Christopher G. LucasTue, 10 Ma💻 cs

← Anterior Siguiente →