cs.MA 편의 논문 | Gist.Science

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

이 논문은 프롬프트 엔지니어링의 한계를 넘어 기업용 다중 에이전트 시스템의 성숙도를 위한 새로운 패러다임으로 '컨텍스트 엔지니어링'을 제안하고, 이를 의도 엔지니어링과 명세 엔지니어링과 함께 에이전트 엔지니어링의 피라미드 성숙도 모델로 정립합니다.

Vera V. VishnyakovaWed, 11 Ma🤖 cs.AI

FetalAgents: A Multi-Agent System for Fetal Ultrasound Image and Video Analysis

이 논문은 진단, 측정, 분할 및 비디오 스트림 요약 등 다양한 임상 작업을 통합적으로 수행하여 기존 자동화 도구의 한계를 극복하고, 다중 전문가 에이전트 조정을 통해 가장 정확하고 견고한 태아 초음파 분석 및 보고 솔루션을 제시하는 'FetalAgents' 시스템을 제안합니다.

Xiaotian Hu, Junwei Huang, Mingxuan Liu, Kasidit Anmahapong, Yifei Chen, Yitong Luo, Yiming Huang, Xuguang Bai, Zihan Li, Yi Liao, Haibo Qu, Qiyuan TianWed, 11 Ma💻 cs

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

이 논문은 기존 시간 기반 접근 제어의 한계를 지적하고, 메모리 일관성 모델 (MESI) 을 권한 관리에 적용한 '역량 일관성 시스템 (CCS)'을 제안하여, 에이전트 실행 환경에서 권한 취소 지연으로 인한 무단 접근을 시간 의존적 스케일링이 아닌 실행 횟수에 기반한 안전한 상한선으로 제어하는 새로운 프레임워크를 제시합니다.

Vladyslav ParakhinWed, 11 Ma💻 cs

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

이 논문은 강화학습 없이도 프롬프트를 매개변수화하여 에이전트의 대화 행동을 체계적으로 제어하는 경량 정책 프레임워크를 제안하고, 이를 통해 다중 에이전트 대화의 역동성을 효과적으로 조절할 수 있음을 실험을 통해 입증합니다.

Hongbo Bo, Jingyu Hu, Weiru LiuWed, 11 Ma🤖 cs.AI

Emotional Modulation in Swarm Decision Dynamics

이 논문은 벌의 군집 의사결정 방정식을 확장하여 감정적 가치와 각성 수준이 상호작용률을 조절함으로써 집단적 합의의 결과와 속도에 미치는 영향을 분석하고, 감정 전염과 비선형 증폭이 어떻게 집단적 선택을 형성하는지 규명합니다.

David Freire-ObregónWed, 11 Ma🤖 cs.AI

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

이 논문은 로봇 공학에서 의사결정 및 학습을 위한 인지 모델링의 진화와 가치 시스템의 역할을 utility theory 관점에서 종합적으로 검토하고, 향후 연구 방향과 해결해야 할 과제를 제시합니다.

Qin YangTue, 10 Ma💻 cs

The Illusion of Collusion

이 논문은 경쟁자가 서로의 상태나 행동을 알지 못하는 상황에서도 다중-팔 밴딧 알고리즘이 동기화된 행동을 통해 '순진한 담합'을 학습할 수 있음을 보여주며, 이는 탐험과 확정을 어떻게 균형시키는지에 따라 발생 여부가 결정된다고 주장합니다.

Connor Douglas, Foster Provost, Arun SundararajanTue, 10 Ma💻 cs

Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

이 논문은 MLLM 검증기에서 발생하는 '동의 편향 (agreement bias)'을 해결하기 위해 사전 지식을 생성한 후 이를 기반으로 추론하는 '자기 기반 검증 (SGV)' 방법을 제안함으로써, 에이전트의 실패 감지 정확도와 태스크 완료율을 기존 최첨단 성능보다 크게 향상시켰다고 설명합니다.

Moises Andrade, Joonhyuk Cha, Brandon Ho, Vriksha Srihari, Karmesh Yadav, Zsolt KiraTue, 10 Ma🤖 cs.LG

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

이 논문은 대규모 실험을 통해 LLM 기반 에이전트의 행동 추론에서 동기 (motivations) 는 거의 완벽하게 추론 가능하지만 신념 체계 (belief systems) 는 구조적 한계로 인해 정확도가 50% 미만으로 제한되는 근본적인 비대칭성이 존재함을 규명했습니다.

Jason Starace, Terence SouleTue, 10 Ma🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

이 논문은 외부 감독이나 추가 학습 없이 에이전트 응답을 기반으로 샤플리 값을 추정하여 동적 DAG 통신 구조를 자동 구성함으로써, 특히 약한 LLM 환경에서도 기존 방법론의 한계를 극복하고 다중 에이전트 시스템의 협업 효율성과 정확성을 극대화하는 'SelfOrg' 프레임워크를 제안합니다.

Nurbek Tastan, Samuel Horvath, Karthik NandakumarTue, 10 Ma🤖 cs.LG

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

이 논문은 외부 질문을 통해 자기 수정을 유도하는 비대칭적 프롬프팅 프로토콜인 FOR-Prompting 을 제안하며, 이는 학습 없이도 작은 모델에서도 수학 및 개방형 과제에서 기존 방법보다 우수한 성능과 인간 선호도를 보여줍니다.

He Zhang, Anzhou Zhang, Jian DaiTue, 10 Ma💬 cs.CL

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

이 논문은 인과 추론 과정에서 서로 다른 가설 간의 내적 대화를 외부화하기 위해 구조적 추론과 비판적 검토를 수행하는 두 에이전트가 논쟁을 통해 결론을 도출하는 'CRAwDAD' 프레임워크를 제안하며, CLadder 벤치마크에서 강력한 추론 모델들의 인과 추론 정확도를 크게 향상시키는 효과를 입증합니다.

Finn G. Vamosi, Nils D. ForkertTue, 10 Ma🤖 cs.LG

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

이 논문은 전역적 오케스트레이션을 강화학습 기반으로 구현한 'MAS-Orchestra' 프레임워크와 다중 에이전트 시스템의 효용을 체계적으로 분석하는 'MASBENCH' 벤치마크를 제안하여, 단일 에이전트 대비 다중 에이전트 시스템의 성능 향상을 효율적으로 달성하고 그 작동 원리를 규명합니다.

Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Jiayu Wang, Semih Yavuz, Caiming Xiong, Shafiq JotyTue, 10 Ma💬 cs.CL

← 이전 다음 →

cs.MA

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

FetalAgents: A Multi-Agent System for Fetal Ultrasound Image and Video Analysis

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

Emotional Modulation in Swarm Decision Dynamics

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

The Illusion of Collusion

Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

Stochastic Self-Organization in Multi-Agent Systems

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

LatentMem: Customizing Latent Memory for Multi-Agent Systems

Characterizing MARL for Energy Control: A Multi-KPI Benchmark on the CityLearn Environment

Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions

Evaluating Multi-Agent LLM Architectures for Rare Disease Diagnosis

Randomise Alone, Reach as a Team

NarrativeLoom: Enhancing Creative Storytelling through Multi-Persona Collaborative Improvisation

Learning When to Cooperate Under Heterogeneous Goals