Context Engineering: From Prompts to Corporate Multi-Agent Architecture
이 논문은 프롬프트 엔지니어링의 한계를 넘어 기업용 다중 에이전트 시스템의 성숙도를 위한 새로운 패러다임으로 '컨텍스트 엔지니어링'을 제안하고, 이를 의도 엔지니어링과 명세 엔지니어링과 함께 에이전트 엔지니어링의 피라미드 성숙도 모델로 정립합니다.
116 편의 논문
이 논문은 프롬프트 엔지니어링의 한계를 넘어 기업용 다중 에이전트 시스템의 성숙도를 위한 새로운 패러다임으로 '컨텍스트 엔지니어링'을 제안하고, 이를 의도 엔지니어링과 명세 엔지니어링과 함께 에이전트 엔지니어링의 피라미드 성숙도 모델로 정립합니다.
이 논문은 진단, 측정, 분할 및 비디오 스트림 요약 등 다양한 임상 작업을 통합적으로 수행하여 기존 자동화 도구의 한계를 극복하고, 다중 전문가 에이전트 조정을 통해 가장 정확하고 견고한 태아 초음파 분석 및 보고 솔루션을 제시하는 'FetalAgents' 시스템을 제안합니다.
이 논문은 기존 시간 기반 접근 제어의 한계를 지적하고, 메모리 일관성 모델 (MESI) 을 권한 관리에 적용한 '역량 일관성 시스템 (CCS)'을 제안하여, 에이전트 실행 환경에서 권한 취소 지연으로 인한 무단 접근을 시간 의존적 스케일링이 아닌 실행 횟수에 기반한 안전한 상한선으로 제어하는 새로운 프레임워크를 제시합니다.
이 논문은 강화학습 없이도 프롬프트를 매개변수화하여 에이전트의 대화 행동을 체계적으로 제어하는 경량 정책 프레임워크를 제안하고, 이를 통해 다중 에이전트 대화의 역동성을 효과적으로 조절할 수 있음을 실험을 통해 입증합니다.
이 논문은 벌의 군집 의사결정 방정식을 확장하여 감정적 가치와 각성 수준이 상호작용률을 조절함으로써 집단적 합의의 결과와 속도에 미치는 영향을 분석하고, 감정 전염과 비선형 증폭이 어떻게 집단적 선택을 형성하는지 규명합니다.
이 논문은 로봇 공학에서 의사결정 및 학습을 위한 인지 모델링의 진화와 가치 시스템의 역할을 utility theory 관점에서 종합적으로 검토하고, 향후 연구 방향과 해결해야 할 과제를 제시합니다.
이 논문은 경쟁자가 서로의 상태나 행동을 알지 못하는 상황에서도 다중-팔 밴딧 알고리즘이 동기화된 행동을 통해 '순진한 담합'을 학습할 수 있음을 보여주며, 이는 탐험과 확정을 어떻게 균형시키는지에 따라 발생 여부가 결정된다고 주장합니다.
이 논문은 MLLM 검증기에서 발생하는 '동의 편향 (agreement bias)'을 해결하기 위해 사전 지식을 생성한 후 이를 기반으로 추론하는 '자기 기반 검증 (SGV)' 방법을 제안함으로써, 에이전트의 실패 감지 정확도와 태스크 완료율을 기존 최첨단 성능보다 크게 향상시켰다고 설명합니다.
이 논문은 대규모 실험을 통해 LLM 기반 에이전트의 행동 추론에서 동기 (motivations) 는 거의 완벽하게 추론 가능하지만 신념 체계 (belief systems) 는 구조적 한계로 인해 정확도가 50% 미만으로 제한되는 근본적인 비대칭성이 존재함을 규명했습니다.
이 논문은 외부 감독이나 추가 학습 없이 에이전트 응답을 기반으로 샤플리 값을 추정하여 동적 DAG 통신 구조를 자동 구성함으로써, 특히 약한 LLM 환경에서도 기존 방법론의 한계를 극복하고 다중 에이전트 시스템의 협업 효율성과 정확성을 극대화하는 'SelfOrg' 프레임워크를 제안합니다.
이 논문은 외부 질문을 통해 자기 수정을 유도하는 비대칭적 프롬프팅 프로토콜인 FOR-Prompting 을 제안하며, 이는 학습 없이도 작은 모델에서도 수학 및 개방형 과제에서 기존 방법보다 우수한 성능과 인간 선호도를 보여줍니다.
이 논문은 인과 추론 과정에서 서로 다른 가설 간의 내적 대화를 외부화하기 위해 구조적 추론과 비판적 검토를 수행하는 두 에이전트가 논쟁을 통해 결론을 도출하는 'CRAwDAD' 프레임워크를 제안하며, CLadder 벤치마크에서 강력한 추론 모델들의 인과 추론 정확도를 크게 향상시키는 효과를 입증합니다.
이 논문은 전역적 오케스트레이션을 강화학습 기반으로 구현한 'MAS-Orchestra' 프레임워크와 다중 에이전트 시스템의 효용을 체계적으로 분석하는 'MASBENCH' 벤치마크를 제안하여, 단일 에이전트 대비 다중 에이전트 시스템의 성능 향상을 효율적으로 달성하고 그 작동 원리를 규명합니다.
이 논문은 역할 인식 맞춤형 메모리와 정보 과부하 문제를 해결하기 위해 토큰 효율적인 잠재 메모리 프레임워크인 LatentMem 과 이를 최적화하는 LMPO 를 제안하여 다중 에이전트 시스템의 성능을 기존 방식 대비 최대 19.36% 향상시킨 연구입니다.
이 논문은 CityLearn 환경을 활용하여 도시 에너지 관리에 대한 다중 에이전트 강화학습 (MARL) 알고리즘을 다양한 핵심 성과 지표 (KPI) 로 평가하고, 분산 훈련이 중앙 집중식 훈련보다 우수하며 시간적 의존성 학습이 배터리 수명 등 지속 가능성 지표 향상에 기여함을 입증했습니다.
이 논문은 C-V2X 무선 자원 할당 문제를 다중 에이전트 강화 학습의 주요 난제를 분리하여 평가할 수 있는 일련의 간섭 게임과 대규모 데이터셋으로 체계화하고, 다양한 차량 토폴로지에서의 정책 견고성과 일반화가 가장 큰 도전 과제임을 규명하며 관련 코드와 벤치마크를 오픈소스로 공개합니다.
이 논문은 희귀 질환 진단을 위해 네 가지 다른 다중 에이전트 토폴로지를 평가한 결과, 계층적 구조가 가장 높은 정확도를 보였으며 복잡한 에이전트 시스템이 항상 더 나은 추론을 보장하지는 않는다는 점을 밝혀 동적 토폴로지 선택의 필요성을 강조합니다.
이 논문은 플레이어 간 공유된 무작위성이 없는 분산 무작위화 환경에서 협력하는 동시 그래프 게임의 임계값 및 거의 확실한 도달 문제를 연구하여 메모리 없는 전략의 충분성, 계산 복잡도 결과, 그리고 이를 위한 새로운 논리 IRATL 과 솔버를 제시합니다.
이 논문은 캠벨의 무작위 변이와 선택적 보존 이론에 기반한 다중 페르소나 협업 시스템 '내러티브 로움'이 사용자의 창의적 스토리텔링을 지원하여, 전문가 평가에서 유창성, 유연성, 독창성, 정교함 등 모든 창의성 차원에서 기존 도구보다 우수한 성과를 보였음을 50 명 대상 통제 실험을 통해 입증했습니다.
이 논문은 이질적인 목표를 가진 에이전트들이 협력할지 말지 결정하는 메타 수준 문제를 해결하기 위해 모방 학습과 강화 학습을 계층적으로 결합한 새로운 접근법을 제안하고, 팀메이트의 행동을 예측하는 보조 구성 요소가 관측 가능한 목표 정보의 양에 반비례하여 성능에 영향을 미친다는 것을 보여줍니다.