Security Considerations for Multi-agent Systems

이 논문은 다중 에이전트 시스템 (MAS) 의 고유한 보안 위협을 체계적으로 분석하고 16 가지 기존 보안 프레임워크를 평가한 결과, 현재 어떤 프레임워크도 모든 위협 카테고리를 충분히 커버하지 못하며 OWASP Agentic Security Initiative 와 CDAO Responsible AI 툴킷이 각각 설계 및 운영 단계에서 상대적으로 가장 높은 점수를 받았음을 밝혔습니다.

Tam Nguyen, Moses Ndebugre, Dheeraj Arremsetty2026-03-11🤖 cs.AI

Gender Fairness in Audio Deepfake Detection: Performance and Disparity Analysis

이 논문은 ASVspoof 5 데이터셋을 활용하여 오디오 딥페이크 탐지 모델의 전반적인 성능과 성별 간 편향을 분석한 결과, 기존 성능 지표만으로는 성별에 따른 오류 분포의 불균형을 파악하기 어렵지만 공정성 지표를 적용함으로써 이러한 편향을 발견하고 보다 공정하고 견고한 탐지 시스템 개발의 중요성을 강조합니다.

Aishwarya Fursule, Shruti Kshirsagar, Anderson R. Avila2026-03-11🤖 cs.AI

Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG

이 논문은 로봇이 인간의 선호도를 학습할 때 단순한 학습 효율성뿐만 아니라 사용자의 경험까지 고려하여, CMA-ES-IG 알고리즘을 통해 더 효과적이고 사용자 친화적인 행동 표현 공간을 탐색하는 방법을 제안하고 실험을 통해 검증합니다.

Nathaniel Dennler, Zhonghao Shi, Yiran Tao, Andreea Bobu, Stefanos Nikolaidis, Maja Mataric2026-03-11🤖 cs.AI

MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games

본 논문은 다중 에이전트 LLM 게임의 불안정성과 성능 저하를 해결하기 위해, 자기대결을 통해 구조화된 통찰력을 기억하고 불확실성을 고려한 탐색을 결합한 'MEMO' 프레임워크를 제안하여 다양한 텍스트 기반 게임에서 승률을 크게 향상시키고 결과의 변동성을 줄이는 효과를 입증했습니다.

Yunfei Xie, Kevin Wang, Bobby Cheng, Jianzhu Yao, Zhizhou Sha, Alexander Duffy, Yihan Xi, Hongyuan Mei, Cheston Tan, Chen Wei, Pramod Viswanath, Zhangyang Wang2026-03-11🤖 cs.AI

Automating Detection and Root-Cause Analysis of Flaky Tests in Quantum Software

이 논문은 양자 소프트웨어의 비결정적 특성으로 인한 '플래키 테스트'를 탐지하고 근본 원인을 분석하기 위해 대규모 언어 모델 (LLM) 을 활용한 자동화 파이프라인을 제안하며, 이를 통해 기존 데이터셋을 54% 확장하고 플래키 테스트 분류 및 원인 규명에서 높은 정확도를 입증했습니다.

Janakan Sivaloganathan, Ainaz Jamshidi, Andriy Miranskyy, Lei Zhang2026-03-11🤖 cs.AI

PlayWorld: Learning Robot World Models from Autonomous Play

이 논문은 성공 편향된 인간 시연 대신 자율적 로봇 놀이 (self-play) 를 통해 물리적으로 일관된 고충실도 비디오 세계 모델을 학습하는 'PlayWorld'를 제안하며, 이를 통해 접촉이 많은 상호작용 예측 정확도를 높이고 실제 환경에서의 정책 성공률을 65% 까지 향상시킨다고 설명합니다.

Tenny Yin, Zhiting Mei, Zhonghe Zheng, Miyu Yamane, David Wang, Jade Sceats, Samuel M. Bateman, Lihan Zha, Apurva Badithela, Ola Shorinwa, Anirudha Majumdar2026-03-11🤖 cs.AI

WS-Net: Weak-Signal Representation Learning and Gated Abundance Reconstruction for Hyperspectral Unmixing via State-Space and Weak Signal Attention Fusion

이 논문은 상태 공간 모델링과 약한 신호 어텐션 융합을 통해 하이퍼스펙트럼 이미지 내 약한 신호의 붕괴 문제를 해결하고, 기존 최첨단 방법들보다 RMSE 와 SAD 를 각각 최대 55% 와 63% 까지 감소시킨 새로운 심층 분해 프레임워크인 WS-Net 을 제안합니다.

Zekun Long, Ali Zia, Guanyiman Fu, Vivien Rolland, Jun Zhou2026-03-11🤖 cs.AI

From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring

본 논문은 원격 환자 모니터링 데이터를 실시간으로 분석하여 개별 임상진료자보다 높은 민감도로 응급 상황을 식별하고, 확장 가능한 비용 효율적인 임상 분류를 가능하게 하는 자율 AI 에이전트 'Sentinel'의 개발과 유효성을 입증했습니다.

Seunghwan Kim (AnsibleHealth Inc., San Francisco, USA), Tiffany H. Kung (AnsibleHealth Inc., San Francisco, USA, Stanford School of Medicine, Stanford, USA), Heena Verma (AnsibleHealth Inc., San Francisco, USA), Dilan Edirisinghe (AnsibleHealth Inc., San Francisco, USA), Kaveh Sedehi (AnsibleHealth Inc., San Francisco, USA), Johanna Alvarez (AnsibleHealth Inc., San Francisco, USA), Diane Shilling (AnsibleHealth Inc., San Francisco, USA), Audra Lisa Doyle (AnsibleHealth Inc., San Francisco, USA), Ajit Chary (AnsibleHealth Inc., San Francisco, USA), William Borden (AnsibleHealth Inc., San Francisco, USA, George Washington University, Washington, D.C., USA), Ming Jack Po (AnsibleHealth Inc., San Francisco, USA)2026-03-11🤖 cs.AI

Sim2Act: Robust Simulation-to-Decision Learning via Adversarial Calibration and Group-Relative Perturbation

이 논문은 시뮬레이션 오차를 의사결정 영향도에 따라 재가중하는 적대적 보정 메커니즘과 시뮬레이션 불확실성 하에서 정책 학습을 안정화하는 그룹 상대적 교란 전략을 통해, 공급망 등 임무 중대 분야에서 견고한 시뮬레이션-의사결정 학습 프레임워크인 Sim2Act 를 제안합니다.

Hongyu Cao, Jinghan Zhang, Kunpeng Liu, Dongjie Wang, Feng Xia, Haifeng Chen, Xiaohua Hu, Yanjie Fu2026-03-11🤖 cs.AI

GST-VLA: Structured Gaussian Spatial Tokens for 3D Depth-Aware Vision-Language-Action Models

이 논문은 고정된 밀도 깊이와 의미론적 패치 특징을 3D 가우시안 원시 객체로 변환하는 가우시안 공간 토크나이저 (GST) 와 3D 깊이 인식 체인 오브 씽킹 (DA-CoT) 추론을 도입하여 LIBERO 와 SimplerEnv 환경에서 기존 VLA 모델보다 뛰어난 정밀도와 성능을 달성한 GST-VLA 를 제안합니다.

Md Selim Sarowar, Omer Tariq, Sungho Kim2026-03-11🤖 cs.AI

Not All News Is Equal: Topic- and Event-Conditional Sentiment from Finetuned LLMs for Aluminum Price Forecasting

이 논문은 2007 년부터 2024 년까지의 데이터에 기반하여, Qwen3 모델로 미세 조정된 LLM 을 활용해 뉴스 감성을 추출하고 이를 기존 표형 데이터와 결합한 LSTM 모델이 시장 변동성이 높은 기간에 알루미늄 가격 예측 및 투자 수익률 (샤프 지수 1.04) 을 기존 모델보다 크게 향상시킨다는 것을 입증했습니다.

Alvaro Paredes Amorin, Andre Python, Christoph Weisser2026-03-11🤖 cs.AI

Composed Vision-Language Retrieval for Skin Cancer Case Search via Joint Alignment of Global and Local Representations

이 논문은 피부암 진단을 지원하기 위해 참조 이미지와 텍스트 설명을 결합한 복합 질의에 대해 전역 및 지역적 특징을 정렬하는 트랜스포머 기반 프레임워크를 제안하고, Derm7pt 데이터셋에서 기존 최첨단 방법보다 우수한 성능을 입증했습니다.

Yuheng Wang, Yuji Lin, Dongrun Zhu, Jiayue Cai, Sunil Kalia, Harvey Lui, Chunqi Chang, Z. Jane Wang, Tim K. Lee2026-03-11🤖 cs.AI