Red-Teaming Vision-Language-Action Models via Quality Diversity Prompt Generation for Robust Robot Policies

이 논문은 품질 다양성 (Quality Diversity) 기법과 비전 - 언어 모델을 결합하여 VLA 기반 로봇의 취약점을 발견하고 다양한 자연어 지시문을 생성함으로써 로봇 정책의 견고성을 향상시키는 Q-DIG 프레임워크를 제안합니다.

Siddharth Srikanth, Freddie Liang, Sophie Hsu, Varun Bhatt, Shihan Zhao, Henry Chen, Bryon Tjanaka, Minjune Hwang, Akanksha Saran, Daniel Seita, Aaquib Tabrez, Stefanos Nikolaidis2026-03-16💬 cs.CL

TERMINATOR: Learning Optimal Exit Points for Early Stopping in Chain-of-Thought Reasoning

이 논문은 대형 추론 모델의 과도한 추론을 방지하고 추론 길이를 14%~55% 단축하면서도 성능을 유지하기 위해, 최종 답변이 처음 나타나는 시점을 예측하여 최적의 중단 지점을 학습하는 새로운 조기 종료 전략 'TERMINATOR'를 제안합니다.

Alliot Nagle, Jakhongir Saydaliev, Dhia Garbaya, Michael Gastpar, Ashok Vardhan Makkuva, Hyeji Kim2026-03-16🤖 cs.LG

Embedded Quantum Machine Learning in Embedded Systems: Feasibility, Hybrid Architectures, and Quantum Co-Processors

이 논문은 2026 년 기준 리소스가 제한된 엣지 플랫폼에 양자 머신러닝을 적용하는 것의 실현 가능성과 하이브리드 아키텍처 및 양자 코프로세서 구현 경로를 분석하고, 주요 기술적 장벽을 극복하기 위한 공학적 방향과 책임 있는 배포를 위한 거버넌스 방안을 제시합니다.

Somdip Dey, Syed Muhammad Raza2026-03-16🤖 cs.LG

Reinforcement Learning for Diffusion LLMs with Entropy-Guided Step Selection and Stepwise Advantages

이 논문은 확산 언어 모델 (DLM) 에 적용하기 위해 엔트로피 기반 단계 선택과 단계별 이득을 활용한 효율적인 강화 학습 알고리즘을 제안하여, 기존 방법의 편향을 해소하고 코딩 및 논리적 추론 분야에서 최첨단 성능을 달성했습니다.

Vishnu Teja Kunde, Fatemeh Doudi, Mahdi Farahbakhsh, Dileep Kalathil, Krishna Narayanan, Jean-Francois Chamberland2026-03-16🤖 cs.LG

AgentDrift: Unsafe Recommendation Drift Under Tool Corruption Hidden by Ranking Metrics in LLM Agents

이 논문은 도구 오염 하에서도 기존 랭킹 지표가 안전성 저하를 감지하지 못해 위험한 추천이 지속되는 'AgentDrift' 현상을 규명하고, 이를 해결하기 위해 안전성을 명시적으로 반영한 평가 지표와 궤적 수준의 모니터링이 필요함을 주장합니다.

Zekun Wu, Adriano Koshiyama, Sahan Bulathwela, Maria Perez-Ortiz2026-03-16💬 cs.CL

Multiscale Structure-Guided Latent Diffusion for Multimodal MRI Translation

이 논문은 기존 다중 모달 MRI 번역 방법의 해부학적 불일치와 질감 저하 문제를 해결하기 위해 잠재 공간에서 스타일과 구조를 분리하고 다중 스케일 특징을 활용하여 MSG-LDM 이라는 새로운 프레임워크를 제안하고, BraTS2020 및 WMH 데이터셋에서 기존 방법보다 우수한 구조 재구성 성능을 입증했습니다.

Jianqiang Lin (Northeastern University, Shenyang, China, Key Laboratory of Intelligent Computing in Medical Image, Shenyang, China), Zhiqiang Shen (Northeastern University, Shenyang, China, Key Laboratory of Intelligent Computing in Medical Image, Shenyang, China), Peng Cao (Northeastern University, Shenyang, China, National Frontiers Science Center for Industrial Intelligence and Systems Optimization, Shenyang, China), Jinzhu Yang (Northeastern University, Shenyang, China, National Frontiers Science Center for Industrial Intelligence and Systems Optimization, Shenyang, China), Osmar R. Zaiane (University of Alberta, Edmonton, Canada), Xiaoli Liu (AiShiWeiLai AI Research, Beijing, China)2026-03-16⚡ eess

CA-HFP: Curvature-Aware Heterogeneous Federated Pruning with Model Reconstruction

이 논문은 이기종 엣지 디바이스 환경에서 곡률 기반 중요도 점수와 경량 재구성을 통해 개인화된 구조적 가지치기를 수행하면서도 전역 모델의 수렴성과 정확도를 보장하는 'CA-HFP' 프레임워크를 제안하고, 이를 통해 통신 및 계산 비용을 크게 절감하면서도 기존 방법보다 우수한 성능을 입증합니다.

Gang Hu, Yinglei Teng, Pengfei Wu, Shijun Ma2026-03-16🤖 cs.LG

Optimize Wider, Not Deeper: Consensus Aggregation for Policy Optimization

이 논문은 PPO 의 반복 학습에서 발생하는 노이즈 문제를 해결하기 위해 여러 모델의 예측을 평균화하는 'CAPO' 알고리즘을 제안하여, 추가적인 환경 상호작용 없이도 계산 자원을 깊게가 아닌 넓게 활용함으로써 샘플 효율성을 극대화함을 보여줍니다.

Zelal Su (Lain), Mustafaoglu, Sungyoung Lee, Eshan Balachandar, Risto Miikkulainen, Keshav Pingali2026-03-16🤖 cs.LG

CarPLAN: Context-Adaptive and Robust Planning with Dynamic Scene Awareness for Autonomous Driving

이 논문은 자율주행의 모방 학습 기반 계획 성능을 향상시키기 위해 미래 변위 예측을 통한 공간 인식 강화와 다양한 주행 상황에 적응하는 다중 전문가 디코더를 도입한 'CarPLAN' 프레임워크를 제안하고, nuPlan 및 Waymax 벤치마크에서 최첨단 성능을 입증합니다.

Junyong Yun, Jungho Kim, ByungHyun Lee, Dongyoung Lee, Sehwan Choi, Seunghyeop Nam, Kichun Jo, Jun Won Choi2026-03-16🤖 cs.AI

FastDSAC: Unlocking the Potential of Maximum Entropy RL in High-Dimensional Humanoid Control

이 논문은 차원별 엔트로피 조절과 연속 분포 비평가라는 새로운 기법을 통해 최대 엔트로피 강화학습이 고차원 인간형 로봇 제어에서 결정적 정책 기반 방법과 경쟁하거나 이를 능가할 수 있음을 입증하는 'FastDSAC' 프레임워크를 제안합니다.

Jun Xue, Junze Wang, Xinming Zhang, Shanze Wang, Yanjun Chen, Wei Zhang2026-03-16🤖 cs.LG

Literary Narrative as Moral Probe : A Cross-System Framework for Evaluating AI Ethical Reasoning and Refusal Behavior

이 논문은 문학 서사를 활용한 새로운 평가 프레임워크를 통해 기존 AI 윤리 평가가 표면적 답변 생성에 그치는 반면, 본 연구는 다양한 AI 시스템에서 진정한 도덕적 추론 능력과 거부 행동을 측정할 수 있음을 입증하고, 시스템 능력 향상과 함께 정교해지는 반성적 실패 모드를 규명하여 고위험 분야 배포 결정에 중요한 함의를 제시합니다.

David C. Flynn2026-03-16💬 cs.CL