Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

이 논문은 기대값 기반의 안전성 제약을 전체 비용 분포를 비교하는 1 차 확률적 우세 (FSD) 제약으로 대체하고, 최적 수송 프레임워크와 양자 가중치를 통해 보편적 스펙트럼 위험 측도를 통제하는 새로운 정렬 프레임워크인 RAD 를 제안하여 안전 RLHF 의 강건성과 위험 민감성을 향상시킵니다.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

Contact Coverage-Guided Exploration for General-Purpose Dexterous Manipulation

이 논문은 손과 물체의 접촉 패턴을 체계적으로 탐색하여 다양한 정교한 조작 작업을 위한 일반 목적의 강화학습을 가능하게 하는 '접촉 커버리지 유도 탐색 (CCGE)' 방법을 제안하고, 이를 통해 학습 효율성과 성공률을 크게 향상시켰음을 입증합니다.

Zixuan Liu, Ruoyi Qiao, Chenrui Tie, Xuanwei Liu, Yunfan Lou, Chongkai Gao, Zhixuan Xu, Lin Shao2026-03-12🤖 cs.AI

GroundCount: Grounding Vision-Language Models with Object Detection for Mitigating Counting Hallucinations

이 논문은 객체 탐지 모델의 공간적 위치 정보를 시각-언어 모델에 명시적으로 결합하여 카운팅 오류를 줄이고 추론 시간을 단축하는 'GroundCount' 프레임워크를 제안하며, 이를 통해 다양한 모델에서 카운팅 정확도를 유의미하게 향상시킵니다.

Boyuan Chen, Minghao Shao, Siddharth Garg, Ramesh Karri, Muhammad Shafique2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

이 논문은 16 명의 전문가 인터뷰를 통해 프런티어 AI 시스템의 고유한 특성으로 인해 인간 업리프트 연구 (RCT) 의 내적·외적·구성 타당성 가정이 어떻게 도전받는지 분석하고, 이러한 방법론적 난제를 해결하기 위한 실용적 방안과 고위험 의사결정 시 증거의 적절한 활용 범위를 제시합니다.

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

이 논문은 컴퓨터 과학자와 미술사가의 협업을 통해 비전 - 언어 모델이 예술적 스타일을 인식하는 메커니즘을 분석한 결과, 추출된 개념의 90% 가 미술사가들에 의해 관련성이 있다고 평가되었으며, 모델이 때로는 형식적 대비와 같은 다른 방식으로 개념을 이해하여 스타일 예측에 성공함을 밝혔습니다.

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

이 논문은 전통적인 열화상 기법의 한계를 극복하고 경성 물리 법칙을 준수하는 미분 가능 물리 솔버를 활용하여 3D 열 확산 장을 연속 신경장으로 파라미터화함으로써, 비파괴 검사를 위한 정량적 3D 재료 특성 재구성 및 결함 위치 파악의 정확도를 획기적으로 향상시킨 'NeFTY' 프레임워크를 제안합니다.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

SDR-GAIN: A High Real-Time Occluded Pedestrian Pose Completion Method for Autonomous Driving

이 논문은 자율주행 환경에서 차량이나 장애물로 인해 가려진 보행자의 키 포인트를 수치 분포 기반의 생성적 적대 신경망 (SDR-GAIN) 을 통해 실시간으로 정확하게 복원하는 새로운 방법을 제안하고 COCO 및 JAAD 데이터셋에서 기존 방법보다 우수한 성능과 마이크로초 단위의 추론 속도를 입증했습니다.

Honghao Fu, Yongli Gu, Yidong Yan + 3 more2026-03-11🤖 cs.AI

DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild

이 논문은 사전 훈련된 텍스트 - 이미지 확산 모델의 강건한 지각 능력을 활용하여 제한된 데이터로도 뛰어난 일반화 성능을 보이는 새로운 블라인드 이미지 품질 평가 방법인 DP-IQA 를 제안하고, 이를 경량화하여 다양한 자연 환경 데이터셋에서 최첨단 성능을 달성함을 보여줍니다.

Honghao Fu, Yufei Wang, Wenhan Yang + 2 more2026-03-11🤖 cs.AI

Dance of the ADS: Orchestrating Failures through Historically-Informed Scenario Fuzzing

이 논문은 오픈드라이브 (OPENDRIVE) 맵 데이터와 그래프 신경망을 활용해 과거 테스트 데이터를 기반으로 고위험 시나리오를 예측·선별하는 'ScenarioFuzz'를 제안함으로써, 기존 방법 대비 시간 비용을 60.3% 절감하고 단위 시간당 발견되는 오류 시나리오를 103% 증가시켜 자율주행 시스템의 안전성을 검증하는 새로운 패러다임을 제시합니다.

Tong Wang, Taotao Gu, Huan Deng + 3 more2026-03-11🤖 cs.AI

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

이 논문은 부분 관측성과 희소한 보상 신호 하에서 분산형 환경에 있는 이종 다중 에이전트의 협력을 향상시키기 위해 그래프 신경망 (GNN) 기반의 내재적 보상을 활용하는 'CoHet' 알고리즘을 제안하고, 이를 통해 기존 최첨단 방법보다 우수한 성능을 입증합니다.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek Khan2026-03-11🤖 cs.AI