Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering

이 논문은 LLM 기반 의미 분해와 QR 직교화를 통해 '과거 비교' 축만을 표적으로 하는 훈련 불필요 추론 제어 프레임워크인 SDLS 를 제안하여, 방사선 보고서 생성 시 과거 소견에 기반한 환각을 억제하면서도 임상적 정확도를 향상시키는 방법을 제시합니다.

Ao Li, Rui Liu, Mingjie Li + 6 more2026-03-02💻 cs

Can Unified Generation and Understanding Models Maintain Semantic Equivalence Across Different Output Modalities?

이 논문은 통합 멀티모달 대규모 언어 모델이 텍스트 기반 추론에서는 탁월한 성능을 보이지만, 동일한 추론 결과를 이미지 생성으로 표현할 때 의미적 일관성이 무너지는 '시각적 생성 이해'의 한계를 VGUBench 를 통해 규명하고, 이 문제가 생성 품질 부족이 아닌 교차 모달 의미 정렬의 실패에서 기인함을 시사합니다.

Hongbo Jiang, Jie Li, Yunhang Shen + 4 more2026-03-02💻 cs

UTPTrack: Towards Simple and Unified Token Pruning for Visual Tracking

이 논문은 시각적 객체 추적의 계산 비용을 줄이면서도 정확도를 유지하기 위해 검색 영역, 동적 템플릿, 정적 템플릿을 통합적으로 압축하는 새로운 단일 토큰 가지치기 프레임워크인 UTPTrack 을 제안하고, 다양한 벤치마크에서 기존 방법보다 뛰어난 성능과 효율성을 입증합니다.

Hao Wu, Xudong Wang, Jialiang Zhang + 5 more2026-03-02💬 cs.CL

Unsupervised Causal Prototypical Networks for De-biased Interpretable Dermoscopy Diagnosis

이 논문은 임상 데이터의 선택 편향으로 인한 편향을 제거하고 진단 신뢰도를 높이기 위해, 구조적 인과 모델과 정보 병목 제약을 활용하여 병리학적 특징과 환경적 교란 요소를 비지도 방식으로 분리하고 인과적 개입을 수행하는 'CausalProto'라는 새로운 무감독 인과 프로토타입 네트워크를 제안합니다.

Junhao Jia, Yueyi Wu, Huangwei Chen + 4 more2026-03-02⚡ eess

OPTIAGENT: A Physics-Driven Agentic Framework for Automated Optical Design

이 논문은 광학 설계의 비볼록 최적화 문제를 해결하기 위해 전문 지식이 없는 사용자도 렌즈 시스템을 설계할 수 있도록 도메인 특화 데이터셋, 하이브리드 학습 목표, 물리 법칙 기반의 보상 메커니즘을 활용한 LLM 기반 자동 광학 설계 프레임워크 'OPTIAGENT'를 제안하고 그 우수성을 입증합니다.

Yuyu Geng, Lei Sun, Yao Gao + 6 more2026-03-02🤖 cs.LG

VideoPulse: Neonatal heart rate and peripheral capillary oxygen saturation (SpO2) estimation from contact free video

이 논문은 접촉식 센서의 부작용을 피하기 위해 신생아의 얼굴 영상만으로 심박수와 말초 산소 포화도 (SpO2) 를 정밀하게 추정하는 'VideoPulse' 데이터셋 및 엔드 투 엔드 파이프라인을 제안하고, 이를 통해 저비용 비접촉식 신생아 중환자실 모니터링의 가능성을 입증했습니다.

Deependra Dewagiri, Kamesh Anuradha, Pabadhi Liyanage + 6 more2026-03-02⚡ eess

Breaking the Data Barrier: Robust Few-Shot 3D Vessel Segmentation using Foundation Models

이 논문은 사전 학습된 비전 기반 모델 (DINOv3) 을 3D 어댑터 및 멀티스케일 어그리게이터와 결합하여 소량의 데이터로도 도메인 간 전이 성능이 뛰어난 강건한 혈관 분할을 가능하게 하는 새로운 프레임워크를 제안하고, TopCoW 및 로잔 데이터셋에서 기존 최첨단 방법론보다 월등히 우수한 성능을 입증했습니다.

Kirato Yoshihara, Yohei Sugawara, Yuta Tokuoka + 1 more2026-03-02⚡ eess

EMO-R3: Reflective Reinforcement Learning for Emotional Reasoning in Multimodal Large Language Models

이 논문은 다중 모달 대형 언어 모델의 감정 추론 능력을 향상시키기 위해 구조화된 감정 사고와 반성적 감정 보상을 도입한 'EMO-R3'라는 반성적 강화 학습 프레임워크를 제안하고, 이를 통해 모델의 해석 가능성과 감정 지능을 크게 개선했다고 요약할 수 있습니다.

Yiyang Fang, Wenke Huang, Pei Fu + 5 more2026-03-02🤖 cs.AI