MediX-R1: Open Ended Medical Reinforcement Learning

이 논문은 그룹 기반 강화학습과 정밀한 보상 신호를 활용하여 의료 다중 모달 대규모 언어 모델이 객관식 형식을 넘어 임상적으로 신뢰할 수 있는 자유형 답변을 생성할 수 있도록 한 'MediX-R1' 프레임워크를 제안하고, 이를 통해 기존 오픈소스 베이스라인을 능가하는 성능을 입증했습니다.

Sahal Shaji Mullappilly, Mohammed Irfan Kurpath, Omair Mohamed + 5 more2026-02-27💻 cs

Renaissance: Investigating the Pretraining of Vision-Language Encoders

이 논문은 비전 - 언어 (VL) 인코더의 사전 학습 최적화를 탐구하기 위해 메타 분석을 수행하고, 대규모 VL 모델의 일부 부분을 동결하여 연산 비용을 절감하면서도 하위 작업 성능을 유지할 수 있음을 입증하는 동시에, 이러한 연구를 용이하게 하는 'Renaissance'라는 새로운 VL 평가 프레임워크를 제안합니다.

Clayton Fields, Casey Kennington2026-02-26💬 cs.CL

Object-Centric World Models from Few-Shot Annotations for Sample-Efficient Reinforcement Learning

이 논문은 사전 학습된 분할 네트워크를 활용하여 소수의 주석만으로 객체 중심 표현을 학습함으로써 복잡한 시각 환경에서 샘플 효율성을 극대화하는 새로운 모델 기반 강화학습 프레임워크인 OC-STORM 을 제안하고, Atari 100k 와 Hollow Knight 벤치마크에서 기존 기법들을 압도하는 성능을 입증합니다.

Weipu Zhang, Adam Jelley, Trevor McInroe + 2 more2026-02-26🤖 cs.LG

PD-VLA: Accelerating Vision-Language-Action Model Integrated with Action Chunking via Parallel Decoding

이 논문은 액션 청킹을 통합한 비전 - 언어 - 행동 (VLA) 모델의 추론 효율성을 저하시키는 문제를 해결하기 위해, 모델 구조 변경 없이 훈련 없이도 추론 속도를 획기적으로 높이는 최초의 병렬 디코딩 프레임워크인 PD-VLA 를 제안하고 그 유효성을 실증합니다.

Wenxuan Song, Jiayi Chen, Pengxiang Ding + 9 more2026-02-26💻 cs

Any Image Restoration via Efficient Spatial-Frequency Degradation Adaptation

이 논문은 대규모 언어 모델이나 추가 모듈 없이 단일 모델로 다양한 이미지 열화를 효율적으로 복원하기 위해 잠재 공간의 가중 재할당과 공간 - 주파수 병렬 융합 전략을 제안하는 'AnyIR'을 소개하며, 기존 방법 대비 매개변수와 연산량을 대폭 줄이면서도 최상의 성능을 달성함을 보여줍니다.

Bin Ren, Eduard Zamfir, Zongwei Wu + 7 more2026-02-26💻 cs

Transformer-based cardiac substructure segmentation from contrast and non-contrast computed tomography for radiotherapy planning

본 연구는 사전 학습된 트랜스포머 기반의 SMIT 모델을 균형 있는 커리큘럼 학습으로 미세 조정하여, 라벨이 지정된 훈련 데이터의 양을 크게 줄이면서도 다양한 환자 및 영상 조건에 걸쳐 방사선 치료 계획에 필요한 심장 하부 구조 분할의 정확도와 견고성을 유지할 수 있음을 입증했습니다.

Aneesh Rangnekar, Nikhil Mankuzhy, Jonas Willmann + 5 more2026-02-26⚡ eess