MC-INR: Efficient Encoding of Multivariate Scientific Simulation Data using Meta-Learning and Clustered Implicit Neural Representations

이 논문은 메타러닝과 클러스터링을 결합하고 잔차 기반 동적 재클러스터링 및 분기 레이어를 도입하여, 기존 방법의 한계를 극복하고 비정형 격자 위의 다변량 과학 시뮬레이션 데이터를 효율적으로 인코딩하는 새로운 프레임워크인 MC-INR 을 제안합니다.

Hyunsoo Son, Jeonghyun Noh, Suemin Jeon + 2 more2026-03-04🤖 cs.LG

InstructVLA: Vision-Language-Action Instruction Tuning from Understanding to Manipulation

이 논문은 기존 비전 - 언어 - 행동 (VLA) 모델이 겪는 추론 능력 저하와 과적합 문제를 해결하기 위해, 대규모 비전 - 언어 모델의 유연한 추론 능력을 유지하면서 정밀한 조작 성능을 달성하는 새로운 엔드 - 투 - 엔드 모델 'InstructVLA'와 이를 위한 'VLA-IT' 학습 패러다임을 제안하고, 시뮬레이션 및 실제 환경에서 기존 모델들을 크게 앞서는 성능을 입증합니다.

Shuai Yang, Hao Li, Bin Wang + 7 more2026-03-04💻 cs

Proxy-GS: Unified Occlusion Priors for Training and Inference in Structured 3D Gaussian Splatting

이 논문은 1ms 이내의 고속 프록시 시스템을 통해 모든 시점의 가시성을 인식하여 3D 가우스 스플래팅의 불필요한 원시들을 제거하고 학습 중 밀집화를 유도함으로써, 대규모 장면에서 렌더링 속도를 획기적으로 개선하면서도 MLP 기반 모델의 고품질 렌더링 성능을 유지하는 'Proxy-GS'를 제안합니다.

Yuanyuan Gao, Yuning Gong, Yifei Liu + 6 more2026-03-04💻 cs

EchoGen: Generating Visual Echoes in Any Scene via Feed-Forward Subject-Driven Auto-Regressive Model

이 논문은 기존 확산 모델 기반 방법론의 추론 속도 한계를 극복하고, 시각적 자회귀 (VAR) 모델을 기반으로 한 최초의 피드포워드 주체 주도 생성 프레임워크인 'EchoGen'을 제안하며, 이중 경로 주입 전략을 통해 높은 주체 충실도와 이미지 품질을 유지하면서 저지연 추론을 가능하게 합니다.

Ruixiao Dong, Zhendong Wang, Keli Liu + 5 more2026-03-04💻 cs

D2E: Scaling Vision-Action Pretraining on Desktop Data for Transfer to Embodied AI

이 논문은 대규모 데스크톱 데이터 (게임 등) 를 활용한 사전 학습 프레임워크인 D2E 를 제안하여, 이를 통해 학습된 센서 - 운동 원리가 실제 물리적 로봇 작업 (LIBERO, CANVAS) 에 효과적으로 전이되어 더 큰 규모의 모델과도 경쟁할 수 있는 성능을 달성함을 입증합니다.

Suhwan Choi, Jaeyoon Jung, Haebin Seong + 7 more2026-03-04🤖 cs.AI

Reasoning as Representation: Rethinking Visual Reinforcement Learning in Image Quality Assessment

이 논문은 강화학습 기반의 시각적 추론 모델이 일반화 성능을 발휘하는 핵심 메커니즘이 시각적 표현을 일반화 가능한 텍스트 표현으로 변환하는 데 있음을 규명하고, 이를 바탕으로 추론 과정과 대규모 언어 모델 없이도 동등한 일반화 성능을 달성하면서 파라미터와 추론 시간을 5% 미만으로 획기적으로 줄인 새로운 알고리즘 RALI 를 제안합니다.

Shijie Zhao, Xuanyu Zhang, Weiqi Li + 4 more2026-03-04💻 cs