ColaVLA: Leveraging Cognitive Latent Reasoning for Hierarchical Parallel Trajectory Planning in Autonomous Driving

이 논문은 자율주행의 실시간성, 안전성, 해석 가능성을 동시에 확보하기 위해 텍스트 추론을 잠재 공간으로 전환하고 계층적 병렬 경로를 생성하는 통합 비전 - 언어 - 행동 프레임워크인 ColaVLA 를 제안하며, nuScenes 벤치마크에서 기존 최첨단 성능을 달성했다고 요약할 수 있습니다.

Qihang Peng, Xuesong Chen, Chenye Yang + 2 more2026-03-02💻 cs

Inference-time Physics Alignment of Video Generative Models with Latent World Models

이 논문은 잠재 세계 모델 (VJEPA-2) 을 보상 신호로 활용하여 추론 시 여러 생성 경로를 탐색하고 조정하는 'WMReward'를 제안함으로써, 기존 비디오 생성 모델의 물리 법칙 위반 문제를 해결하고 ICCV 2025 Perception Test PhysicsIQ 챌린지에서 1 위를 차지한 성과를 거두었음을 보여줍니다.

Jianhao Yuan, Xiaofeng Zhang, Felix Friedrich + 7 more2026-03-02💻 cs

CPiRi: Channel Permutation-Invariant Relational Interaction for Multivariate Time Series Forecasting

이 논문은 채널 순서에 의존하지 않고 데이터로부터 채널 간 구조를 추론하여 재학습 없이도 구조적 변화와 미시적 채널에 대한 일반화 성능을 보장하는 다변량 시계열 예측 프레임워크인 CPiRi 를 제안하고, 이를 통해 기존 방법론의 한계를 극복하고 최첨단 성능을 달성함을 보여줍니다.

Jiyuan Xu, Wenyu Zhang, Xin Jing + 3 more2026-03-02💻 cs

Scale Equivariance Regularization and Feature Lifting in High Dynamic Range Modulo Imaging

이 논문은 자연 이미지 에지와 인위적인 감싸기 불연속성을 구분하여 고동적 범위 (HDR) 모듈로 이미징의 재구성 정확도를 획기적으로 개선하기 위해, 노출 변화에 대한 일관성을 강제하는 스케일 공변성 정규화와 원시 모듈로 이미지, 감싸기 유한 차분, 폐형식 초기화를 결합한 특징 리프팅 입력 설계를 도입한 학습 기반 HDR 복원 프레임워크를 제안합니다.

Brayan Monroy, Jorge Bacca2026-03-02⚡ eess

From Statics to Dynamics: Physics-Aware Image Editing with Latent Transition Priors

이 논문은 물리 법칙을 고려한 이미지 편집의 한계를 극복하기 위해 3 만 8 천 개의 물리 전이 데이터를 구축하고, 텍스트-시각 이중 추론 메커니즘을 갖춘 'PhysicEdit' 프레임워크를 제안하여 오픈소스 모델 중 물리적 사실성과 지식 기반 편집 성능을 획기적으로 개선했음을 보여줍니다.

Liangbing Zhao, Le Zhuo, Sayak Paul + 2 more2026-03-02💻 cs