Attend Before Attention: Efficient and Scalable Video Understanding via Autoregressive Gazing

이 논문은 비디오의 중복 패치를 제거하여 토큰 수를 획기적으로 줄이고 처리 속도를 높임으로써 장고해고 고해상도 비디오 이해를 가능하게 하는 경량 모듈 'AutoGaze'를 제안하고, 이를 통해 멀티모달 대규모 언어 모델의 성능과 확장성을 크게 향상시켰음을 보여줍니다.

Baifeng Shi, Stephanie Fu, Long Lian + 10 more2026-03-13💻 cs

HumDex:Humanoid Dexterous Manipulation Made Easy

이 논문은 이동성과 정밀도를 동시에 확보한 IMU 기반 휴대용 원격 조작 시스템 'HumDex'와 학습 기반 손 동작 재매핑, 그리고 인간 운동 데이터를 활용한 2 단계 모방 학습 프레임워크를 제안하여, 인간형 로봇의 전신 정교 조작 데이터 수집의 병목 현상을 해결하고 새로운 환경과 객체에 대한 일반화 성능을 크게 향상시켰음을 보여줍니다.

Liang Heng, Yihe Tang, Jiajun Xu + 3 more2026-03-13💻 cs

Video Streaming Thinking: VideoLLMs Can Watch and Think Simultaneously

이 논문은 실시간 응답성과 논리적 추론을 동시에 달성하기 위해 입력되는 비디오 클립에 대한 추론을 활성화하는 'Video Streaming Thinking(VST)' 패러다임을 제안하고, 이를 위한 포스트 트레이닝 파이프라인과 자동 데이터 생성 방법을 통해 기존 오프라인 모델 대비 응답 속도를 획기적으로 단축하면서도 다양한 비디오 이해 작업에서 뛰어난 성능을 입증했습니다.

Yiran Guan, Liang Yin, Dingkang Liang + 5 more2026-03-13💻 cs

Ψ0Ψ_0: An Open Foundation Model Towards Universal Humanoid Loco-Manipulation

이 논문은 인간과 휴머노이드 로봇 간의 운동학적 차이로 인한 기존 접근법의 한계를 극복하기 위해, 대규모 인간 시점 데이터를 활용한 사전 학습과 고품질 로봇 데이터를 통한 후속 학습이라는 2 단계 훈련 패러다임을 도입하여, 훨씬 적은 데이터로 기존 모델보다 40% 이상 뛰어난 성능을 보이는 오픈 소스 휴머노이드 로코-조작 기초 모델 'I^¨0Ψ_0'을 제안합니다.

Songlin Wei, Hongyi Jing, Boqian Li + 12 more2026-03-13💻 cs

MM-CondChain: A Programmatically Verified Benchmark for Visually Grounded Deep Compositional Reasoning

이 논문은 시각적 근거에 기반한 심층적 구성적 추론 능력을 평가하기 위해 프로그래머블하게 검증 가능한 벤치마크 'MM-CondChain'을 제안하고, 에이전트 합성 파이프라인을 통해 구축된 이 벤치마크를 통해 현재 최첨단 멀티모달 대형 언어 모델들조차 심층적 구성적 추론에서 여전히 심각한 한계를 겪고 있음을 실증합니다.

Haozhan Shen, Shilin Yan, Hongwei Xue + 5 more2026-03-13💻 cs

EVATok: Adaptive Length Video Tokenization for Efficient Visual Autoregressive Generation

본 논문은 다양한 비디오의 복잡도에 따라 토큰 할당을 동적으로 조절하여 재구성 품질과 생성 효율성을 극대화하는 적응형 비디오 토큰화 프레임워크인 EVATok 을 제안하고, 이를 통해 기존 최첨단 모델 대비 토큰 사용량을 24.4% 이상 절감하면서도 우수한 성능을 달성함을 보여줍니다.

Tianwei Xiong, Jun Hao Liew, Zilong Huang + 3 more2026-03-13💻 cs

In Pursuit of Many: A Review of Modern Multiple Object Tracking Systems

이 논문은 현대의 다중 객체 추적 (MOT) 시스템이 직면한 과제를 해결하기 위한 다양한 패러다임과 아키텍처를 종합적으로 검토하고, 벤치마크 및 평가 지표의 변화를 분석하며, 향후 연구 방향과 실용적 배포를 위한 전망을 제시합니다.

Mk Bashar, Samia Islam, Kashifa Kawaakib Hussain, Md. Bakhtiar Hasan, A. B. M. Ashikur Rahman, Md. Hasanul Kabir2026-03-12💻 cs

Evolution of funding for collaborative health research towards higher-level patient-oriented research. A comparison of the European Union Framework Programmes to the program funding by the United States National Institutes of Health

이 논문은 대규모 텍스트 분석을 통해 유럽연합의 건강 연구 자금 지원이 인구 및 건강 시스템 중심의 연구로 전환되는 경향을 보인 반면, 미국 NIH 와 유럽의 ERC 는 기초 생물의학 연구의 안정성을 유지했음을 규명하고, 자금 지원 정책과 실제 연구 성과 간의 괴리를 분석합니다.

David Fajardo-Ortiz, Bart Thijs, Wolfgang Glanzel, Karin R. Sipido2026-03-12💻 cs