EVA: Efficient Reinforcement Learning for End-to-End Video Agent

Le papier présente EVA, un cadre d'apprentissage par renforcement efficace qui permet à un agent vidéo de planifier avant de percevoir grâce à un raisonnement itératif et à un pipeline d'entraînement en trois étapes, surpassant ainsi les méthodes existantes sur plusieurs benchmarks de compréhension vidéo.

Yaolun Zhang, Ruohui Wang, Jiahao Wang, Yepeng Tang, Xuanyu Zheng, Haonan Duan, Hao Lu, Hanming Deng, Lewei Lu2026-03-25💬 cs.CL

Few-Shot Generative Model Adaption via Identity Injection and Preservation

Ce papier propose I²P, une méthode d'adaptation de modèles génératifs à peu d'exemples qui préserve les connaissances d'identité de la source grâce à l'injection d'identité et à l'alignement de la consistance, surmontant ainsi les problèmes de mode collapse et d'oubli de l'identité dans les approches existantes.

Yeqi He, Liang Li, Jiehua Zhang, Yaoqi Sun, Xichun Sheng, Zhidong Zhao, Chenggang Yan2026-03-25💻 cs

FCL-COD: Weakly Supervised Camouflaged Object Detection with Frequency-aware and Contrastive Learning

Ce papier propose FCL-COD, un cadre d'apprentissage faible supervision pour la détection d'objets camouflés qui intègre l'adaptation faible rang sensible aux fréquences et un apprentissage contrastif pour surmonter les limitations des méthodes existantes et surpasser les performances des techniques entièrement supervisées.

Jingchen Ni, Quan Zhang, Dan Jiang, Keyu Lv, Ke Zhang, Chun Yuan2026-03-25💻 cs

VLA-IAP: Training-Free Visual Token Pruning via Interaction Alignment for Vision-Language-Action Models

Le papier présente VLA-IAP, une méthode sans entraînement qui optimise l'inférence des modèles Vision-Language-Action en élaguant les tokens visuels selon un paradigme axé sur l'interaction, garantissant ainsi une accélération significative sans compromettre la précision ni la robustesse des tâches robotiques.

Jintao Cheng, Haozhe Wang, Weibin Li, Gang Wang, Yipu Zhang, Xiaoyu Tang, Jin Wu, Xieyuanli Chen, Yunhui Liu, Wei Zhang2026-03-25💻 cs

VQ-Jarvis: Retrieval-Augmented Video Restoration Agent with Sharp Vision and Fast Thought

Le papier présente VQ-Jarvis, un agent intelligent de restauration vidéo qui combine une perception fine des dégradations, grâce au nouveau jeu de données VSR-Compare, et une stratégie de décision hiérarchique rapide pour surmonter les limitations des méthodes existantes face à des dégradations hétérogènes complexes.

Xuanyu Zhang, Weiqi Li, Qunliang Xing, Jingfen Xie, Bin Chen, Junlin Li, Li Zhang, Jian Zhang, Shijie Zhao2026-03-25💻 cs