Open-Vocabulary Domain Generalization in Urban-Scene Segmentation

Cet article introduit le nouveau cadre de la généralisation de domaine à vocabulaire ouvert pour la segmentation sémantique urbaine, accompagné d'un benchmark dédié et d'une méthode innovante nommée S2-Corr, qui améliore la robustesse des modèles face aux changements de domaine et aux catégories inédites en affinant les corrélations texte-image.

Dong Zhao, Qi Zang, Nan Pu, Wenjing Li, Nicu Sebe, Zhun Zhong2026-03-10💻 cs

SKYLIGHT: A Scalable Hundred-Channel 3D Photonic In-Memory Tensor Core Architecture for Real-time AI Inference

Ce papier présente SKYLIGHT, une architecture de cœur tensoriel photonique 3D à cent canaux et à mémoire intégrée qui surpasse les GPU NVIDIA en efficacité énergétique pour l'inférence IA en temps réel tout en permettant l'apprentissage local sans étiquettes grâce à des mises à jour de poids in situ.

Meng Zhang, Ziang Yin, Nicholas Gangi, Alexander Chen, Brett Bamfo, Tianle Xu, Jiaqi Gu, Zhaoran Rena Huang2026-03-10💻 cs

Cycle-Consistent Tuning for Layered Image Decomposition

Cet article présente un cadre de décomposition d'images en couches basé sur l'apprentissage contextuel et l'adaptation LoRA de modèles de diffusion, qui utilise une stratégie d'ajustement cyclique et un processus d'amélioration progressive pour séparer efficacement des éléments complexes comme les logos de leurs arrière-plans tout en préservant la cohérence visuelle.

Zheng Gu, Min Lu, Zhida Sun, Dani Lischinski, Daniel Cohen-Or, Hui Huang2026-03-10💻 cs

ARLArena: A Unified Framework for Stable Agentic Reinforcement Learning

Ce papier présente ARLArena, un cadre unifié pour l'analyse de la stabilité de l'apprentissage par renforcement agentique, et propose SAMPO, une méthode d'optimisation qui garantit un entraînement stable et performant sur diverses tâches interactives complexes.

Xiaoxuan Wang, Han Zhang, Haixin Wang, Yidan Shi, Ruoyan Li, Kaiqiao Han, Chenyi Tong, Haoran Deng, Renliang Sun, Alexander Taylor, Yanqiao Zhu, Jason Cong, Yizhou Sun, Wei Wang2026-03-10💻 cs

Vibe Researching as Wolf Coming: Can AI Agents with Skills Replace or Augment Social Scientists?

Cet article explore comment les agents IA, capables d'exécuter des pipelines de recherche complets via le concept de « vibe researching », redéfinissent les limites de l'automatisation en sciences sociales en augmentant l'efficacité méthodologique tout en soulignant les défis persistants liés à l'originalité théorique et aux implications éthiques pour la profession.

Yongjun Zhang2026-03-10💻 cs

WISER: Wider Search, Deeper Thinking, and Adaptive Fusion for Training-Free Zero-Shot Composed Image Retrieval

Le papier présente WISER, un cadre d'extraction d'images composées sans entraînement qui améliore la recherche zéro-shot en unifiant les approches texte-vers-image et image-vers-image via un pipeline d'exploration élargie, de fusion adaptative et de réflexion itérative pour surmonter les limites des méthodes existantes.

Tianyue Wang, Leigang Qu, Tianyu Yang, Xiangzhao Hao, Yifan Xu, Haiyun Guo, Jinqiao Wang2026-03-10💻 cs

PackUV: Packed Gaussian UV Maps for 4D Volumetric Video

Le papier présente PackUV, une nouvelle méthode de représentation 4D qui convertit les attributs gaussiens en cartes UV structurées pour une compatibilité native avec les codecs vidéo standards, permettant ainsi un stockage compact et un streaming efficace de vidéos volumétriques de longue durée grâce à la méthode d'ajustement PackUV-GS et au nouveau jeu de données PackUV-2B.

Aashish Rai, Angela Xing, Anushka Agarwal, Xiaoyan Cong, Zekun Li, Tao Lu, Aayush Prakash, Srinath Sridhar2026-03-10💻 cs

On Sample-Efficient Generalized Planning via Learned Transition Models

Cet article propose une approche de planification généralisée fondée sur l'apprentissage de modèles de transition explicites par des réseaux de neurones, démontrant que cette méthode surpasse les modèles prédictifs directs en termes de généralisation hors distribution et d'efficacité des échantillons tout en nécessitant moins de données et de paramètres.

Nitin Gupta, Vishal Pallagani, John A. Aydin, Biplav Srivastava2026-03-10💻 cs