LEL: Lipschitz Continuity Constrained Ensemble Learning for Efficient EEG-Based Intra-subject Emotion Recognition

Cet article présente LEL, un cadre d'apprentissage d'ensemble contraint par la continuité de Lipschitz qui améliore la stabilité, la précision et la robustesse de la reconnaissance des émotions à partir de signaux EEG intra-sujets en combinant des mécanismes d'attention basés sur les Transformers avec une stratégie de fusion optimisée, validée par des résultats supérieurs sur trois jeux de données publics.

Shengyu Gong, Yueyang Li, Zijian Kang, Bo Chai, Weiming Zeng, Hongjie Yan, Zhiguo Zhang, Wai Ting Siok, Nizhuan Wang2026-03-10💻 cs

Task-Oriented Semantic Compression for Localization at the Network Edge

Ce papier propose un cadre de communication orienté tâche, baptisé O-VIB, qui utilise un encodeur à goulot d'information variationnel avec contrainte orthogonale et détermination automatique de la pertinence pour compresser efficacement les caractéristiques multi-vues et permettre une localisation visuelle précise sur des plateformes mobiles aux ressources limitées dans des environnements urbains.

Zhengru Fang, Senkang Hu, Yu Guo, Yiqin Deng, Yuguang Fang2026-03-10💻 cs

DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

Ce papier présente DeepSparse, un modèle fondation innovant pour la reconstruction CBCT à vues éparses, qui intègre une architecture DiCE et une stratégie de préentraînement HyViP pour surmonter les limites des méthodes existantes en matière de qualité d'image, de généralisation et de coût computationnel, permettant ainsi une imagerie médicale plus sûre et efficace.

Yiqun Lin, Jixiang Chen, Hualiang Wang, Jiewen Yang, Jiarong Guo, Yi Zhang, Xiaomeng Li2026-03-10💻 cs

M3CAD: Towards Generic Cooperative Autonomous Driving Benchmark

Ce papier présente M³CAD, un benchmark complet et multimodal de 30 000 images conçu pour faire progresser la recherche sur la conduite autonome coopérative générique, en évaluant des tâches multiples et en proposant une nouvelle approche de fusion adaptative pour optimiser l'équilibre entre efficacité de communication et précision de perception.

Morui Zhu, Yongqi Zhu, Yihao Zhu, Qi Chen, Deyuan Qu, Song Fu, Qing Yang2026-03-10💻 cs

FoldNet: Learning Generalizable Closed-Loop Policy for Garment Folding via Keypoint-Driven Asset and Demonstration Synthesis

Ce papier présente FoldNet, une approche qui génère un jeu de données synthétique basé sur des points clés et des textures réalistes pour entraîner, via l'apprentissage par imitation en boucle fermée et la méthode KG-DAgger, une politique de pliage de vêtements généralisable et robuste atteignant un taux de réussite de 75 % dans le monde réel.

Yuxing Chen, Bowen Xiao, He Wang2026-03-10💻 cs

EgoDex: Learning Dexterous Manipulation from Large-Scale Egocentric Video

Ce papier présente EgoDex, le plus grand ensemble de données à ce jour pour la manipulation dextre, constitué de 829 heures de vidéos egocentriques annotées avec des poses 3D des mains collectées via Apple Vision Pro, afin de pallier le manque de données à grande échelle et de faire progresser l'apprentissage par imitation en robotique.

Ryan Hoque, Peide Huang, David J. Yoon, Mouli Sivapurapu, Jian Zhang2026-03-10🤖 cs.LG

Generative Prior-Guided Neural Interface Reconstruction for 3D Electrical Impedance Tomography

Cet article présente une nouvelle approche « solveur dans la boucle » qui couple un prior génératif 3D pré-entraîné avec un solveur rigoureux d'équations intégrales de frontière pour reconstruire avec précision des interfaces 3D complexes en tomographie par impédance électrique, en imposant les lois physiques comme contraintes strictes tout en régularisant le problème inverse via un espace latent géométrique appris.

Haibo Liu, Junqing Chen, Guang Lin2026-03-10🔢 math

Light of Normals: Unified Feature Representation for Universal Photometric Stereo

Ce papier présente LINO UniPS, une méthode de stéréophotométrie universelle qui utilise des jetons d'enregistrement lumineux et une attention entrelacée pour découpler l'éclairage des normales, ainsi qu'une architecture à double branche basée sur les ondelettes pour préserver les détails géométriques, le tout entraîné sur le nouveau jeu de données PS-Verse pour atteindre des performances de pointe.

Houyuan Chen, Hong Li, Chongjie Ye + 11 more2026-03-10💻 cs

Open-Vocabulary Camouflaged Object Segmentation with Cascaded Vision Language Models

Cet article propose un cadre novateur pour la segmentation d'objets camouflés en vocabulaire ouvert, qui utilise un modèle de langage-vision partagé pour guider le modèle SAM dans la localisation précise des objets et fournir un contexte spatial complet pour leur classification, surmontant ainsi les limites des approches précédentes.

Kai Zhao, Wubang Yuan, Zheng Wang, Guanyi Li, Xiaoqiang Zhu, Deng-ping Fan, Dan Zeng2026-03-10💻 cs

LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling

Ce papier propose LD-RPS, une méthode unifiée et sans jeu de données pour la restauration d'images qui exploite l'échantillonnage récursif de l'arrière-plan d'un modèle de diffusion latent préentraîné, enrichi par des priors sémantiques multimodaux, pour surpasser les méthodes actuelles dans la gestion de diverses dégradations sans nécessiter de données appariées.

Huaqiu Li, Yong Wang, Tongwen Huang, Hailang Huang, Haoqian Wang, Xiangxiang Chu2026-03-10💻 cs

Query-Based Adaptive Aggregation for Multi-Dataset Joint Training Toward Universal Visual Place Recognition

Cet article propose la méthode QAA (Query-based Adaptive Aggregation), une nouvelle technique d'agrégation de caractéristiques qui utilise des requêtes apprises pour surmonter les biais spécifiques aux ensembles de données et permettre un entraînement conjoint multi-ensembles efficace, améliorant ainsi la généralisation et la performance universelle de la reconnaissance visuelle de lieux.

Jiuhong Xiao, Yang Zhou, Giuseppe Loianno2026-03-10💻 cs

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

Cet article propose MCULoRA, une nouvelle approche d'adaptation faible rang dynamique et découplée par modalité qui surpasse les méthodes existantes pour la reconnaissance des émotions en résolvant les conflits de gradients lors de l'apprentissage avec des données multimodales incomplètes.

Xinkui Zhao, Jinsong Shu, Yangyang Wu, Guanjie Cheng, Zihe Liu, Naibo Wang, Shuiguang Deng, Zhongle Xie, Jianwei Yin2026-03-10💻 cs