Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

Cet article propose un modèle d'apprentissage profond géométrique basé sur les transformers et des repères anatomiques sur des maillages tétraédriques pour améliorer le diagnostic de la maladie d'Alzheimer et prédire la positivité à l'amyloïde chez les patients à risque moyen, offrant ainsi une alternative non invasive et précise aux examens TEP coûteux.

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin Wang2026-03-10💻 cs

Snapmoji: Instant Generation of Animatable Dual-Stylized Avatars

Le papier présente Snapmoji, un système qui génère instantanément des avatars 3D animables et personnalisables via une « dual-stylisation » combinant l'adaptation de domaine gaussienne et l'application d'un second style, tout en préservant l'identité de l'utilisateur et en permettant un rendu fluide sur mobile.

Eric M. Chen, Di Liu, Sizhuo Ma, Michael Vasilkovsky, Bing Zhou, Qiang Gao, Wenzhou Wang, Jiahao Luo, Dimitris N. Metaxas, Vincent Sitzmann, Jian Wang2026-03-10💻 cs

SceneEval: Evaluating Semantic Coherence in Text-Conditioned 3D Indoor Scene Synthesis

Ce papier présente SceneEval, un cadre d'évaluation et un benchmark de 500 scènes conçu pour mesurer de manière complète et interprétable la cohérence sémantique des scènes intérieures 3D générées à partir de texte, en évaluant à la fois les exigences explicites et les attentes implicites de plausibilité.

Hou In Ivan Tam, Hou In Derek Pun, Austin T. Wang, Angel X. Chang, Manolis Savva2026-03-10💻 cs

Prototype Perturbation for Relaxing Alignment Constraints in Backward-Compatible Learning

Cet article propose une méthode d'apprentissage rétrocompatible qui améliore la capacité discriminative des nouveaux modèles de recherche en assouplissant les contraintes d'alignement grâce à l'introduction de perturbations sur les prototypes des anciennes caractéristiques, évitant ainsi le coûteux processus de recalcul des embeddings.

Zikun Zhou, Yushuai Sun, Wenjie Pei, Xin Li, Yaowei Wang2026-03-10💻 cs

From 2D Alignment to 3D Plausibility: Unifying Heterogeneous 2D Priors and Penetration-Free Diffusion for Occlusion-Robust Two-Hand Reconstruction

Cet article propose une méthode unifiée pour la reconstruction 3D de deux mains à partir d'images monoculaires, combinant un encodeur d'alignement fusionnant des priors hétérogènes de modèles de vision fondamentaux pour l'alignement 2D et un modèle de diffusion sans pénétration pour garantir des interactions spatiales réalistes et robustes aux occlusions.

Gaoge Han, Yongkang Cheng, Zhe Chen, Shaoli Huang, Tongliang Liu2026-03-10💻 cs

LEL: Lipschitz Continuity Constrained Ensemble Learning for Efficient EEG-Based Intra-subject Emotion Recognition

Cet article présente LEL, un cadre d'apprentissage d'ensemble contraint par la continuité de Lipschitz qui améliore la stabilité, la précision et la robustesse de la reconnaissance des émotions à partir de signaux EEG intra-sujets en combinant des mécanismes d'attention basés sur les Transformers avec une stratégie de fusion optimisée, validée par des résultats supérieurs sur trois jeux de données publics.

Shengyu Gong, Yueyang Li, Zijian Kang, Bo Chai, Weiming Zeng, Hongjie Yan, Zhiguo Zhang, Wai Ting Siok, Nizhuan Wang2026-03-10💻 cs

Task-Oriented Semantic Compression for Localization at the Network Edge

Ce papier propose un cadre de communication orienté tâche, baptisé O-VIB, qui utilise un encodeur à goulot d'information variationnel avec contrainte orthogonale et détermination automatique de la pertinence pour compresser efficacement les caractéristiques multi-vues et permettre une localisation visuelle précise sur des plateformes mobiles aux ressources limitées dans des environnements urbains.

Zhengru Fang, Senkang Hu, Yu Guo, Yiqin Deng, Yuguang Fang2026-03-10💻 cs

DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

Ce papier présente DeepSparse, un modèle fondation innovant pour la reconstruction CBCT à vues éparses, qui intègre une architecture DiCE et une stratégie de préentraînement HyViP pour surmonter les limites des méthodes existantes en matière de qualité d'image, de généralisation et de coût computationnel, permettant ainsi une imagerie médicale plus sûre et efficace.

Yiqun Lin, Jixiang Chen, Hualiang Wang, Jiewen Yang, Jiarong Guo, Yi Zhang, Xiaomeng Li2026-03-10💻 cs

M3CAD: Towards Generic Cooperative Autonomous Driving Benchmark

Ce papier présente M³CAD, un benchmark complet et multimodal de 30 000 images conçu pour faire progresser la recherche sur la conduite autonome coopérative générique, en évaluant des tâches multiples et en proposant une nouvelle approche de fusion adaptative pour optimiser l'équilibre entre efficacité de communication et précision de perception.

Morui Zhu, Yongqi Zhu, Yihao Zhu, Qi Chen, Deyuan Qu, Song Fu, Qing Yang2026-03-10💻 cs

FoldNet: Learning Generalizable Closed-Loop Policy for Garment Folding via Keypoint-Driven Asset and Demonstration Synthesis

Ce papier présente FoldNet, une approche qui génère un jeu de données synthétique basé sur des points clés et des textures réalistes pour entraîner, via l'apprentissage par imitation en boucle fermée et la méthode KG-DAgger, une politique de pliage de vêtements généralisable et robuste atteignant un taux de réussite de 75 % dans le monde réel.

Yuxing Chen, Bowen Xiao, He Wang2026-03-10💻 cs

EgoDex: Learning Dexterous Manipulation from Large-Scale Egocentric Video

Ce papier présente EgoDex, le plus grand ensemble de données à ce jour pour la manipulation dextre, constitué de 829 heures de vidéos egocentriques annotées avec des poses 3D des mains collectées via Apple Vision Pro, afin de pallier le manque de données à grande échelle et de faire progresser l'apprentissage par imitation en robotique.

Ryan Hoque, Peide Huang, David J. Yoon, Mouli Sivapurapu, Jian Zhang2026-03-10🤖 cs.LG

Generative Prior-Guided Neural Interface Reconstruction for 3D Electrical Impedance Tomography

Cet article présente une nouvelle approche « solveur dans la boucle » qui couple un prior génératif 3D pré-entraîné avec un solveur rigoureux d'équations intégrales de frontière pour reconstruire avec précision des interfaces 3D complexes en tomographie par impédance électrique, en imposant les lois physiques comme contraintes strictes tout en régularisant le problème inverse via un espace latent géométrique appris.

Haibo Liu, Junqing Chen, Guang Lin2026-03-10🔢 math