Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Cet article présente le cadre DAPL, une méthode d'apprentissage par renforcement qui modélise explicitement les dynamiques induites par les contacts pour permettre à un robot d'acquérir une dextérité extrinsèque efficace dans des scènes encombrées, surpassant ainsi les approches existantes tant en simulation que dans le monde réel.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

Le papier présente MedMASLab, un cadre unifié et une plateforme de benchmarking conçus pour standardiser l'évaluation des systèmes multi-agents médicaux multimodaux en intégrant des protocoles de communication normalisés, un évaluateur de raisonnement clinique automatisé et un vaste ensemble de données couvrant 11 systèmes d'organes, tout en révélant des fragilités critiques dans la transition entre les sous-domaines médicaux spécialisés.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

Ce papier présente ACADiff, un cadre de diffusion latente adaptatif et conscient des données cliniques qui synthétise avec succès les modalités d'imagerie cérébrale manquantes (sMRI, FDG-PET, AV45-PET) pour améliorer le diagnostic de la maladie d'Alzheimer, même dans des scénarios extrêmes de données incomplètes.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

Le papier présente PathMem, un cadre multimodal centré sur la mémoire qui imite le processus cognitif des pathologistes en organisant les connaissances structurées en mémoire à long terme et en les activant dynamiquement via un Memory Transformer pour améliorer la précision et l'interprétabilité des diagnostics en pathologie computationnelle.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Cette étude propose l'indicateur de surapprentissage-sous-apprentissage (OUI) comme un signal structurel précoce et efficace pour discriminer les taux d'apprentissage optimaux dans les algorithmes PPO, permettant d'identifier et d'élaguer les entraînements instables bien avant la convergence finale.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Think Before You Lie: How Reasoning Improves Honesty

Contrairement aux humains qui deviennent moins honnêtes lorsqu'ils réfléchissent, cette étude démontre que le processus de raisonnement améliore systématiquement l'honnêteté des grands modèles de langage en les amenant à traverser un espace de représentation où les réponses honnêtes sont plus stables que les réponses trompeuses.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Cette étude présente un guide alimenté par un modèle de langage de grande taille pour rendre la réalité virtuelle accessible aux personnes aveugles ou malvoyantes, révélant que leur interaction avec ce guide évolue d'une relation utilitaire à une relation compagnonnage lorsqu'ils sont en présence d'autres utilisateurs.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

En introduisant le cadre contrôlé de la superposition de type « sac de mots » (BOWS), cette étude démontre que les corrélations entre caractéristiques permettent d'organiser géométriquement les interférences de manière constructive dans les réseaux de neurones, expliquant ainsi la formation de clusters sémantiques et de structures cycliques observées dans les modèles de langage réels, ce que la vision traditionnelle de la superposition basée sur des caractéristiques non corrélées ne parvenait pas à prédire.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI