Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

Cet article propose les Graphes de Concepts Causaux (CCG), une méthode combinant des autoencodeurs épars et un apprentissage de structure différentiable pour cartographier les dépendances causales entre concepts dans l'espace latent des LLM, démontrant ainsi une supériorité significative sur les approches existantes pour le raisonnement étape par étape.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Safe Probabilistic Planning for Human-Robot Interaction using Conformal Risk Control

Cet article présente un cadre de contrôle probabiliste sûr pour l'interaction humain-robot qui combine les fonctions de barrière de contrôle et le contrôle du risque conforme pour fournir des garanties formelles de sécurité, en ajustant dynamiquement les marges de sécurité afin de réduire significativement les collisions tout en maintenant une efficacité de navigation.

Jake Gonzales, Kazuki Mizuta, Karen Leung, Lillian J. Ratliff2026-03-12🤖 cs.AI

Verbalizing LLM's Higher-order Uncertainty via Imprecise Probabilities

Cet article propose de nouvelles techniques d'élicitation d'incertitude basées sur les probabilités imprécises pour permettre aux grands modèles de langage de mieux exprimer et quantifier leur incertitude d'ordre supérieur, comblant ainsi les lacunes des cadres probabilistes classiques face à l'ambiguïté et à l'apprentissage contextuel.

Anita Yang, Krikamol Muandet, Michele Caprio, Siu Lun Chau, Masaki Adachi2026-03-12🤖 cs.AI

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

Cet article analyse la dynamique d'apprentissage des réseaux linéaires à deux couches entraînés par descente de gradient stochastique avec du bruit d'étiquettes, révélant un comportement en deux phases où le bruit favorise la transition d'un régime « paresseux » vers un régime « riche » pour améliorer la généralisation, une découverte étendue à l'algorithme SAM et validée par des expériences.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

Cet article présente STemDist, une méthode innovante de distillation de données conçue spécifiquement pour les séries temporelles spatio-temporelles, qui comprime simultanément les dimensions spatiales et temporelles au niveau des clusters pour accélérer l'entraînement des modèles, réduire l'usage mémoire et améliorer la précision des prévisions par rapport aux méthodes existantes.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG

Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

Cet article propose une nouvelle approche de défense en couches combinant des classificateurs empilés et un autoencodeur, renforcée par un entraînement adversarial, pour améliorer la robustesse des systèmes de détection d'intrusion réseau face aux attaques générées par GAN et FGSM.

Nasim Soltani, Shayan Nejadshamsi, Zakaria Abou El Houda, Raphael Khoury, Kelton A. P. Costa, Tiago H. Falk, Anderson R. Avila2026-03-12🤖 cs.AI

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

Cet article propose un cadre d'apprentissage adaptatif aux domaines pour les indicateurs de santé, intégrant un échantillonnage synchronisé par étapes de dégradation et un autoencodeur à noyaux larges avec mécanismes d'attention croisée, afin de surmonter les décalages de distribution et les limites structurelles des méthodes existantes pour améliorer la surveillance de l'état des machines.

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

Ce papier démontre que la soustraction de la moyenne, une opération simple et efficace, élimine le biais moyen de rang un responsable de l'instabilité numérique dans l'entraînement des grands modèles de langage en faible précision (FP4), permettant ainsi de retrouver la stabilité et les performances du format BF16 sans recourir à des méthodes spectrales coûteuses.

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation

Le papier présente FAR-Dex, un cadre hiérarchique qui combine l'augmentation de données en peu d'exemples et un raffinement adaptatif par résidus pour surmonter le manque de démonstrations et la complexité des espaces d'action, permettant ainsi une coordination robuste et précise bras-main pour la manipulation habile avec des taux de réussite élevés en simulation et dans le monde réel.

Yushan Bai, Fulin Chen, Hongzheng Sun, Yuchuang Tong, En Li, Zhengtao Zhang2026-03-12🤖 cs.AI

UniPINN: A Unified PINN Framework for Multi-task Learning of Diverse Navier-Stokes Equations

Le papier présente UniPINN, un cadre unifié d'apprentissage multi-tâches pour les équations de Navier-Stokes qui surmonte les limitations des méthodes existantes en intégrant une architecture partagée-spécialisée, un mécanisme d'attention inter-flux et une allocation dynamique des poids pour améliorer la précision et la stabilité de l'entraînement.

Dengdi Sun, Jie Chen, Xiao Wang, Jin Tang2026-03-12🤖 cs.AI

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

Le papier présente G-STAR, un système de reconnaissance automatique de la parole attribué aux locuteurs de bout en bout qui couple un module de suivi temporel des locuteurs avec un modèle de langage pour assurer une cohérence des identités à l'échelle de la réunion tout en générant des transcriptions étiquetées et horodatées.

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai Wang2026-03-12⚡ eess

Modeling Stage-wise Evolution of User Interests for News Recommendation

Cet article propose un cadre unifié pour la recommandation de nouvelles qui modélise l'évolution des intérêts des utilisateurs en combinant une perspective temporelle globale pour les préférences à long terme et une approche locale par étapes avec des mécanismes LSTM et d'attention pour capturer les dynamiques à court terme, surpassant ainsi les méthodes existantes sur des jeux de données réels.

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng Wang2026-03-12🤖 cs.AI

Aligning Large Language Models with Searcher Preferences

Ce papier présente SearchLLM, le premier grand modèle de langage conçu pour la recherche générative ouverte, qui utilise un système de récompense hiérarchique et une stratégie d'agrégation sélective pour optimiser la qualité des réponses et l'engagement des utilisateurs tout en garantissant la sécurité et la fiabilité, comme le démontrent les tests réussis déployés sur la plateforme RedNote.

Wei Wu, Peilun Zhou, Liyi Chen, Qimeng Wang, Chengqiang Lu, Yan Gao, Yi Wu, Yao Hu, Hui Xiong2026-03-12💬 cs.CL

Learning to Negotiate: Multi-Agent Deliberation for Collective Value Alignment in LLMs

Cet article propose un cadre d'alignement multi-agents basé sur la négociation et l'apprentissage par renforcement (RLAIF) qui permet aux grands modèles de langage de résoudre les conflits de valeurs tout en maintenant un alignement avec l'objectif d'agence collective, sans dégrader leurs capacités linguistiques générales.

Panatchakorn Anantaprayoon, Nataliia Babina, Nima Asgharbeygi, Jad Tarifi2026-03-12💬 cs.CL

Naïve Exposure of Generative AI Capabilities Undermines Deepfake Detection

Ce papier démontre que l'exposition naïve des capacités de raffinement d'images et de raisonnement des IA génératives commerciales, via des interfaces de chatbot accessibles, compromet fondamentalement les détecteurs de deepfakes les plus avancés en permettant aux utilisateurs non experts de créer des images authentiques et indétectables sans violer les politiques de sécurité.

Sunpill Kim, Chanwoo Hwang, Minsu Kim, Jae Hong Seo2026-03-12🤖 cs.AI