On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

Cet article analyse la dynamique d'apprentissage des réseaux linéaires à deux couches entraînés par descente de gradient stochastique avec du bruit d'étiquettes, révélant un comportement en deux phases où le bruit favorise la transition d'un régime « paresseux » vers un régime « riche » pour améliorer la généralisation, une découverte étendue à l'algorithme SAM et validée par des expériences.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

Cet article présente STemDist, une méthode innovante de distillation de données conçue spécifiquement pour les séries temporelles spatio-temporelles, qui comprime simultanément les dimensions spatiales et temporelles au niveau des clusters pour accélérer l'entraînement des modèles, réduire l'usage mémoire et améliorer la précision des prévisions par rapport aux méthodes existantes.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

Cet article propose un cadre d'apprentissage adaptatif aux domaines pour les indicateurs de santé, intégrant un échantillonnage synchronisé par étapes de dégradation et un autoencodeur à noyaux larges avec mécanismes d'attention croisée, afin de surmonter les décalages de distribution et les limites structurelles des méthodes existantes pour améliorer la surveillance de l'état des machines.

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

Adaptive Active Learning for Regression via Reinforcement Learning

Cet article propose WiGS, une méthode d'apprentissage actif pour la régression qui utilise l'apprentissage par renforcement pour adapter dynamiquement le compromis entre exploration et exploitation, surpassant ainsi les approches existantes en précision et en efficacité d'étiquetage, notamment dans les régions à densité de données irrégulière.

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormick2026-03-12📊 stat

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

Ce papier démontre que la soustraction de la moyenne, une opération simple et efficace, élimine le biais moyen de rang un responsable de l'instabilité numérique dans l'entraînement des grands modèles de langage en faible précision (FP4), permettant ainsi de retrouver la stabilité et les performances du format BF16 sans recourir à des méthodes spectrales coûteuses.

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

Spatio-Temporal Forecasting of Retaining Wall Deformation: Mitigating Error Accumulation via Multi-Resolution ConvLSTM Stacking Ensemble

Cette étude propose un cadre d'ensemble multi-résolution basé sur le ConvLSTM qui, en exploitant diverses échelles temporelles d'entrée, atténue l'accumulation d'erreurs et améliore la précision des prévisions à long terme du comportement des murs de soutènement lors d'excavations par étapes.

Jihoon Kim (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea), Heejung Youn (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea)2026-03-12🤖 cs.LG

Beam-Plasma Collective Oscillations in Intense Charged-Particle Beams: Dielectric Response Theory, Langmuir Wave Dispersion, and Unsupervised Detection via Prometheus

Cet article présente un cadre théorique et computationnel validé par l'apprentissage non supervisé qui décrit les oscillations collectives dans les faisceaux de particules chargées intenses, démontrant l'existence de modes d'ondes de Langmuir non amortis au-dessus d'une densité critique et confirmant des prédictions clés telles que la fréquence plasma indépendante de la distribution et les oscillations de Friedel.

Brandon Yee, Wilson Collins, Michael Iofin, Jiayi Fu2026-03-12🔬 physics

Muscle Synergy Priors Enhance Biomechanical Fidelity in Predictive Musculoskeletal Locomotion Simulation

Cette étude présente un cadre d'apprentissage par renforcement informé par la physiologie qui, en contraignant le contrôle moteur à l'aide de synergies musculaires, améliore la fidélité biomécanique et la généralisation des simulations de locomotion humaine sur divers terrains et vitesses.

Ilseung Park (Carnegie Mellon University), Eunsik Choi (Seoul National University), Jangwhan Ahn (UNC-Chapel Hill and NC State University), Jooeun Ahn (Seoul National University)2026-03-12🤖 cs.LG

VERI-DPO: Evidence-Aware Alignment for Clinical Summarization via Claim Verification and Direct Preference Optimization

Le papier présente VERI-DPO, une méthode d'alignement pour la synthèse clinique qui réduit les affirmations non étayées en utilisant la vérification de revendications pour extraire des préférences et optimiser directement les modèles de langage via l'optimisation de préférence directe (DPO).

Weixin Liu, Congning Ni, Qingyuan Song, Susannah L. Rose, Christopher Symons, Murat Kantarcioglu, Bradley A. Malin, Zhijun Yin2026-03-12💬 cs.CL

A New Tensor Network: Tubal Tensor Train and Its Applications

Cet article introduit la décomposition en train de tubes (TTT), un nouveau modèle de réseau tensoriel qui combine l'algèbre t-produit de la T-SVD avec la structure de cœur de faible ordre du format train tensoriel (TT) pour offrir une évolutivité de stockage linéaire et des performances améliorées dans des applications telles que la compression d'images et la complétion tensorielle.

Salman Ahmadi-Asl, Valentin Leplat, Anh-Huy Phan, Andrzej Cichocki2026-03-12🔢 math

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

Cet article propose un cadre hybride léger intégrant des modèles de langage et des mécanismes d'attention graphique pour surmonter les contraintes de ressources dans le jeu des Amazones, démontrant une amélioration significative de la précision décisionnelle et une capacité à surpasser le modèle de base (GPT-4o-mini) grâce à l'apprentissage à partir de données synthétiques bruitées.

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

Ce papier présente IH-Challenge, un ensemble de données d'apprentissage par renforcement conçu pour améliorer la hiérarchie des instructions des modèles de langage avancés, permettant ainsi de renforcer leur robustesse face aux attaques tout en préservant leur utilité.

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI