cs.LG articles | Gist.Science

Universal Robust Speech Adaptation for Cross-Domain Speech Recognition and Enhancement

Ce papier présente URSA-GAN, un cadre génératif unifié qui utilise une architecture à double encodage et une perturbation stochastique dynamique pour adapter robustement la reconnaissance et l'amélioration de la parole à des conditions de bruit et de canal inconnues, réduisant ainsi significativement les erreurs et améliorant les métriques perceptuelles.

Chien-Chun Wang, Hung-Shin Lee, Hsin-Min Wang + 1 more2026-03-03⚡ eess

Quantile-Physics Hybrid Framework for Safe-Speed Recommendation under Diverse Weather Conditions Leveraging Connected Vehicle and Road Weather Information Systems Data

Cette étude propose un cadre hybride combinant des forêts de régression quantile et des principes physiques, alimenté par des données de véhicules connectés et de systèmes d'information routière météorologique, pour recommander en temps réel des intervalles de vitesse sûrs sur les autoroutes dans diverses conditions météorologiques afin de réduire les risques d'accidents.

Wen Zhang, Adel W. Sadek, Chunming Qiao2026-03-03🤖 cs.LG

CSRv2: Unlocking Ultra-Sparse Embeddings

Ce papier présente CSRv2, une méthode d'entraînement novatrice qui rend les représentations par embeddings ultra-creux (k-sparse) pratiques et performantes en stabilisant l'apprentissage de la parcimonie, permettant ainsi d'atteindre des gains d'efficacité computationnelle et mémoire considérables sans compromettre la précision par rapport aux embeddings denses ou aux approches existantes.

Lixuan Guo, Yifei Wang, Tiansheng Wen + 5 more2026-03-03🔢 math

AceGRPO: Adaptive Curriculum Enhanced Group Relative Policy Optimization for Autonomous Machine Learning Engineering

L'article présente AceGRPO, une méthode d'optimisation de politique relative de groupe améliorée par un curriculum adaptatif et un tampon de données évolutif, qui permet au modèle Ace-30B de surmonter la stagnation comportementale des agents MLE autonomes et d'atteindre des performances compétitives face aux modèles propriétaires.

Yuzhu Cai, Zexi Liu, Xinyu Zhu + 2 more2026-03-03🤖 cs.AI

Incremental (k, z)-Clustering on Graphs

Cet article présente le premier algorithme incrémental randomisé pour le problème de $(k, z)$ -clustering sur les graphes, qui maintient une approximation à facteur constant avec un temps de mise à jour quasi-linéaire en gérant des insertions d'arêtes adverses grâce à une adaptation de l'approche bicritère de Mettu et Plaxton combinée à des spanneurs dynamiques.

Emilio Cruciani, Sebastian Forster, Antonis Skarlatos2026-03-03🤖 cs.LG

GPU-Fuzz: Finding Memory Errors in Deep Learning Frameworks

Le papier présente GPU-Fuzz, un outil de fuzzing qui modélise les paramètres des opérateurs sous forme de contraintes formelles pour générer des cas de test ciblant les conditions limites des noyaux GPU, permettant ainsi de découvrir 13 bugs méconnus dans les frameworks d'apprentissage profond PyTorch, TensorFlow et PaddlePaddle.

Zihao Li, Hongyi Lu, Yanan Guo + 3 more2026-03-03🤖 cs.LG

MiniCPM-SALA: Hybridizing Sparse and Linear Attention for Efficient Long-Context Modeling

Ce papier présente MiniCPM-SALA, une architecture hybride de 9 milliards de paramètres combinant l'attention sparse et linéaire pour permettre un traitement efficace de contextes ultra-long jusqu'à 1 million de tokens tout en réduisant les coûts d'entraînement de 75 % par rapport à un entraînement à partir de zéro.

MiniCPM Team, Wenhao An, Yingfa Chen + 44 more2026-03-03💬 cs.CL

Echo: Towards Advanced Audio Comprehension via Audio-Interleaved Reasoning

Ce papier présente Echo, un modèle de langage audio qui surpasse les approches actuelles en adoptant un raisonnement entrelacé avec l'audio, permettant au modèle de réécouter dynamiquement les segments pertinents pour une compréhension approfondie.

Daiqing Wu, Xuan Zhang, Dongbao Yang + 7 more2026-03-03🤖 cs.LG

Self-Supervised Learning via Flow-Guided Neural Operator on Time-Series Data

Cet article propose FGNO, une nouvelle méthode d'apprentissage auto-supervisé pour les séries temporelles qui utilise un opérateur neuronal guidé par un flot et le transformé de Fourier à court terme pour apprendre des représentations hiérarchiques flexibles à partir de données bruitées, surpassant ainsi les méthodes existantes sur plusieurs tâches biomédicales.

Duy Nguyen, Jiachen Yao, Jiayun Wang + 2 more2026-03-03🤖 cs.LG

Unleashing Low-Bit Inference on Ascend NPUs: A Comprehensive Evaluation of HiFloat Formats

Cette étude évalue les formats HiFloat (HiF8 et HiF4) sur les NPU Ascend pour l'inférence de grands modèles de langage, démontrant leur supériorité dans la gestion des données à forte variance et leur capacité à éviter l'effondrement de la précision en 4 bits par rapport aux formats entiers, tout en restant compatibles avec les cadres de quantification actuels.

Pengxiang Zhao, Hui-Ling Zhen, Xing Li + 10 more2026-03-03💬 cs.CL

Random Forests as Statistical Procedures: Design, Variance, and Dependence

Cet article établit une théorie en échantillon fini pour les forêts aléatoires en tant que procédures statistiques, démontrant l'existence d'un plancher de variance inévitable dû à la réutilisation des observations et à l'alignement des partitions, et proposant une méthode de rééchantillonnage synthétique (PASR) pour estimer cette incertitude et construire des intervalles de prédiction fiables pour les résultats continus et les probabilités conditionnelles de classification.

Nathaniel S. O'Connell2026-03-03📊 stat

Directional Reasoning Trajectory Change (DRTC): Identifying Critical Trace Segments in Reasoning Models

Cet article présente la Directional Reasoning Trajectory Change (DRTC), une méthode d'interprétabilité causale qui identifie les segments de contexte critiques influençant les trajectoires de raisonnement des modèles de langage en détectant les points de basculement et en appliquant des interventions ciblées pour mesurer leur impact sur la probabilité de la réponse.

Waldemar Chang2026-03-03🤖 cs.LG

Neural-POD: A Plug-and-Play Neural Operator Framework for Infinite-Dimensional Functional Nonlinear Proper Orthogonal Decomposition

Ce papier présente Neural-POD, un cadre d'opérateur neuronal plug-and-play qui apprend des bases fonctionnelles non linéaires et orthogonales continues pour surmonter les limitations de discrétisation des modèles d'IA scientifique et améliorer la généralisation hors distribution.

Changhong Mou, Binghang Lu, Guang Lin2026-03-03🤖 cs.LG

EnterpriseBench Corecraft: Training Generalizable Agents on High-Fidelity RL Environments

L'article présente CoreCraft, un environnement de simulation d'entreprise haute fidélité qui permet d'entraîner des agents IA pour obtenir des capacités généralisables, démontrant qu'un seul epoch d'entraînement améliore non seulement les performances sur la tâche cible mais aussi sur des benchmarks hors distribution.

Sushant Mehta, Logan Ritchie, Suhaas Garre + 3 more2026-03-03🤖 cs.AI

A Graph Meta-Network for Learning on Kolmogorov-Arnold Networks

Cet article présente WS-KAN, la première architecture d'espace de poids conçue pour les réseaux Kolmogorov-Arnold (KAN), qui exploite leurs symétries de permutation via une représentation graphique pour surpasser significativement les méthodes existantes dans la prédiction des performances sur de nouveaux jeux de données.

Guy Bar-Shalom, Ami Tavory, Itay Evron + 3 more2026-03-03🤖 cs.AI

Agentic Unlearning: When LLM Agent Meets Machine Unlearning

Cet article présente l'« effacement agentique », une nouvelle approche introduisant le cadre SBU qui élimine simultanément les informations sensibles des paramètres du modèle et de la mémoire persistante des agents pour prévenir la réintroduction de données via des boucles de rétroaction.

Bin Wang, Fan Wang, Pingping Wang + 5 more2026-03-03🤖 cs.AI

GeneZip: Region-Aware Compression for Long Context DNA Modeling

GeneZip est un modèle de compression ADN adaptatif qui exploite l'asymétrie biologique entre les régions codantes et non codantes pour réduire considérablement la longueur des séquences, permettant ainsi l'entraînement de modèles de fondation génomique à très long contexte sur une seule carte graphique sans perte significative de performance.

Jianan Zhao, Xixian Liu, Zhihao Zhan + 3 more2026-03-03🧬 q-bio

Learning from Complexity: Exploring Dynamic Sample Pruning of Spatio-Temporal Training

Cet article présente ST-Prune, une technique novatrice de pruning dynamique d'échantillons qui améliore l'efficacité et la vitesse d'entraînement des modèles de prévision spatio-temporelle en sélectionnant intelligemment les données les plus informatives en fonction de l'état d'apprentissage du modèle.

Wei Chen, Junle Chen, Yuqian Wu + 2 more2026-03-03📊 stat

LLMs Can Learn to Reason Via Off-Policy RL

Ce papier propose OAPL, un nouvel algorithme d'apprentissage par renforcement hors politique qui exploite efficacement les retards de mise à jour entre les politiques d'entraînement et d'inférence pour surpasser les méthodes existantes sur des benchmarks mathématiques et de codage tout en réduisant considérablement le nombre de générations nécessaires.

Daniel Ritter, Owen Oertell, Bradley Guo + 3 more2026-03-03🤖 cs.LG

PaReGTA: An LLM-based EHR Data Encoding Approach to Capture Temporal Information

Le papier présente PaReGTA, une approche d'encodage basée sur les grands modèles de langage (LLM) qui capture les informations temporelles des dossiers de santé électroniques via des représentations textuelles et un regroupement hybride, surpassant ainsi les modèles séquentiels et les représentations éparses pour la classification des types de migraine tout en offrant une interprétabilité grâce au score de décalage de représentation.

Kihyuk Yoon, Lingchao Mao, Catherine Chong + 3 more2026-03-03🤖 cs.LG

← Précédent Suivant →