cs.LG articles | Gist.Science

FedCova: Robust Federated Covariance Learning Against Noisy Labels

Le papier propose FedCova, un cadre d'apprentissage fédéré robuste aux labels bruités qui, en se basant sur les covariances de caractéristiques et l'information mutuelle, permet d'encoder des données résilientes, de construire un classifieur et de corriger les labels sans dépendre de données externes propres.

Xiangyu Zhong, Xiaojun Yuan, Ying-Jun Angela Zhang2026-03-05🤖 cs.LG

Tuning Just Enough: Lightweight Backdoor Attacks on Multi-Encoder Diffusion Models

Cet article propose l'attaque légère MELT, qui démontre qu'il est possible de réaliser des attaques par porte dérobée efficaces sur le modèle multi-encodeur Stable Diffusion 3 en ajustant moins de 0,2 % des paramètres des encodeurs de texte.

Ziyuan Chen, Yujin Jeong, Tobias Braun + 1 more2026-03-05🤖 cs.LG

Reducing hyperparameter sensitivity in measurement-feedback based Ising machines

Cet article analyse la sensibilité accrue aux hyperparamètres des machines d'Ising à rétroaction par mesure par rapport aux modèles continus et propose une méthode expérimentale pour réduire cette sensibilité, améliorant ainsi leur opération pratique.

Toon Sevenants, Guy Van der Sande, Guy Verschaffelt2026-03-05🔬 physics.app-ph

When to restart? Exploring escalating restarts on convergence

Cet article propose une méthode d'optimisation adaptative appelée SGD-ER qui améliore la convergence et la précision des réseaux de neurones en déclenchant des redémarrages avec un taux d'apprentissage croissant dès que la stagnation est détectée.

Ayush K. Varshney, Šarūnas Girdzijauskas, Konstantinos Vandikas + 1 more2026-03-05🤖 cs.LG

FastWave: Optimized Diffusion Model for Audio Super-Resolution

Le papier présente FastWave, un modèle de diffusion optimisé et léger pour la super-résolution audio jusqu'à 48 kHz, qui surpasse NU-Wave 2 tout en réduisant considérablement les coûts computationnels et les temps d'entraînement par rapport aux solutions existantes.

Nikita Kuznetsov, Maksim Kaledin2026-03-05🤖 cs.LG

BeamPERL: Parameter-Efficient RL with Verifiable Rewards Specializes Compact LLMs for Structured Beam Mechanics Reasoning

L'étude BeamPERL démontre que l'apprentissage par renforcement avec des récompenses vérifiables améliore les performances d'un modèle de langage compact sur la mécanique des poutres, mais révèle que cette compétence repose sur l'adoption de modèles de résolution procéduraux plutôt que sur une véritable internalisation des principes physiques, limitant ainsi la généralisation face à des changements topologiques.

Tarjei Paule Hage, Markus J. Buehler2026-03-05🔬 cond-mat.mtrl-sci

Data-Aware Random Feature Kernel for Transformers

Le papier présente DARKFormer, un modèle de transformateur qui améliore l'efficacité et la stabilité de l'attention à noyau aléatoire en apprenant une géométrie de noyau alignée sur les données pour permettre un échantillonnage par importance à variance minimale, réduisant ainsi l'écart de performance avec l'attention softmax exacte, notamment lors du réglage fin de modèles préentraînés.

Amirhossein Farzam, Hossein Mobahi, Nolan Andrew Miller + 1 more2026-03-05🤖 cs.AI

Two-Stage Photovoltaic Forecasting: Separating Weather Prediction from Plant-Characteristics

Cet article propose une méthode de prévision photovoltaïque en deux étapes qui sépare la prédiction météorologique des caractéristiques de la centrale, démontrant que l'erreur de prévision augmente significativement lors de l'utilisation de modèles météorologiques plutôt que d'observations satellites, tout en identifiant des distributions statistiques adaptées pour modéliser ces erreurs.

Philipp Danner, Hermann de Meer2026-03-05🤖 cs.LG

Exploiting Subgradient Sparsity in Max-Plus Neural Networks

Cet article propose un algorithme de sous-gradient épars qui exploite la structure algébrique des réseaux de neurones Max-Plus pour optimiser efficacement la perte du pire échantillon, surmontant ainsi les limitations de la rétropropagation standard dans ce contexte non lisse.

Ikhlas Enaieh, Olivier Fercoq2026-03-05🤖 cs.LG

InstMeter: An Instruction-Level Method to Predict Energy and Latency of DL Model Inference on MCUs

Ce papier présente InstMeter, une méthode au niveau des instructions exploitant les cycles d'horloge des microcontrôleurs pour prédire avec une grande précision et une faible dépendance aux données les coûts énergétiques et de latence des modèles d'apprentissage profond, surpassant ainsi les approches existantes et optimisant la recherche d'architectures neuronales.

Hao Liu, Qing Wang, Marco Zuniga2026-03-05🤖 cs.LG

Unbiased Dynamic Pruning for Efficient Group-Based Policy Optimization

Ce papier présente DPPO, un cadre d'optimisation qui accélère l'apprentissage des grands modèles de langage en élaguant dynamiquement les échantillons de GRPO tout en préservant l'estimation non biaisée du gradient grâce à un rééchantillonnage par importance, complété par une stratégie d'empaquetage dense des prompts pour maximiser l'efficacité matérielle.

Haodong Zhu, Yangyang Ren, Yanjing Li + 6 more2026-03-05🤖 cs.AI

A Multi-Agent Framework for Interpreting Multivariate Physiological Time Series

Cette étude présente Vivaldi, un système multi-agents pour l'interprétation de séries temporelles physiologiques, révélant que l'orchestration d'agents améliore la justesse des explications pour les modèles non-déductifs mais dégrade leur pertinence pour les modèles de réflexion, soulignant ainsi que la valeur de l'IA agentique en milieu critique réside dans l'externalisation sélective du calcul plutôt que dans la complexité maximale du raisonnement.

Davide Gabrielli, Paola Velardi, Stefano Faralli + 1 more2026-03-05🤖 cs.LG

Learning Hip Exoskeleton Control Policy via Predictive Neuromusculoskeletal Simulation

Cette étude présente un cadre d'apprentissage basé sur la simulation neuromusculosquelettique qui permet de développer et de déployer une politique de contrôle pour un exosquelette de hanche sans données de capture de mouvement, démontrant ainsi une réduction de l'activation musculaire en simulation et une transfert efficace vers le matériel réel sans réglage supplémentaire.

Ilseung Park, Changseob Song, Inseung Kang2026-03-05🤖 cs.LG

CodeTaste: Can LLMs Generate Human-Level Code Refactorings?

Le papier présente CodeTaste, une nouvelle norme d'évaluation révélant que, bien que les agents LLM puissent exécuter des refactorisations lorsqu'elles sont spécifiées en détail, ils peinent à identifier spontanément les choix humains, une lacune que l'approche « proposer puis implémenter » permet de combler.

Alex Thillen, Niels Mündler, Veselin Raychev + 1 more2026-03-05🤖 cs.AI

Architectural Proprioception in State Space Models: Thermodynamic Training Induces Anticipatory Halt Detection

Cette étude démontre que l'entraînement thermodynamique induit chez les modèles d'espace d'état (SSM) une « proprioception architecturale » permettant une détection anticipée de l'arrêt via un couplage entre l'entropie de l'état et la confiance, un phénomène absent chez les Transformers qui révèle une forme de méta-cognition computationnelle native.

Jay Noon2026-03-05🤖 cs.AI

REDNET-ML: A Multi-Sensor Machine Learning Pipeline for Harmful Algal Bloom Risk Detection Along the Omani Coast

Le projet REDNET-ML développe un pipeline d'apprentissage automatique reproductible qui fusionne des données multi-capteurs satellitaires et des modèles de détection d'objets pour évaluer les risques de blooms algaux nuisibles le long des côtes omanaises.

Ameer Alhashemi2026-03-05🤖 cs.LG

Noise-aware Client Selection for carbon-efficient Federated Learning via Gradient Norm Thresholding

Cet article propose une approche modulaire intégrant un filtrage par seuillage de la norme du gradient pour améliorer la sélection des clients dans l'apprentissage fédéré éco-responsable, permettant ainsi de filtrer les données bruyantes et d'optimiser l'efficacité carbone tout en garantissant la convergence du modèle.

Patrick Wilhelm, Inese Yilmaz, Odej Kao2026-03-05🤖 cs.AI

Stable and Steerable Sparse Autoencoders with Weight Regularization

En introduisant une régularisation L2 des poids dans les autoencodeurs parcimonieux, cette étude démontre une amélioration significative de la stabilité des caractéristiques apprises et de l'efficacité du pilotage (steering) des modèles de langage, tout en renforçant la corrélation entre les explications sémantiques et le contrôle fonctionnel.

Piotr Jedryszek, Oliver M. Crook2026-03-05🤖 cs.LG

Bayesian Adversarial Privacy

Cet article propose une nouvelle notion quantitative de confidentialité, fondée sur la théorie de décision bayésienne et conçue pour être plus contextuelle et rigoureuse que la confidentialité différentielle ou la théorie du divulgation statistique, en exigeant que les décisions de divulgation soient prises du point de vue de la distribution a priori.

Cameron Bell, Timothy Johnston, Antoine Luciano + 1 more2026-03-05🤖 cs.LG

Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

Cet article propose une justification théorique fondée sur la vraisemblance pour l'agrégation d'ensembles via les moyennes généralisées, démontrant que seules les configurations d'ordre $r \in [0,1]$ garantissent systématiquement une amélioration par rapport aux distributions individuelles, ce qui valide ainsi les pratiques courantes de pooling linéaire et géométrique.

Raphaël Razafindralambo, Rémy Sun, Frédéric Precioso + 2 more2026-03-05🤖 cs.LG

← Précédent Suivant →