Bayesian neural networks with interpretable priors from Mercer kernels

Cet article présente une nouvelle classe de priors, appelés priors de Mercer, pour les réseaux de neurones bayésiens, qui permettent de définir des distributions sur les paramètres du réseau à partir de la représentation de Mercer d'un noyau de covariance afin que les échantillons du réseau approximent ceux d'un processus gaussien spécifié, combinant ainsi l'interprétabilité des processus gaussiens avec l'évolutivité des réseaux de neurones.

Alex Alberts, Ilias Bilionis2026-03-10🤖 cs.LG

Continual Low-Rank Adapters for LLM-based Generative Recommender Systems

Ce papier propose PESO, une méthode d'adaptation continue utilisant un régularisateur proximal pour optimiser l'apprentissage des adaptateurs LoRA dans les systèmes de recommandation génératifs en équilibrant l'adaptation aux comportements récents et la préservation des connaissances utiles, surpassant ainsi les méthodes existantes.

Hyunsik Yoo, Ting-Wei Li, SeongKu Kang, Zhining Liu, Charlie Xu, Qilin Qi, Hanghang Tong2026-03-10🤖 cs.LG

Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet

Cette étude compare l'approche interprétable ANFIS-FBCSP-PSO et le modèle profond EEGNet pour la classification des EEG d'imagerie motrice, révélant que le premier surpasse le second en précision intra-sujet tandis que le second offre une meilleure généralisation inter-sujet, fournissant ainsi des directives pour choisir entre interprétabilité et robustesse dans les systèmes BCI.

Farjana Aktar, Mohd Ruhul Ameen, Akif Islam, Md Ekramul Hamid2026-03-10🤖 cs.LG

Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing

Cet article propose le système NMoE, une approche d'apprentissage fédéré intégrant des apprentissages supervisé et auto-supervisé, permettant aux dispositifs mobiles de collaborer efficacement pour l'inférence et l'entraînement de modèles d'intelligence artificielle de grande taille tout en préservant la confidentialité des données et l'efficacité des communications.

Song Gao, Songyang Zhang, Shusen Jing, Shuai Zhang, Xiangwei Zhou, Yue Wang, Zhipeng Cai2026-03-10🤖 cs.LG

FATE: A Formal Benchmark Series for Frontier Algebra of Multiple Difficulty Levels

Le papier présente FATE, une nouvelle série de benchmarks en algèbre formelle couvrant des niveaux de difficulté allant des exercices universitaires à des problèmes dépassant les examens de doctorat, révélant que les modèles de langage actuels éprouvent des difficultés majeures à formaliser un raisonnement mathématique avancé, avec des taux de réussite extrêmement faibles sur les problèmes les plus complexes.

Jiedong Jiang, Wanyi He, Yuefeng Wang, Guoxiong Gao, Yongle Hu, Jingting Wang, Nailin Guan, Peihao Wu, Chunbo Dai, Liang Xiao, Bin Dong2026-03-10🤖 cs.LG

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Ce rapport présente Jr. AI Scientist, un système autonome capable de générer des contributions scientifiques novatrices en suivant un flux de travail de recherche complet, tout en évaluant ses performances supérieures aux systèmes existants et en identifiant les risques et limites critiques nécessitant une supervision humaine.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa2026-03-10🤖 cs.LG

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

Cet article propose une nouvelle méthode d'attaque par exemple adversaire pour les réseaux hyperboliques, baptisée « Angular Gradient Sign », qui exploite la géométrie de l'espace en se concentrant sur les composantes angulaires du gradient pour générer des perturbations plus efficaces et révéler des vulnérabilités spécifiques aux représentations hiérarchiques.

Minsoo Jo, Dongyoon Yang, Taesup Kim2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

Cette étude démontre que le crowdsourcing via une compétition Kaggle a permis de développer des architectures d'apprentissage machine hybrides stables et performantes pour les simulations climatiques, validant ainsi l'efficacité de cette approche pour résoudre les problèmes d'instabilité en ligne dans les modèles climatiques à basse résolution.

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Cette étude présente ForamDeepSlice, un cadre d'apprentissage profond de haute précision qui utilise des tranches 2D de micro-CT pour classifier automatiquement les espèces de foraminifères avec une exactitude de 95,64 %, tout en offrant un tableau de bord interactif pour le déploiement pratique en géosciences.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG