cs.LG articles | Gist.Science

Robustness Verification of Graph Neural Networks Via Lightweight Satisfiability Testing

Les auteurs proposent une méthode de vérification de robustesse pour les réseaux de neurones à graphes (GNN) qui remplace les solveurs puissants par des solveurs partiels efficaces, permettant d'améliorer l'état de l'art en matière de robustesse structurelle grâce à une approche légère et rapide.

Chia-Hsuan Lu, Tony Tan, Michael Benedikt2026-03-10🤖 cs.LG

A Unified Framework for Zero-Shot Reinforcement Learning

Cet article propose un cadre formel unifié pour l'apprentissage par renforcement zero-shot, établissant une taxonomie des méthodes selon leurs représentations et paradigmes d'apprentissage, tout en décomposant les erreurs globales en trois composantes pour faciliter les comparaisons rigoureuses.

Jacopo Di Ventura, Jan Felix Kleuker, Aske Plaat, Thomas Moerland2026-03-10🤖 cs.LG

SwiftTS: A Swift Selection Framework for Time Series Pre-trained Models via Multi-task Meta-Learning

Le papier propose SwiftTS, un cadre d'apprentissage méta multi-tâches léger qui sélectionne efficacement les meilleurs modèles pré-entraînés pour les séries temporelles en prédisant leurs performances sur des données non vues sans nécessiter un ajustage fin coûteux.

Tengxue Zhang, Biao Ouyang, Yang Shu, Xinyang Chen, Chenjuan Guo, Bin Yang2026-03-10🤖 cs.LG

Bayesian neural networks with interpretable priors from Mercer kernels

Cet article présente une nouvelle classe de priors, appelés priors de Mercer, pour les réseaux de neurones bayésiens, qui permettent de définir des distributions sur les paramètres du réseau à partir de la représentation de Mercer d'un noyau de covariance afin que les échantillons du réseau approximent ceux d'un processus gaussien spécifié, combinant ainsi l'interprétabilité des processus gaussiens avec l'évolutivité des réseaux de neurones.

Alex Alberts, Ilias Bilionis2026-03-10🤖 cs.LG

Continual Low-Rank Adapters for LLM-based Generative Recommender Systems

Ce papier propose PESO, une méthode d'adaptation continue utilisant un régularisateur proximal pour optimiser l'apprentissage des adaptateurs LoRA dans les systèmes de recommandation génératifs en équilibrant l'adaptation aux comportements récents et la préservation des connaissances utiles, surpassant ainsi les méthodes existantes.

Hyunsik Yoo, Ting-Wei Li, SeongKu Kang, Zhining Liu, Charlie Xu, Qilin Qi, Hanghang Tong2026-03-10🤖 cs.LG

Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet

Cette étude compare l'approche interprétable ANFIS-FBCSP-PSO et le modèle profond EEGNet pour la classification des EEG d'imagerie motrice, révélant que le premier surpasse le second en précision intra-sujet tandis que le second offre une meilleure généralisation inter-sujet, fournissant ainsi des directives pour choisir entre interprétabilité et robustesse dans les systèmes BCI.

Farjana Aktar, Mohd Ruhul Ameen, Akif Islam, Md Ekramul Hamid2026-03-10🤖 cs.LG

Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing

Cet article propose le système NMoE, une approche d'apprentissage fédéré intégrant des apprentissages supervisé et auto-supervisé, permettant aux dispositifs mobiles de collaborer efficacement pour l'inférence et l'entraînement de modèles d'intelligence artificielle de grande taille tout en préservant la confidentialité des données et l'efficacité des communications.

Song Gao, Songyang Zhang, Shusen Jing, Shuai Zhang, Xiangwei Zhou, Yue Wang, Zhipeng Cai2026-03-10🤖 cs.LG

FATE: A Formal Benchmark Series for Frontier Algebra of Multiple Difficulty Levels

Le papier présente FATE, une nouvelle série de benchmarks en algèbre formelle couvrant des niveaux de difficulté allant des exercices universitaires à des problèmes dépassant les examens de doctorat, révélant que les modèles de langage actuels éprouvent des difficultés majeures à formaliser un raisonnement mathématique avancé, avec des taux de réussite extrêmement faibles sur les problèmes les plus complexes.

Jiedong Jiang, Wanyi He, Yuefeng Wang, Guoxiong Gao, Yongle Hu, Jingting Wang, Nailin Guan, Peihao Wu, Chunbo Dai, Liang Xiao, Bin Dong2026-03-10🤖 cs.LG

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Ce rapport présente Jr. AI Scientist, un système autonome capable de générer des contributions scientifiques novatrices en suivant un flux de travail de recherche complet, tout en évaluant ses performances supérieures aux systèmes existants et en identifiant les risques et limites critiques nécessitant une supervision humaine.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa2026-03-10🤖 cs.LG

Distributionally Robust Self Paced Curriculum Reinforcement Learning

Ce papier propose la méthode DR-SPCRL, qui améliore l'apprentissage par renforcement robuste en adaptant dynamiquement le budget de robustesse sous forme de curriculum, permettant ainsi de stabiliser l'entraînement et d'obtenir un compromis supérieur entre performance nominale et résilience face aux perturbations.

Anirudh Satheesh, Keenan Powell, Vaneet Aggarwal2026-03-10🤖 cs.LG

Adaptive Multi-view Graph Contrastive Learning via Fractional-order Neural Diffusion Networks

Cet article présente un cadre d'apprentissage contrastif de graphes sans augmentation, fondé sur la dynamique continue d'ordre fractionnaire, qui génère automatiquement une gamme continue de vues adaptatives pour capturer des motifs structurels multi-échelles et surpasser les méthodes de l'art.

Yanan Zhao, Feng Ji, Jingyang Dai, Jiaze Ma, Keyue Jiang, Kai Zhao, Wee Peng Tay2026-03-10🤖 cs.LG

Improving Conditional VAE with Non-Volume Preserving transformations

Cet article propose d'améliorer les CVAE pour la génération d'images en modélisant la distribution conditionnelle de l'espace latent via des transformations non préservant le volume, ce qui permet de réduire le flou, d'augmenter la diversité et de surpasser les méthodes existantes avec une baisse du FID de 4 % et une hausse de la vraisemblance logarithmique de 7,6 %.

Tuhin Subhra De2026-03-10🤖 cs.LG

Tight Robustness Certification Through the Convex Hull of $\ell_0$ Attacks

Cet article propose une méthode de certification de robustesse pour les attaques $\ell_0$ qui, en exploitant la propriété géométrique de l'enveloppe convexe de la boule $\ell_0$ , permet de calculer des bornes linéaires nettement plus serrées et d'accélérer significativement les vérificateurs d'état de l'art.

Yuval Shapira, Dana Drachsler-Cohen2026-03-10🤖 cs.LG

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

Cet article propose une nouvelle méthode d'attaque par exemple adversaire pour les réseaux hyperboliques, baptisée « Angular Gradient Sign », qui exploite la géométrie de l'espace en se concentrant sur les composantes angulaires du gradient pour générer des perturbations plus efficaces et révéler des vulnérabilités spécifiques aux représentations hiérarchiques.

Minsoo Jo, Dongyoon Yang, Taesup Kim2026-03-10🤖 cs.LG

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

Cet article propose un cadre probabiliste réaliste, basé sur la notion de « (k, ε)-instable », pour améliorer la fiabilité des certificats de sécurité de SmoothLLM face aux attaques de contournement (jailbreaking) en remplaçant l'hypothèse restrictive « k-instable » par une borne inférieure fondée sur des données empiriques.

Adarsh Kumarappan, Ayushi Mehrotra2026-03-10🤖 cs.LG

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

Cette étude présente un pipeline automatisé pour générer des attaques de jailbreak multi-tours fondées sur des principes psychologiques, révélant que les modèles de la famille GPT sont particulièrement vulnérables à ces manipulations contextuelles, contrairement à Gemini 2.5 Flash qui démontre une résilience exceptionnelle.

Adarsh Kumarappan, Ananya Mujoo2026-03-10🤖 cs.LG

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

Cet article propose une méthode de régularisation ciblée dans l'espace latent, qui améliore la généralisation hors distribution en injectant du bruit anisotrope pour aplatir les frontières de décision le long des axes de raccourcis sans nécessiter d'étiquettes explicites ni d'exemples contradictoires.

Shivam Pal, Sakshi Varshney, Piyush Rai2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

Cette étude démontre que le crowdsourcing via une compétition Kaggle a permis de développer des architectures d'apprentissage machine hybrides stables et performantes pour les simulations climatiques, validant ainsi l'efficacité de cette approche pour résoudre les problèmes d'instabilité en ligne dans les modèles climatiques à basse résolution.

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

Le papier présente CRAwDAD, un cadre de débat à deux agents utilisant des modèles de raisonnement pour améliorer la précision de l'inférence causale en simulant un dialogue critique entre hypothèses concurrentes, ce qui a permis d'augmenter significativement les performances des modèles Qwen3 et DeepSeek-R1 sur le jeu de données CLadder.

Finn G. Vamosi, Nils D. Forkert2026-03-10🤖 cs.LG

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Cette étude présente ForamDeepSlice, un cadre d'apprentissage profond de haute précision qui utilise des tranches 2D de micro-CT pour classifier automatiquement les espèces de foraminifères avec une exactitude de 95,64 %, tout en offrant un tableau de bord interactif pour le déploiement pratique en géosciences.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

← Précédent Suivant →

cs.LG