cs.LG articles | Gist.Science

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

Cette étude propose une analyse mécanistique des attaques de contournement (jailbreak) déclenchées par la continuation dans les grands modèles de langage, révélant que leur succès résulte d'une compétition intrinsèque entre la tendance du modèle à poursuivre le texte et ses défenses de sécurité, tout en identifiant des têtes d'attention critiques dont les comportements varient selon les architectures.

Yonghong Deng, Zhen Yang, Ping Jian, Xinyue Zhang, Zhongbin Guo, Chengzhi Li2026-03-10🤖 cs.LG

Fibration Policy Optimization

Ce papier propose Fibration Policy Optimization (FiberPO), un cadre unifié qui intègre la théorie des régions de confiance et une structure algébrique de fibrés pour optimiser les politiques des grands modèles de langage à travers plusieurs échelles hiérarchiques, de la tokenisation jusqu'aux domaines entiers.

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Optimising antibiotic switching via forecasting of patient physiology

Cette étude propose un système d'aide à la décision basé sur les processus neuronaux qui, en prédisant probabilistiquement l'évolution des signes vitaux des patients, identifie plus efficacement ceux éligibles au passage des antibiotiques intraveineux aux formes orales, surpassant ainsi les approches traditionnelles et améliorant la gestion des antibiotiques.

Magnus Ross, Nel Swanepoel, Akish Luintel, Emma McGuire, Ingemar J. Cox, Steve Harris, Vasileios Lampos2026-03-10🤖 cs.LG

FedPrism: Adaptive Personalized Federated Learning under Non-IID Data

FedPrism est un cadre d'apprentissage fédéré personnalisé qui atténue les effets de l'hétérogénéité statistique (non-IID) en combinant une décomposition prismatique du modèle en composantes globale, groupée et privée avec une architecture à double flux adaptative, surpassant ainsi les méthodes d'agrégation statique et de clustering rigide.

Prakash Kumbhakar, Shrey Srivastava, Haroon R Lone2026-03-10🤖 cs.LG

FlowTouch: View-Invariant Visuo-Tactile Prediction

Ce papier présente FlowTouch, un modèle novateur de prédiction visuo-tactile invariant au point de vue qui utilise la reconstruction de maillages 3D locaux et le Flow Matching pour générer des images tactiles à partir de données visuelles, comblant ainsi l'écart sim-to-real et permettant une prédiction de stabilité de préhension.

Seongjin Bien, Carlo Kneissl, Tobias Jülg, Frank Fundel, Thomas Ressler-Antal, Florian Walter, Björn Ommer, Gitta Kutyniok, Wolfram Burgard2026-03-10🤖 cs.LG

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Ce papier présente les estimateurs ReinMax-Rao et ReinMax-CV, qui réduisent la variance de l'estimateur ReinMax grâce à la Rao-Blackwellisation et aux variables de contrôle, améliorant ainsi l'entraînement des autoencodeurs variationnels à variables latentes discrètes.

Daniel Wang, Thang D. Bui2026-03-10🤖 cs.LG

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

Cet article présente une architecture de navigation magnétique aéroportée entièrement adaptative capable de compenser en temps réel les interférences magnétiques de l'avion grâce à un filtre de Kalman étendu intégrant un réseau de neurones pour un apprentissage en vol sans besoin de calibrage préalable.

Antonia Hager, Sven Nebendahl, Alexej Klushyn, Jasper Krauser, Torleiv H. Bryne, Tor Arne Johansen2026-03-10🤖 cs.LG

Towards a more efficient bias detection in financial language models

Cette étude propose une méthode de détection de biais plus efficace pour les modèles de langage financiers en exploitant les similitudes entre modèles pour identifier rapidement les entrées révélatrices de biais, réduisant ainsi considérablement les coûts de calcul par rapport aux approches traditionnelles.

Firas Hadj Kacem, Ahmed Khanfir, Mike Papadakis2026-03-10🤖 cs.LG

SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning

Le papier propose SCL-GNN, un nouveau cadre d'apprentissage qui améliore la généralisation des réseaux de neurones graphiques sur des données distribuées de manière identique et indépendante (IID) et hors distribution (OOD) en utilisant le critère d'indépendance de Hilbert-Schmidt (HSIC) pour identifier et atténuer les corrélations spurious.

Yuxiang Zhang, Enyan Dai2026-03-10🤖 cs.LG

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

Cet article présente TA-RNN-Medical-Hybrid, un cadre d'apprentissage profond hybride et interprétable conçu pour prédire avec précision le risque de mortalité en soins intensifs en modélisant les dynamiques temporelles irrégulières des dossiers de santé électroniques tout en fournissant des explications cliniques transparentes.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad Farhadi2026-03-10🤖 cs.LG

PolyFormer: learning efficient reformulations for scalable optimization under complex physical constraints

Le papier présente PolyFormer, une méthode d'apprentissage automatique informée par la physique qui améliore l'évolutivité de l'optimisation sous contraintes physiques complexes en transformant les structures géométriques en reformulations polytopiques efficaces, permettant ainsi des accélérations computationnelles massives tout en maintenant une qualité de solution compétitive.

Yilin Wen, Yi Guo, Bo Zhao, Wei Qi, Zechun Hu, Colin Jones, Jian Sun2026-03-10🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Cet article établit des bornes de regret bayésien sous-linéaires pour l'algorithme de rétroéchantillonnage de Gaussien (GP-PSRL) dans des espaces d'états continus et non bornés, en démontrant que les états visités restent confinés dans une boule de rayon quasi constant et en obtenant une dépendance optimale par rapport au gain d'information maximal grâce à la méthode de chaînage.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan Peters2026-03-10🤖 cs.LG

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

Cette étude révèle que l'optimisation SAM induit des biais implicites profonds et dépendants de l'initialisation dans les réseaux linéaires profonds, se distinguant radicalement du gradient descent par des dynamiques temporelles complexes comme l'amplification séquentielle des caractéristiques mineures, ce qui démontre les limites des analyses de biais basées uniquement sur la convergence asymptotique.

Chaewon Moon, Dongkuk Si, Chulhee Yun2026-03-10🤖 cs.LG

Graph-Instructed Neural Networks for parametric problems with varying boundary conditions

Cet article propose une nouvelle méthodologie basée sur des réseaux de neurones instruits par des graphes (GINN) pour surmonter les limitations des techniques de réduction d'ordre classiques et permettre une simulation efficace et précise de phénomènes physiques régis par des équations aux dérivées partielles paramétriques avec des conditions aux limites variables.

Francesco Della Santa, Sandra Pieraccini, Maria Strazzullo2026-03-10🤖 cs.LG

Concept-Guided Fine-Tuning: Steering ViTs away from Spurious Correlations to Improve Robustness

Cet article propose un cadre de fine-tuning innovant qui améliore la robustesse des Vision Transformers face aux changements de distribution en alignant leurs cartes de pertinence sur des masques de concepts sémantiques générés automatiquement, réduisant ainsi la dépendance aux corrélations spurious.

Yehonatan Elisha, Oren Barkan, Noam Koenigstein2026-03-10🤖 cs.LG

Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems

Ce papier établit des critères pour déterminer l'identifiabilité du signe des effets causaux dans des systèmes dynamiques stochastiques linéaires stationnaires à temps continu, en relaxant l'hypothèse d'une matrice de diffusion connue et en se concentrant sur la détermination du signe des coefficients de dérive à partir de la matrice de covariance observationnelle.

Gijs van Seeventer, Saber Salehkaleybar2026-03-10🤖 cs.LG

Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology

Cet article propose un cadre général pour évaluer la fiabilité des cartes de chaleur en apprentissage multiple-instance en histopathologie, démontrant que des méthodes comme LRP et IG surpassent les cartes d'attention et permettent ainsi une validation plus robuste des modèles et la découverte de nouveaux biomarqueurs biologiques.

Mina Jamshidi Idaji, Julius Hense, Tom Neuhäuser, Augustin Krause, Yanqing Luo, Oliver Eberle, Thomas Schnake, Laure Ciernik, Farnoush Rezaei Jafari, Reza Vahidimajd, Jonas Dippel, Christoph Walz, Frederick Klauschen, Andreas Mock, Klaus-Robert Müller2026-03-10🤖 cs.LG

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

Cette étude démontre que l'intégration de caractéristiques issues de l'opérateur de Koopman (via EDMD avec un dictionnaire à fonctions de base radiale optimisé) dans des transformateurs permet d'obtenir des performances supérieures à celles des méthodes basées uniquement sur les ondelettes pour la classification multiclasse des électrocardiogrammes.

Sucheta Ghosh, Zahra Monfared2026-03-10🤖 cs.LG

Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers

Ce papier propose de remplacer la projection de sortie dense de l'attention par une transformée de Hadamard-Walch fixe et sans paramètres suivie d'une mise à l'échelle affine légère, réduisant ainsi significativement le nombre de paramètres et la consommation mémoire tout en maintenant, voire en améliorant, les performances et l'efficacité computationnelle des Transformers.

Shubham Aggarwal, Lokendra Kumar2026-03-10🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Cet article présente une nouvelle méthode d'optimisation par gradient pour générer des explications contrefactuelles plausibles en classification de séries temporelles, en intégrant une contrainte d'alignement soft-DTW avec les voisins les plus proches pour garantir une structure temporelle réaliste tout en surpassant les approches existantes.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba2026-03-10🤖 cs.LG

← Précédent Suivant →