The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

Cette étude propose une analyse mécanistique des attaques de contournement (jailbreak) déclenchées par la continuation dans les grands modèles de langage, révélant que leur succès résulte d'une compétition intrinsèque entre la tendance du modèle à poursuivre le texte et ses défenses de sécurité, tout en identifiant des têtes d'attention critiques dont les comportements varient selon les architectures.

Yonghong Deng, Zhen Yang, Ping Jian, Xinyue Zhang, Zhongbin Guo, Chengzhi Li2026-03-10🤖 cs.LG

Optimising antibiotic switching via forecasting of patient physiology

Cette étude propose un système d'aide à la décision basé sur les processus neuronaux qui, en prédisant probabilistiquement l'évolution des signes vitaux des patients, identifie plus efficacement ceux éligibles au passage des antibiotiques intraveineux aux formes orales, surpassant ainsi les approches traditionnelles et améliorant la gestion des antibiotiques.

Magnus Ross, Nel Swanepoel, Akish Luintel, Emma McGuire, Ingemar J. Cox, Steve Harris, Vasileios Lampos2026-03-10🤖 cs.LG

FlowTouch: View-Invariant Visuo-Tactile Prediction

Ce papier présente FlowTouch, un modèle novateur de prédiction visuo-tactile invariant au point de vue qui utilise la reconstruction de maillages 3D locaux et le Flow Matching pour générer des images tactiles à partir de données visuelles, comblant ainsi l'écart sim-to-real et permettant une prédiction de stabilité de préhension.

Seongjin Bien, Carlo Kneissl, Tobias Jülg, Frank Fundel, Thomas Ressler-Antal, Florian Walter, Björn Ommer, Gitta Kutyniok, Wolfram Burgard2026-03-10🤖 cs.LG

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

Cet article présente une architecture de navigation magnétique aéroportée entièrement adaptative capable de compenser en temps réel les interférences magnétiques de l'avion grâce à un filtre de Kalman étendu intégrant un réseau de neurones pour un apprentissage en vol sans besoin de calibrage préalable.

Antonia Hager, Sven Nebendahl, Alexej Klushyn, Jasper Krauser, Torleiv H. Bryne, Tor Arne Johansen2026-03-10🤖 cs.LG

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

Cet article présente TA-RNN-Medical-Hybrid, un cadre d'apprentissage profond hybride et interprétable conçu pour prédire avec précision le risque de mortalité en soins intensifs en modélisant les dynamiques temporelles irrégulières des dossiers de santé électroniques tout en fournissant des explications cliniques transparentes.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad Farhadi2026-03-10🤖 cs.LG

PolyFormer: learning efficient reformulations for scalable optimization under complex physical constraints

Le papier présente PolyFormer, une méthode d'apprentissage automatique informée par la physique qui améliore l'évolutivité de l'optimisation sous contraintes physiques complexes en transformant les structures géométriques en reformulations polytopiques efficaces, permettant ainsi des accélérations computationnelles massives tout en maintenant une qualité de solution compétitive.

Yilin Wen, Yi Guo, Bo Zhao, Wei Qi, Zechun Hu, Colin Jones, Jian Sun2026-03-10🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Cet article établit des bornes de regret bayésien sous-linéaires pour l'algorithme de rétroéchantillonnage de Gaussien (GP-PSRL) dans des espaces d'états continus et non bornés, en démontrant que les états visités restent confinés dans une boule de rayon quasi constant et en obtenant une dépendance optimale par rapport au gain d'information maximal grâce à la méthode de chaînage.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan Peters2026-03-10🤖 cs.LG

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

Cette étude révèle que l'optimisation SAM induit des biais implicites profonds et dépendants de l'initialisation dans les réseaux linéaires profonds, se distinguant radicalement du gradient descent par des dynamiques temporelles complexes comme l'amplification séquentielle des caractéristiques mineures, ce qui démontre les limites des analyses de biais basées uniquement sur la convergence asymptotique.

Chaewon Moon, Dongkuk Si, Chulhee Yun2026-03-10🤖 cs.LG

Graph-Instructed Neural Networks for parametric problems with varying boundary conditions

Cet article propose une nouvelle méthodologie basée sur des réseaux de neurones instruits par des graphes (GINN) pour surmonter les limitations des techniques de réduction d'ordre classiques et permettre une simulation efficace et précise de phénomènes physiques régis par des équations aux dérivées partielles paramétriques avec des conditions aux limites variables.

Francesco Della Santa, Sandra Pieraccini, Maria Strazzullo2026-03-10🤖 cs.LG

Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems

Ce papier établit des critères pour déterminer l'identifiabilité du signe des effets causaux dans des systèmes dynamiques stochastiques linéaires stationnaires à temps continu, en relaxant l'hypothèse d'une matrice de diffusion connue et en se concentrant sur la détermination du signe des coefficients de dérive à partir de la matrice de covariance observationnelle.

Gijs van Seeventer, Saber Salehkaleybar2026-03-10🤖 cs.LG

Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology

Cet article propose un cadre général pour évaluer la fiabilité des cartes de chaleur en apprentissage multiple-instance en histopathologie, démontrant que des méthodes comme LRP et IG surpassent les cartes d'attention et permettent ainsi une validation plus robuste des modèles et la découverte de nouveaux biomarqueurs biologiques.

Mina Jamshidi Idaji, Julius Hense, Tom Neuhäuser, Augustin Krause, Yanqing Luo, Oliver Eberle, Thomas Schnake, Laure Ciernik, Farnoush Rezaei Jafari, Reza Vahidimajd, Jonas Dippel, Christoph Walz, Frederick Klauschen, Andreas Mock, Klaus-Robert Müller2026-03-10🤖 cs.LG

Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers

Ce papier propose de remplacer la projection de sortie dense de l'attention par une transformée de Hadamard-Walch fixe et sans paramètres suivie d'une mise à l'échelle affine légère, réduisant ainsi significativement le nombre de paramètres et la consommation mémoire tout en maintenant, voire en améliorant, les performances et l'efficacité computationnelle des Transformers.

Shubham Aggarwal, Lokendra Kumar2026-03-10🤖 cs.LG