MAD-SmaAt-GNet: A Multimodal Advection-Guided Neural Network for Precipitation Nowcasting

Ce papier présente le MAD-SmaAt-GNet, un réseau de neurones multimodal guidé par l'advection qui améliore la précision et l'efficacité du prévisionnisme des précipitations en combinant l'apprentissage de multiples variables météorologiques avec une composante physique, réduisant ainsi l'erreur quadratique moyenne par rapport à l'architecture de base SmaAt-UNet.

Samuel van Wonderen, Siamak Mehrkanoon2026-03-06💻 cs

Understanding the Dynamics of Demonstration Conflict in In-Context Learning

Cette étude révèle que les modèles de langage souffrent de conflits dans les exemples few-shot car ils codent d'abord les règles contradictoires dans leurs couches intermédiaires avant de développer une confiance biaisée dans les couches tardives, un mécanisme que l'on peut atténuer en masquant sélectivement des têtes d'attention spécifiques pour améliorer les performances de plus de 10 %.

Difan Jiao, Di Wang, Lijie Hu2026-03-06💻 cs

Towards Explainable Deep Learning for Ship Trajectory Prediction in Inland Waterways

Cette étude propose un modèle de prédiction de trajectoire de navires en voies navigables intérieures basé sur un LSTM et des paramètres de domaine naval pour améliorer l'interprétabilité, révélant que bien que l'architecture d'attention améliore la précision, les poids appris ne reflètent pas toujours une relation causale attendue entre les trajectoires des navires.

Tom Legel, Dirk Söffker, Roland Schätzle + 1 more2026-03-06💻 cs

Dictionary Based Pattern Entropy for Causal Direction Discovery

Cet article propose un cadre novateur de « Dictionary Based Pattern Entropy » (DPE) qui, en combinant la théorie de l'information algorithmique et de Shannon, infère avec succès la direction de causalité et les sous-motifs déterminants dans les séquences symboliques temporelles en minimisant l'incertitude liée aux motifs, surpassant ainsi les méthodes existantes sur divers systèmes synthétiques et réels.

Harikrishnan N B, Shubham Bhilare, Aditi Kathpalia + 1 more2026-03-06🔢 math

Standing on the Shoulders of Giants: Rethinking EEG Foundation Model Pretraining via Multi-Teacher Distillation

Cet article propose le cadre MTDP, une méthode de pré-entraînement par distillation multi-enseignants qui exploite des modèles fondationnels existants en vision et en séries temporelles pour améliorer l'apprentissage des modèles fondationnels EEG, surpassant ainsi les approches auto-supervisées tout en nécessitant seulement 25 % des données de pré-entraînement.

Chenqi Li, Yu Liu, Shuo Zhang + 2 more2026-03-06💻 cs

Bayesian Modeling of Collatz Stopping Times: A Probabilistic Machine Learning Perspective

Cet article propose une modélisation bayésienne des temps d'arrêt de la conjecture de Collatz en comparant une régression hiérarchique binomiale négative et une approximation générative basée sur la décomposition en blocs impairs, démontrant que la structure modulaire de bas ordre (notamment nmod8n \bmod 8) est un facteur clé de l'hétérogénéité observée.

Nicolò Bonacorsi, Matteo Bordoni2026-03-06🔢 math

Projected Hessian Learning: Fast Curvature Supervision for Accurate Machine-Learning Interatomic Potentials

Cet article présente l'apprentissage de Hessien projeté (PHL), une méthode évolutive qui intègre des informations de courbure dans l'entraînement des potentiels interatomiques basés sur l'apprentissage automatique via des produits Hessien-vecteur, permettant d'atteindre une précision de second ordre comparable à celle de l'utilisation de Hessiens complets tout en réduisant considérablement les coûts de calcul et de mémoire.

Austin Rodriguez, Justin S. Smith, Sakib Matin + 3 more2026-03-06🔬 physics

The Volterra signature

Cet article propose la signature de Volterra, une représentation de caractéristiques explicite et interprétable pour les séries temporelles non markoviennes, qui offre des garanties théoriques d'approximation universelle, permet un calcul efficace via des équations différentielles et des noyaux intégraux, et surpasse les signatures de chemin classiques dans les tâches d'apprentissage dynamique.

Paul P. Hager, Fabian N. Harang, Luca Pelizzari + 1 more2026-03-06💻 cs

Invariant Causal Routing for Governing Social Norms in Online Market Economies

Cet article propose un cadre de gouvernance appelé « Invariant Causal Routing » (ICR) qui utilise la découverte causale et le raisonnement contrefactuel pour identifier des règles politiques interprétables et stables capables de guider l'émergence de normes sociales durables dans les économies de marché en ligne, même en présence de changements de distribution.

Xiangning Yu, Qirui Mi, Xiao Xue + 4 more2026-03-06💻 cs