Bayes with No Shame: Admissibility Geometries of Predictive Inference

Cet article démontre que l'admissibilité en inférence prédictive est irréductiblement relative au critère choisi, en établissant que quatre géométries distinctes (dominance de Blackwell, validité à tout instant, couverture marginale et approche de Cesàro) définissent des classes de procédures non imbriquées, chacune possédant son propre certificat d'optimalité et ses contraintes géométriques incompatibles.

Nicholas G. Polson, Daniel Zantedeschi2026-03-06🔢 math

Preserving Continuous Symmetry in Discrete Spaces: Geometric-Aware Quantization for SO(3)-Equivariant GNNs

Cet article propose le cadre de quantification géométriquement consciente (GAQ), qui préserve rigoureusement la symétrie SO(3) dans les réseaux de neurones graphiques équivariants grâce à une quantification découplée et à des stratégies d'entraînement adaptées, permettant ainsi d'accélérer les simulations de dynamique moléculaire tout en maintenant une précision équivalente aux modèles en virgule flottante.

Haoyu Zhou, Ping Xue, Hao Zhang + 1 more2026-03-06🤖 cs.LG

On the Necessity of Learnable Sheaf Laplacians

Cet article remet en question la nécessité d'apprendre les applications de restriction dans les réseaux de neurones sur faisceaux en démontrant qu'une version simplifiée avec des applications fixes à l'identité atteint des performances comparables sur des graphes hétérophiles, suggérant ainsi que la complexité supplémentaire n'est pas justifiée par une réduction empirique du lissage excessif.

Ferran Hernandez Caralt, Mar Gonzàlez i CatalÃ, Adrián Bazaga + 1 more2026-03-06🤖 cs.LG

MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis

Le papier présente MobileFetalCLIP, une méthode de distillation de connaissances répulsive sélective qui permet à un modèle étudiant léger de surpasser un modèle enseignant massif dans l'analyse d'échographies fœtales, rendant ainsi possible un déploiement en temps réel sur des appareils mobiles à ressources limitées.

Numan Saeed, Fadillah Adamsyah Maani, Mohammad Yaqub2026-03-06🤖 cs.AI

Ensembling Language Models with Sequential Monte Carlo

Cet article propose un cadre unifié pour l'assemblage de modèles de langage via des distributions ff-ensembles, en utilisant un algorithme de Monte Carlo séquentiel au niveau des octets pour surmonter les défis de la normalisation locale et des vocabulaires incompatibles, permettant ainsi d'obtenir de meilleures performances de génération que les méthodes d'agrégation traditionnelles.

Robin Shing Moon Chan, Tianyu Liu, Samuel Kiegeland + 5 more2026-03-06🤖 cs.AI

Kraus Constrained Sequence Learning For Quantum Trajectories from Continuous Measurement

Cet article propose une méthode d'apprentissage de séquences quantiques utilisant une couche de sortie structurée en opérateurs de Kraus pour garantir des mises à jour d'états physiquement valides et améliorer la précision de l'estimation des trajectoires quantiques en régime non stationnaire, surpassant les modèles non contraints grâce à une architecture basée sur le LSTM.

Priyanshi Singh, Krishna Bhatia2026-03-06🤖 cs.LG

Thermodynamic Response Functions in Singular Bayesian Models

Ce papier établit un cadre thermodynamique unifié pour les modèles bayésiens singuliers, démontrant que le tempérage du posterior génère des fonctions de réponse qui relient les invariants géométriques (comme le seuil log canonique réel) aux critères de sélection de modèles (WAIC, WBIC) et révèlent des comportements de transition de phase liés à la réorganisation structurelle de la géométrie du posterior.

Sean Plummer2026-03-06🔢 math

SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

Ce papier présente SurvHTE-Bench, le premier benchmark complet pour l'estimation des effets de traitement hétérogènes sur des données de survie censurées, offrant une suite de données synthétiques, semi-synthétiques et réelles permettant une évaluation rigoureuse et reproductible des méthodes causales dans ce domaine.

Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss + 1 more2026-03-06🤖 cs.AI

Reasoning Theater: Disentangling Model Beliefs from Chain-of-Thought

Cette étude révèle que les modèles de raisonnement peuvent manifester un « théâtre de raisonnement » performant, mais que le sondage des activations permet de détecter les véritables changements de croyance et d'arrêter la génération de tokens bien plus tôt, réduisant ainsi considérablement le coût computationnel sans sacrifier la précision.

Siddharth Boppana, Annabel Ma, Max Loeffler + 5 more2026-03-06🤖 cs.AI

Cheap Thrills: Effective Amortized Optimization Using Inexpensive Labels

Cette étude propose un cadre novateur en trois étapes combinant des étiquettes imparfaites peu coûteuses, un pré-entraînement supervisé et un affinage auto-supervisé pour optimiser efficacement la résolution de problèmes complexes, réduisant ainsi considérablement les coûts tout en améliorant la précision et la faisabilité des solutions.

Khai Nguyen, Petros Ellinas, Anvita Bhagavathula + 1 more2026-03-06🔢 math