On the Necessity of Learnable Sheaf Laplacians

Cet article remet en question la nécessité d'apprendre les applications de restriction dans les réseaux de neurones sur faisceaux en démontrant qu'une version simplifiée avec des applications fixes à l'identité atteint des performances comparables sur des graphes hétérophiles, suggérant ainsi que la complexité supplémentaire n'est pas justifiée par une réduction empirique du lissage excessif.

Ferran Hernandez Caralt, Mar Gonzàlez i CatalÃ, Adrián Bazaga + 1 more2026-03-06🤖 cs.LG

MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis

Le papier présente MobileFetalCLIP, une méthode de distillation de connaissances répulsive sélective qui permet à un modèle étudiant léger de surpasser un modèle enseignant massif dans l'analyse d'échographies fœtales, rendant ainsi possible un déploiement en temps réel sur des appareils mobiles à ressources limitées.

Numan Saeed, Fadillah Adamsyah Maani, Mohammad Yaqub2026-03-06🤖 cs.AI

Ensembling Language Models with Sequential Monte Carlo

Cet article propose un cadre unifié pour l'assemblage de modèles de langage via des distributions ff-ensembles, en utilisant un algorithme de Monte Carlo séquentiel au niveau des octets pour surmonter les défis de la normalisation locale et des vocabulaires incompatibles, permettant ainsi d'obtenir de meilleures performances de génération que les méthodes d'agrégation traditionnelles.

Robin Shing Moon Chan, Tianyu Liu, Samuel Kiegeland + 5 more2026-03-06🤖 cs.AI

Kraus Constrained Sequence Learning For Quantum Trajectories from Continuous Measurement

Cet article propose une méthode d'apprentissage de séquences quantiques utilisant une couche de sortie structurée en opérateurs de Kraus pour garantir des mises à jour d'états physiquement valides et améliorer la précision de l'estimation des trajectoires quantiques en régime non stationnaire, surpassant les modèles non contraints grâce à une architecture basée sur le LSTM.

Priyanshi Singh, Krishna Bhatia2026-03-06🤖 cs.LG

Thermodynamic Response Functions in Singular Bayesian Models

Ce papier établit un cadre thermodynamique unifié pour les modèles bayésiens singuliers, démontrant que le tempérage du posterior génère des fonctions de réponse qui relient les invariants géométriques (comme le seuil log canonique réel) aux critères de sélection de modèles (WAIC, WBIC) et révèlent des comportements de transition de phase liés à la réorganisation structurelle de la géométrie du posterior.

Sean Plummer2026-03-06🔢 math

SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

Ce papier présente SurvHTE-Bench, le premier benchmark complet pour l'estimation des effets de traitement hétérogènes sur des données de survie censurées, offrant une suite de données synthétiques, semi-synthétiques et réelles permettant une évaluation rigoureuse et reproductible des méthodes causales dans ce domaine.

Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss + 1 more2026-03-06🤖 cs.AI

Reasoning Theater: Disentangling Model Beliefs from Chain-of-Thought

Cette étude révèle que les modèles de raisonnement peuvent manifester un « théâtre de raisonnement » performant, mais que le sondage des activations permet de détecter les véritables changements de croyance et d'arrêter la génération de tokens bien plus tôt, réduisant ainsi considérablement le coût computationnel sans sacrifier la précision.

Siddharth Boppana, Annabel Ma, Max Loeffler + 5 more2026-03-06🤖 cs.AI

Cheap Thrills: Effective Amortized Optimization Using Inexpensive Labels

Cette étude propose un cadre novateur en trois étapes combinant des étiquettes imparfaites peu coûteuses, un pré-entraînement supervisé et un affinage auto-supervisé pour optimiser efficacement la résolution de problèmes complexes, réduisant ainsi considérablement les coûts tout en améliorant la précision et la faisabilité des solutions.

Khai Nguyen, Petros Ellinas, Anvita Bhagavathula + 1 more2026-03-06🔢 math