Towards Improved Sentence Representations using Token Graphs

Ce papier présente GLOT, un module d'agrégation léger et structurellement conscient qui améliore les représentations de phrases en modélisant les relations entre les tokens via un graphe latent, surpassant ainsi les méthodes de pooling standard en robustesse et en efficacité tout en nécessitant beaucoup moins de paramètres ajustables.

Krishna Sri Ipsit Mantri, Carola-Bibiane Schönlieb, Zorah Lähner + 1 more2026-03-05🤖 cs.LG

Surprisal-Rényi Free Energy

Cet article introduit l'Énergie Libre de Surprisal-Rényi (SRFE), une fonctionnelle log-momentielle qui généralise les divergences de Kullback-Leibler en révélant un compromis explicite entre moyenne et variance, tout en offrant une caractérisation variationnelle de type Gibbs et une interprétation précise en termes de Longueur Minimale de Description pour contrôler les déviations extrêmes.

Shion Matsumoto, Raul Castillo, Benjamin Prada + 1 more2026-03-05🤖 cs.LG

Scalable Contrastive Causal Discovery under Unknown Soft Interventions

Cet article propose un modèle d'apprentissage causal évolutif et contrastif capable de découvrir des structures causales sous forme de PDAG maximales à partir de régimes observationnels et interventionnels appariés avec des interventions douces inconnues, garantissant une récupération théorique et une généralisation supérieures aux méthodes existantes.

Mingxuan Zhang, Khushi Desai, Sopho Kevlishvili + 1 more2026-03-05🤖 cs.LG

[Re] FairDICE: A Gap Between Theory And Practice

Cette étude de réplication révèle que bien que FairDICE soit théoriquement prometteur pour l'apprentissage par renforcement hors ligne multi-objectifs, une erreur de code et un manque de spécification des hyperparamètres ont initialement réduit son efficacité à un simple apprentissage par imitation, nécessitant des corrections et des ajustements pour valider son potentiel dans des environnements complexes.

Peter Adema, Karim Galliamov, Aleksey Evstratovskiy + 1 more2026-03-05🤖 cs.LG

When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning

Cette étude révèle que les modèles de raisonnement mathématique d'état de l'art, bien que performants en termes de précision, souffrent d'instabilités computationnelles fondamentales et de « silences » d'échec, démontrant ainsi que les métriques d'accuracy actuelles masquent une fiabilité insuffisante et nécessitent une réforme de l'évaluation.

Subramanyam Sahoo, Aman Chadha, Vinija Jain + 1 more2026-03-05🤖 cs.AI

Optimal trajectory-guided stochastic co-optimization for e-fuel system design and real-time operation

Cet article présente MasCOR, un cadre d'optimisation conjointe assisté par l'apprentissage automatique qui permet de concevoir et d'opérer efficacement des systèmes de production de carburants e-fuels sous incertitude, en identifiant des stratégies de dimensionnement et de gestion spécifiques à chaque site pour atteindre la neutralité carbone à un coût compétitif.

Jeongdong Kim, Minsu Kim, Jonggeol Na + 1 more2026-03-05🤖 cs.AI

When Small Variations Become Big Failures: Reliability Challenges in Compute-in-Memory Neural Accelerators

Cette présentation examine les défis de fiabilité des accélérateurs neuronaux à calcul en mémoire, en démontrant comment de petites variations des dispositifs peuvent entraîner des échecs critiques, et propose des solutions de conception croisée, notamment un mécanisme de vérification sélective et une méthode d'entraînement robuste, pour garantir un déploiement fiable dans des applications critiques.

Yifan Qin, Jiahao Zheng, Zheyu Yan + 3 more2026-03-05🤖 cs.LG

Quantifying Ranking Instability Across Evaluation Protocol Axes in Gene Regulatory Network Benchmarking

Cette étude propose un cadre diagnostique pour quantifier l'instabilité des classements dans l'évaluation des réseaux de régulation génique, révélant que les inversions de rangs entre méthodes sont principalement dues à des variations de leur pouvoir discriminant plutôt qu'à des effets de taux de base, et soulignant ainsi la nécessité de pratiques de rapport plus robustes.

Ihor Kendiukhov2026-03-05🤖 cs.LG

Geographically-Weighted Weakly Supervised Bayesian High-Resolution Transformer for 200m Resolution Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data

Cette étude propose une approche novatrice de Transformer bayésien à haute résolution, combinant des modules locaux et globaux, une fonction de perte faiblement supervisée pondérée géographiquement et une fusion de données multi-sources (Sentinel-1, RCM, AMSR2) pour produire des cartes de concentration de la glace de mer à l'échelle pan-arctique à 200 mètres avec une estimation fiable des incertitudes.

Mabel Heffring, Lincoln Linlin Xu2026-03-05🤖 cs.LG