AOI: Turning Failed Trajectories into Training Signals for Autonomous Cloud Diagnosis

L'article présente AOI, un cadre multi-agents entraînable qui transforme les trajectoires d'échec en signaux d'apprentissage pour l'automatisation du diagnostic cloud, en surmontant les contraintes de sécurité et de confidentialité des données grâce à une architecture d'exécution séparée et à l'optimisation GRPO, dépassant ainsi les performances de l'état de l'art sur le benchmark AIOpsLab.

Pei Yang, Wanyi Chen, Asuka Yuxi Zheng + 11 more2026-03-06💻 cs

stratum: A System Infrastructure for Massive Agent-Centric ML Workloads

Le papier présente Stratum, une infrastructure système unifiée conçue pour accélérer la recherche de pipelines ML par des agents autonomes en découplant l'exécution de la planification et en compilant des lots de pipelines pour une exécution optimisée sur des backends hétérogènes, notamment un nouveau runtime en Rust, permettant ainsi d'atteindre des gains de performance allant jusqu'à 16,6 fois par rapport aux écosystèmes Python traditionnels.

Arnab Phani, Elias Strauss, Sebastian Schelter2026-03-06💻 cs

Why Are Linear RNNs More Parallelizable?

Ce papier établit un lien fondamental entre la parallélisabilité des réseaux de neurones récurrents linéaires (LRNN) et les classes de complexité computationnelle, démontrant que leur structure permet une exécution efficace similaire aux transformateurs, contrairement aux RNN non linéaires qui, en raison de leur capacité à résoudre des problèmes P-complets, posent une barrière théorique à une telle parallélisation.

William Merrill, Hongjian Jiang, Yanhong Li + 2 more2026-03-06💻 cs

DMD-augmented Unpaired Neural Schrödinger Bridge for Ultra-Low Field MRI Enhancement

Les auteurs proposent un cadre de traduction non apparié basé sur le pont de Schrödinger neuronal, enrichi par une correspondance de distribution guidée par diffusion et une régularisation de préservation anatomique, pour améliorer la qualité et le réalisme des images IRM cérébrales à très bas champ (64 mT) en les rapprochant de celles à 3 T.

Youngmin Kim, Jaeyun Shin, Jeongchan Kim + 5 more2026-03-06💻 cs

LoRA-MME: Multi-Model Ensemble of LoRA-Tuned Encoders for Code Comment Classification

Dans le cadre de la compétition NLBSE'26, l'outil LoRA-MME propose un ensemble de quatre encodeurs transformateurs adaptés via LoRA pour la classification multi-label de commentaires de code, obtenant de solides performances sémantiques mais révélant un compromis défavorable entre précision et efficacité d'inférence dû à son coût computationnel élevé.

Md Akib Haider, Ahsan Bulbul, Nafis Fuad Shahid + 2 more2026-03-06💻 cs

Machine Learning for Complex Systems Dynamics: Detecting Bifurcations in Dynamical Systems with Deep Neural Networks

Cette étude propose une nouvelle approche basée sur les réseaux de neurones profonds, nommée EINNs, qui inverse le processus traditionnel en utilisant les états d'équilibre pour inférer les paramètres du système, permettant ainsi de détecter efficacement les seuils critiques et les bifurcations dans les systèmes dynamiques complexes.

Swadesh Pal, Roderick Melnik2026-03-06🔢 math

FedEMA-Distill: Exponential Moving Average Guided Knowledge Distillation for Robust Federated Learning

L'article propose FedEMA-Distill, une méthode de distillation de connaissances guidée par une moyenne mobile exponentielle qui améliore la robustesse et l'efficacité des communications de l'apprentissage fédéré face aux données hétérogènes et aux attaques malveillantes en n'exigeant que l'envoi de logits compressés depuis les clients.

Hamza Reguieg, Mohamed El Kamili, Essaid Sabir2026-03-06💻 cs

Data-Driven Optimization of Multi-Generational Cellular Networks: A Performance Classification Framework for Strategic Infrastructure Management

En analysant un jeu de données OpenCelliD de 1 818 antennes cellulaires, cette étude propose un cadre de classification des performances pour optimiser la gestion stratégique des réseaux multi-générations, identifier les zones de congestion et guider les investissements en infrastructure LTE, notamment au Pakistan.

Maryam Sabahat, M. Umar Khan2026-03-06💻 cs

Delta-Crosscoder: Robust Crosscoder Model Diffing in Narrow Fine-Tuning Regimes

Le papier présente Delta-Crosscoder, une méthode améliorée de diffage de modèles qui surpasse les approches existantes pour isoler et atténuer les changements de comportement localisés dans des régimes d'affinage étroits en combinant la parcimonie BatchTopK avec une fonction de perte basée sur les deltas et un signal contrastif implicite.

Aly Kassem, Thomas Jiralerspong, Negar Rostamzadeh + 1 more2026-03-06💻 cs

Flowers: A Warp Drive for Neural PDE Solvers

Le papier présente Flowers, une architecture neuronale innovante pour la résolution d'équations aux dérivées partielles (EDP) qui, en se basant exclusivement sur des opérations de déformation (warps) multi-têtes sans attention ni convolution, atteint des performances supérieures aux modèles existants tout en garantissant une complexité linéaire et une efficacité computationnelle accrue.

Till Muser, Alexandra Spitzer, Matti Lassas + 2 more2026-03-06💻 cs