Regularized Online RLHF with Generalized Bilinear Preferences

Cet article propose une méthode d'apprentissage par renforcement à partir de préférences humaines en ligne régularisée, fondée sur un modèle de préférences bilinéaires généralisées, qui établit pour la première fois des garanties d'efficacité statistique en haute dimension avec des bornes de regret indépendantes de la dimension ou de la force de régularisation.

Junghyun Lee, Minju Hong, Kwang-Sung Jun + 2 more2026-03-06💻 cs

Lap2: Revisiting Laplace DP-SGD for High Dimensions via Majorization Theory

Ce papier présente Lap2, une nouvelle méthode qui permet d'utiliser le mécanisme de Laplace dans le DP-SGD pour les modèles de grande dimension en remplaçant le clipping L1 par un clipping L2 via la théorie de la majoration, améliorant ainsi considérablement les performances par rapport aux approches classiques.

Meisam Mohammady, Qin Yang, Nicholas Stout, Ayesha Samreen, Han Wang, Christopher J Quinn, Yuan Hong2026-03-06🔒 cs.CR

Inference-time optimization for experiment-grounded protein ensemble generation

Cet article présente un cadre d'optimisation au moment de l'inférence qui génère des ensembles protéiques conformes aux données expérimentales en optimisant les représentations latentes et en combinant des priors structurels et physiques, surpassant ainsi les méthodes actuelles tout en révélant une vulnérabilité des métriques de confiance des modèles génératifs.

Advaith Maddipatla, Anar Rzayev, Marco Pegoraro + 5 more2026-03-06💻 cs

DiffusionHarmonizer: Bridging Neural Reconstruction and Photorealistic Simulation with Online Diffusion Enhancer

Le papier présente DiffusionHarmonizer, un cadre d'amélioration générative en ligne qui transforme les rendus de scènes imparfaites issus de la reconstruction neuronale en sorties photoréalistes et temporellement cohérentes grâce à un amplificateur conditionné par le temps dérivé d'un modèle de diffusion préentraîné.

Yuxuan Zhang, Katarína Tóthová, Zian Wang + 7 more2026-03-06💻 cs

Fine-grained Soundscape Control for Augmented Hearing

Ce papier présente Aurchestra, le premier système permettant un contrôle fin et en temps réel des paysages sonores sur des appareils auditifs contraints, grâce à une interface dynamique et un réseau d'extraction multi-sorties qui génère des flux audio séparés pour jusqu'à cinq sources sonores simultanées afin de permettre un mélange personnalisé de l'environnement acoustique.

Seunghyun Oh, Malek Itani, Aseem Gauri + 1 more2026-03-06💻 cs

IoUCert: Robustness Verification for Anchor-based Object Detectors

Ce papier présente IoUCert, un cadre de vérification formelle innovant qui permet pour la première fois de garantir la robustesse de détecteurs d'objets ancrés réalistes, tels que SSD et YOLO, en contournant les limitations des relaxations non linéaires grâce à une transformation de coordonnées et une propagation de bornes par intervalles optimisée pour les métriques d'IoU.

Benedikt Brückner, Alejandro J. Mercado, Yanghao Zhang, Panagiotis Kouvaros, Alessio Lomuscio2026-03-06🔒 cs.CR

Inverse Reconstruction of Shock Time Series from Shock Response Spectrum Curves using Machine Learning

Cet article propose l'utilisation d'un auto-encodeur variationnel conditionnel (CVAE) pour reconstruire efficacement et avec une grande fidélité spectrale les séries temporelles d'accélération à partir de spectres de réponse au choc, surmontant ainsi les limitations des méthodes d'optimisation itérative traditionnelles en termes de coût computationnel et de flexibilité.

Adam Watts, Andrew Jeon, Destry Newton + 1 more2026-03-06💻 cs

AOI: Turning Failed Trajectories into Training Signals for Autonomous Cloud Diagnosis

L'article présente AOI, un cadre multi-agents entraînable qui transforme les trajectoires d'échec en signaux d'apprentissage pour l'automatisation du diagnostic cloud, en surmontant les contraintes de sécurité et de confidentialité des données grâce à une architecture d'exécution séparée et à l'optimisation GRPO, dépassant ainsi les performances de l'état de l'art sur le benchmark AIOpsLab.

Pei Yang, Wanyi Chen, Asuka Yuxi Zheng + 11 more2026-03-06💻 cs

stratum: A System Infrastructure for Massive Agent-Centric ML Workloads

Le papier présente Stratum, une infrastructure système unifiée conçue pour accélérer la recherche de pipelines ML par des agents autonomes en découplant l'exécution de la planification et en compilant des lots de pipelines pour une exécution optimisée sur des backends hétérogènes, notamment un nouveau runtime en Rust, permettant ainsi d'atteindre des gains de performance allant jusqu'à 16,6 fois par rapport aux écosystèmes Python traditionnels.

Arnab Phani, Elias Strauss, Sebastian Schelter2026-03-06💻 cs

Why Are Linear RNNs More Parallelizable?

Ce papier établit un lien fondamental entre la parallélisabilité des réseaux de neurones récurrents linéaires (LRNN) et les classes de complexité computationnelle, démontrant que leur structure permet une exécution efficace similaire aux transformateurs, contrairement aux RNN non linéaires qui, en raison de leur capacité à résoudre des problèmes P-complets, posent une barrière théorique à une telle parallélisation.

William Merrill, Hongjian Jiang, Yanhong Li + 2 more2026-03-06💻 cs

DMD-augmented Unpaired Neural Schrödinger Bridge for Ultra-Low Field MRI Enhancement

Les auteurs proposent un cadre de traduction non apparié basé sur le pont de Schrödinger neuronal, enrichi par une correspondance de distribution guidée par diffusion et une régularisation de préservation anatomique, pour améliorer la qualité et le réalisme des images IRM cérébrales à très bas champ (64 mT) en les rapprochant de celles à 3 T.

Youngmin Kim, Jaeyun Shin, Jeongchan Kim + 5 more2026-03-06💻 cs