HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

Le papier propose HyWA, une méthode de détection d'activité vocale personnalisée qui utilise un hyper-réseau pour générer des poids adaptés à un locuteur cible, surpassant les techniques existantes en améliorant la précision moyenne et en facilitant le déploiement grâce à une architecture VAD réutilisable.

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Reveal-to-Revise: Explainable Bias-Aware Generative Modeling with Multimodal Attention

Ce papier présente un cadre génératif explicable et conscient des biais qui intègre une fusion d'attention multimodale, l'attribution Grad-CAM++ et une boucle de rétroaction « Révéler pour Réviser », démontrant des performances supérieures et une robustesse accrue sur des benchmarks d'images et de texte pour des applications d'IA à haut risque.

Noor Islam S. Mohammad, Md Muntaqim Meherab2026-03-12🤖 cs.LG

Predicting kernel regression learning curves from only raw data statistics

Cet article propose un cadre théorique nommé « Hermite eigenstructure ansatz » (HEA) qui permet de prédire les courbes d'apprentissage de la régression à noyau sur des jeux de données réels en se basant uniquement sur la matrice de covariance empirique et une décomposition polynomiale de la fonction cible, en démontrant que les données d'images réelles sont suffisamment « gaussiennes » pour que cette approximation soit valide.

Dhruva Karkada, Joseph Turnbull, Yuxi Liu, James B. Simon2026-03-12🤖 cs.LG

Resource Allocation in Hybrid Radio-Optical IoT Networks using GNN with Multi-task Learning

Cet article propose le cadre DGET, une architecture d'apprentissage multi-tâches combinant des réseaux de neurones graphiques et des transformateurs, pour optimiser l'allocation des ressources dans les réseaux IoT hybrides radio-optiques en maximisant le débit et en réduisant l'âge de l'information tout en gérant les contraintes énergétiques et l'observabilité partielle des canaux.

Aymen Hamrouni, Sofie Pollin, Hazem Sallouha2026-03-12🤖 cs.LG

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Cet article présente un cadre d'oubli sélectif hiérarchique à double stratégie qui, en combinant des mises à jour de gradient géométriquement contraintes et des interventions au niveau des tokens, permet d'effacer efficacement des connaissances médicales spécifiques tout en préservant les compétences fondamentales et la confidentialité des données sensibles.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

Le papier présente CostNav, le premier benchmark ancré dans la physique qui évalue la viabilité économique des agents d'IA physiques en intégrant des données financières et réglementaires réelles, révélant ainsi que les méthodes actuelles de navigation, bien que performantes sur des tâches simplifiées, génèrent toutes des pertes économiques dans des scénarios commerciaux complexes.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

A scalable and real-time neural decoder for topological quantum codes

Le papier présente AlphaQubit 2, un décodeur neuronal scalable et temps réel capable de corriger les erreurs des codes de surface et de couleur avec une précision quasi optimale et une vitesse supérieure à celle des méthodes existantes, ouvrant ainsi la voie à l'informatique quantique tolérante aux pannes.

Andrew W. Senior, Thomas Edlich, Francisco J. H. Heras, Lei M. Zhang, Oscar Higgott, James S. Spencer, Taylor Applebaum, Sam Blackwell, Justin Ledford, Akvil\.e Žemgulyt\.e, Augustin Žídek, Noah Shutty, Andrew Cowie, Yin Li, George Holland, Peter Brooks, Charlie Beattie, Michael Newman, Alex Davies, Cody Jones, Sergio Boixo, Hartmut Neven, Pushmeet Kohli, Johannes Bausch2026-03-12⚛️ quant-ph

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

Le framework Trio propose une approche de découverte moléculaire en boucle fermée intégrant la modélisation linguistique, l'apprentissage par renforcement et la recherche arborescente pour générer des ligands ciblés à la fois valides, synthétisables et dotés d'une affinité de liaison améliorée, surpassant ainsi les méthodes de l'état de l'art.

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu2026-03-12🤖 cs.AI

PvP: Data-Efficient Humanoid Robot Learning with Proprioceptive-Privileged Contrastive Representations

Ce papier présente PvP, un cadre d'apprentissage contrastif exploitant les états proprioceptifs et privilégiés pour améliorer l'efficacité des échantillons dans le contrôle de robots humanoïdes, et introduit SRL4Humanoid, un cadre unifié pour l'évaluation systématique des méthodes d'apprentissage de représentations d'état.

Mingqi Yuan, Tao Yu, Haolin Song, Bo Li, Xin Jin, Hua Chen, Wenjun Zeng2026-03-12🤖 cs.LG