HealthMamba: An Uncertainty-aware Spatiotemporal Graph State Space Model for Effective and Reliable Healthcare Facility Visit Prediction

Ce papier présente HealthMamba, un cadre innovant basé sur un modèle d'espace d'états graphique spatiotemporel et conscient de l'incertitude, conçu pour prédire de manière précise et fiable les visites dans les établissements de santé en intégrant les dépendances spatiales et en quantifiant les incertitudes, surpassant ainsi les méthodes existantes sur plusieurs grands ensembles de données réels.

Dahai Yu, Lin Jiang, Rongchao Xu + 1 more2026-03-05🤖 cs.AI

First International StepUP Competition for Biometric Footstep Recognition: Methods, Results and Remaining Challenges

Ce papier présente la première compétition internationale sur la reconnaissance biométrique des pas, qui a mobilisé 23 équipes pour évaluer des modèles sur le vaste jeu de données UNB StepUP-P150, révélant des performances prometteuses tout en soulignant les défis persistants liés à la généralisation aux variations de chaussures.

Robyn Larracy, Eve MacDonald, Angkoon Phinyomark + 5 more2026-03-05🤖 cs.LG

It's TIME: Towards the Next Generation of Time Series Forecasting Benchmarks

Cet article présente TIME, un nouveau benchmark de prochaine génération conçu pour évaluer rigoureusement les modèles de fondation de séries temporelles en zéro-shot grâce à 50 nouveaux ensembles de données, un pipeline de construction intégrant l'humain pour garantir l'intégrité des données, et une perspective d'évaluation axée sur les motifs temporels plutôt que sur des étiquettes statiques.

Zhongzheng Qiao, Sheng Pan, Anni Wang + 7 more2026-03-05🤖 cs.LG

FlowCorrect: Efficient Interactive Correction of Generative Flow Policies for Robotic Manipulation

FlowCorrect est une méthode d'apprentissage par imitation interactive et modulaire qui permet d'adapter en temps réel les politiques de manipulation robotique basées sur l'appariement de flux à l'aide de corrections humaines éparses, améliorant ainsi le taux de succès lors du déploiement sans nécessiter de réentraînement du modèle.

Edgar Welte, Yitian Shi, Rosa Wolf + 2 more2026-03-05🤖 cs.LG

Dynamic Adversarial Reinforcement Learning for Robust Multimodal Large Language Models

Cet article présente AOT-SFT, un jeu de données adversaire à grande échelle, et le cadre d'entraînement AOT (Adversarial Opponent Training), qui améliore la robustesse et réduit les hallucinations des modèles de langage multimodaux grâce à un processus d'apprentissage par auto-jeu où un attaquant génère dynamiquement des manipulations d'images pour entraîner un modèle défenseur.

Yicheng Bao, Xuhong Wang, Qiaosheng Zhang + 3 more2026-03-05🤖 cs.AI

Causal Circuit Tracing Reveals Distinct Computational Architectures in Single-Cell Foundation Models: Inhibitory Dominance, Biological Coherence, and Cross-Model Convergence

Cette étude introduit le traçage de circuits causaux pour révéler que les modèles de fondation biologiques, tels que Geneformer et scGPT, partagent des architectures computationnelles distinctes caractérisées par une dominance inhibitrice et une cohérence biologique, tout en identifiant des paires de domaines conservés validés par des expériences CRISPRi.

Ihor Kendiukhov2026-03-05🤖 cs.LG

Rich Insights from Cheap Signals: Efficient Evaluations via Tensor Factorization

Cet article propose un modèle statistique novateur basé sur la factorisation tensorielle qui fusionne des données d'évaluation automatisées peu coûteuses avec un petit ensemble de labels humains pour permettre des évaluations fines et précises des modèles génératifs à l'échelle du prompt, tout en réduisant considérablement le besoin d'annotations humaines.

Felipe Maia Polo, Aida Nematzadeh, Virginia Aglietti + 2 more2026-03-05🤖 cs.AI