cs.LG articles | Gist.Science

HealthMamba: An Uncertainty-aware Spatiotemporal Graph State Space Model for Effective and Reliable Healthcare Facility Visit Prediction

Ce papier présente HealthMamba, un cadre innovant basé sur un modèle d'espace d'états graphique spatiotemporel et conscient de l'incertitude, conçu pour prédire de manière précise et fiable les visites dans les établissements de santé en intégrant les dépendances spatiales et en quantifiant les incertitudes, surpassant ainsi les méthodes existantes sur plusieurs grands ensembles de données réels.

Dahai Yu, Lin Jiang, Rongchao Xu + 1 more2026-03-05🤖 cs.AI

Rewards as Labels: Revisiting RLVR from a Classification Perspective

Cet article propose REAL, un cadre novateur qui reformule l'apprentissage par renforcement avec récompenses vérifiables comme un problème de classification pour corriger les biais de gradient des méthodes existantes et améliorer significativement les performances des modèles de langage dans le raisonnement mathématique.

Zepeng Zhai, Meilin Chen, Jiaxuan Zhao + 3 more2026-03-05🤖 cs.LG

Stopping Computation for Converged Tokens in Masked Diffusion-LM Decoding

Le papier présente SureLock, une méthode qui accélère le décodage des modèles de diffusion masqués en verrouillant les positions de tokens convergées pour éviter les recalculs inutiles, réduisant ainsi la complexité computationnelle de 30 à 50 % sans compromettre la qualité de génération.

Daisuke Oba, Danushka Bollegala, Masahiro Kaneko + 1 more2026-03-05🤖 cs.LG

Learning-guided Kansa collocation for forward and inverse PDEs beyond linearity

Cet article propose une extension du solveur CNF aux équations aux dérivées partielles couplées et non linéaires pour résoudre des problèmes directs, inverses et de découverte d'équations, en combinant une analyse comparative des méthodes existantes, des techniques d'auto-ajustement et une évaluation sur des benchmarks.

Zheyuan Hu, Weitao Chen, Cengiz Öztireli + 2 more2026-03-05🤖 cs.AI

Universal Coefficients and Mayer-Vietoris Sequence for Groupoid Homology

Cet article établit la théorie de l'homologie des groupoïdes amples via le complexe de Moore à support compact, en démontrant une suite exacte courte universelle pour les coefficients discrets, en identifiant les obstructions pour les coefficients non discrets, et en construisant une suite exacte de Mayer-Vietoris pour les calculs explicites.

Luciano Melodia2026-03-05🤖 cs.LG

FastLSQ: A Framework for One-Shot PDE Solving

Le papier présente FastLSQ, un cadre de résolution rapide d'équations aux dérivées partielles (EDP) et de problèmes inverses basé sur des caractéristiques de Fourier aléatoires sinusoïdales, permettant une précision élevée et une exécution nettement plus rapide que les solveurs PINN itératifs grâce à des dérivées analytiques exactes et une absence de dépendance à la différenciation automatique.

Antonin Sulc2026-03-05🤖 cs.LG

First International StepUP Competition for Biometric Footstep Recognition: Methods, Results and Remaining Challenges

Ce papier présente la première compétition internationale sur la reconnaissance biométrique des pas, qui a mobilisé 23 équipes pour évaluer des modèles sur le vaste jeu de données UNB StepUP-P150, révélant des performances prometteuses tout en soulignant les défis persistants liés à la généralisation aux variations de chaussures.

Robyn Larracy, Eve MacDonald, Angkoon Phinyomark + 5 more2026-03-05🤖 cs.LG

It's TIME: Towards the Next Generation of Time Series Forecasting Benchmarks

Cet article présente TIME, un nouveau benchmark de prochaine génération conçu pour évaluer rigoureusement les modèles de fondation de séries temporelles en zéro-shot grâce à 50 nouveaux ensembles de données, un pipeline de construction intégrant l'humain pour garantir l'intégrité des données, et une perspective d'évaluation axée sur les motifs temporels plutôt que sur des étiquettes statiques.

Zhongzheng Qiao, Sheng Pan, Anni Wang + 7 more2026-03-05🤖 cs.LG

Chimera: Neuro-Symbolic Attention Primitives for Trustworthy Dataplane Intelligence

Le papier présente Chimera, un cadre neuro-symbolique qui intègre des primitives d'attention apprises et des contraintes symboliques dans les pipelines des commutateurs programmables pour permettre une analyse de trafic à haut débit, fiable et auditable tout en respectant les strictes contraintes matérielles.

Rong Fu, Xiaowen Ma, Kun Liu + 9 more2026-03-05🤖 cs.AI

JPmHC Dynamical Isometry via Orthogonal Hyper-Connections

Ce papier propose JPmHC, un cadre d'hyper-connexions qui préserve la dynamique isométrique en contraignant les mélangeurs linéaires sur des variétés orthogonales, offrant ainsi une stabilité d'entraînement et une efficacité mémoire supérieures aux méthodes existantes.

Biswa Sengupta, Jinhua Wang, Leo Brunswic2026-03-05🤖 cs.AI

DRESS: A Continuous Framework for Structural Graph Refinement

Le papier présente DRESS, un cadre déterministe et sans paramètre qui affine itérativement la similarité structurelle des arêtes d'un graphe pour générer une empreinte numérique isomorphe-invariante, dont la version étendue $\Delta$ -DRESS démontre une expressivité supérieure surpassant les tests de Weisfeiler-Leman sur des benchmarks complexes.

Eduar Castrillo Velilla2026-03-05🤖 cs.LG

FlowCorrect: Efficient Interactive Correction of Generative Flow Policies for Robotic Manipulation

FlowCorrect est une méthode d'apprentissage par imitation interactive et modulaire qui permet d'adapter en temps réel les politiques de manipulation robotique basées sur l'appariement de flux à l'aide de corrections humaines éparses, améliorant ainsi le taux de succès lors du déploiement sans nécessiter de réentraînement du modèle.

Edgar Welte, Yitian Shi, Rosa Wolf + 2 more2026-03-05🤖 cs.LG

Dynamic Adversarial Reinforcement Learning for Robust Multimodal Large Language Models

Cet article présente AOT-SFT, un jeu de données adversaire à grande échelle, et le cadre d'entraînement AOT (Adversarial Opponent Training), qui améliore la robustesse et réduit les hallucinations des modèles de langage multimodaux grâce à un processus d'apprentissage par auto-jeu où un attaquant génère dynamiquement des manipulations d'images pour entraîner un modèle défenseur.

Yicheng Bao, Xuhong Wang, Qiaosheng Zhang + 3 more2026-03-05🤖 cs.AI

Generative Recommendation for Large-Scale Advertising

Ce papier présente GR4AD, un système de recommandation générative de production conçu spécifiquement pour la publicité à grande échelle sur Kuaishou, qui intègre des innovations architecturales, d'apprentissage et de service pour améliorer les revenus publicitaires tout en garantissant un déploiement temps réel efficace.

Ben Xue, Dan Liu, Lixiang Wang + 26 more2026-03-05🤖 cs.LG

AMA-Bench: Evaluating Long-Horizon Memory for Agentic Applications

Cet article présente AMA-Bench, une nouvelle norme d'évaluation pour la mémoire à long terme des agents autonomes basée sur des trajectoires réelles et synthétiques, et propose AMA-Agent, un système de mémoire amélioré par un graphe de causalité et une récupération assistée par des outils qui surpasse significativement les méthodes existantes.

Yujie Zhao, Boqin Yuan, Junbo Huang + 9 more2026-03-05🤖 cs.AI

Causal Identification from Counterfactual Data: Completeness and Bounding Results

Cet article propose l'algorithme CTFIDU+ pour prouver la complétude de l'identification des requêtes contrefactuelles à partir de distributions de niveau 3 réalisables, établit les limites théoriques de l'inférence causale non paramétrique et dérive de nouvelles bornes analytiques pour les quantités non identifiables.

Arvind Raghavan, Elias Bareinboim2026-03-05🤖 cs.AI

CMI-RewardBench: Evaluating Music Reward Models with Compositional Multimodal Instruction

Ce papier présente CMI-RewardBench, un écosystème complet incluant des jeux de données, un benchmark et des modèles de récompense conçus pour évaluer et aligner les modèles de génération musicale sur des instructions multimodales composées.

Yinghao Ma, Haiwen Xia, Hewei Gao + 9 more2026-03-05🤖 cs.AI

Causal Circuit Tracing Reveals Distinct Computational Architectures in Single-Cell Foundation Models: Inhibitory Dominance, Biological Coherence, and Cross-Model Convergence

Cette étude introduit le traçage de circuits causaux pour révéler que les modèles de fondation biologiques, tels que Geneformer et scGPT, partagent des architectures computationnelles distinctes caractérisées par une dominance inhibitrice et une cohérence biologique, tout en identifiant des paires de domaines conservés validés par des expériences CRISPRi.

Ihor Kendiukhov2026-03-05🤖 cs.LG

From Variance to Invariance: Qualitative Content Analysis for Narrative Graph Annotation

Cet article présente un cadre d'annotation de graphes narratifs intégrant l'analyse qualitative de contenu pour améliorer la qualité des annotations, et évalue l'impact de différentes représentations et métriques sur l'accord inter-annotateurs via une expérience factorielle sur des récits d'inflation.

Junbo Huang, Max Weinig, Ulrich Fritsche + 1 more2026-03-05🤖 cs.AI

Rich Insights from Cheap Signals: Efficient Evaluations via Tensor Factorization

Cet article propose un modèle statistique novateur basé sur la factorisation tensorielle qui fusionne des données d'évaluation automatisées peu coûteuses avec un petit ensemble de labels humains pour permettre des évaluations fines et précises des modèles génératifs à l'échelle du prompt, tout en réduisant considérablement le besoin d'annotations humaines.

Felipe Maia Polo, Aida Nematzadeh, Virginia Aglietti + 2 more2026-03-05🤖 cs.AI

← Précédent Suivant →