Dynamic Deep-Reinforcement-Learning Algorithm in Partially Observable Markov Decision Processes

Cette étude propose trois nouvelles architectures d'apprentissage par renforcement profond pour les processus de décision markoviens partiellement observables, démontrant que l'intégration des trajectoires d'actions dans les réseaux LSTM et l'utilisation d'états cachés pour entraîner le critique (comme dans l'algorithme H-TD3) améliorent à la fois la performance et l'efficacité computationnelle.

Saki Omi, Hyo-Sang Shin, Namhoon Cho + 1 more2026-03-04🤖 cs.LG

Predictive Authoring for Brazilian Portuguese Augmentative and Alternative Communication

Cette étude propose l'utilisation de BERTimbau pour prédire des pictogrammes dans les systèmes de communication alternative et augmentée pour le portugais brésilien, démontrant que la représentation des pictogrammes par leurs légendes, synonymes ou définitions offre des performances comparables, avec une précision optimale obtenue via les légendes.

Jayr Pereira, Rodrigo Nogueira, Cleber Zanchettin + 1 more2026-03-04🤖 cs.AI

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

Cette étude présente une méthode d'estimation de la proportion de textes modifiés par des modèles de langage dans les relectures de conférences d'IA, révélant que 6,5 % à 16,9 % de ces relectures (ICLR 2024, NeurIPS 2023, CoRL 2023, EMNLP 2023) auraient été substantiellement altérées par l'IA, avec une corrélation observée entre l'usage de ces outils et des facteurs tels que la faible confiance, la proximité des délais et la réticence à répondre aux répliques des auteurs.

Weixin Liang, Zachary Izzo, Yaohui Zhang + 9 more2026-03-04🤖 cs.AI

Learning Lagrangian Interaction Dynamics with Sampling-Based Model Order Reduction

Le papier présente GIOROM, un cadre de réduction d'ordre basé sur l'échantillonnage qui apprend la dynamique des interactions lagrangiennes directement dans l'espace physique via des opérateurs neuronaux et un noyau paramétrable, permettant ainsi de simuler efficacement des systèmes complexes comme les fluides et les milieux granulaires avec une réduction significative de la dimensionnalité tout en conservant une haute fidélité.

Hrishikesh Viswanath, Yue Chang, Aleksey Panas + 3 more2026-03-04🤖 cs.LG

Quantifying User Coherence: A Unified Framework for Analyzing Recommender Systems Across Domains

Cet article propose un cadre unifié basé sur des mesures informationnelles de la surprise moyenne et de la surprise conditionnelle moyenne pour quantifier la cohérence des utilisateurs, démontrant ainsi que la performance des systèmes de recommandation dépend fortement de cette cohérence et permettant une évaluation stratifiée ainsi qu'une conception ciblée de modèles plus efficaces.

Michaël Soumm, Alexandre Fournier-Montgieux, Adrian Popescu + 1 more2026-03-04🤖 cs.LG

Covering Numbers for Deep ReLU Networks with Applications to Function Approximation and Nonparametric Regression

Cet article comble une lacune dans la littérature en établissant des bornes supérieures et inférieures serrées pour les nombres de couverture des réseaux de neurones ReLU profonds, permettant ainsi de mieux comprendre l'impact de l'élagage et de la quantification, d'éliminer un facteur logarithmique superflu dans la complexité d'échantillonnage pour la régression non paramétrique, et d'unifier les résultats sur l'approximation fonctionnelle et l'estimation statistique.

Weigutian Ou, Helmut Bölcskei2026-03-04📊 stat

Prediction of Multiscale Features Using Deep Learning-based Preconditioner-Solver Architecture for Darcy Equation in High-Contrast Media

Cet article présente le FP-HMsNet, une architecture de réseau neuronal hiérarchique combinant des opérateurs de Fourier et des réseaux multi-échelles pour prédire avec une grande précision et une efficacité computationnelle supérieure les écoulements de fluides dans des milieux poreux hétérogènes à fort contraste.

Jie Chen, Peiqi Li, Zhengkang He + 1 more2026-03-04🤖 cs.LG