cs.LG articles | Gist.Science

Weight Updates as Activation Shifts: A Principled Framework for Steering

Ce papier propose un cadre théorique établissant l'équivalence entre les mises à jour de poids et les décalages d'activation, permettant de concevoir une méthode de « post-block steering » qui atteint des performances proches du réglage fin complet avec une fraction infime de paramètres, tout en surpassant les méthodes d'adaptation existantes grâce à une approche d'adaptation conjointe.

Dyah Adila, John Cooper, Alexander Yun, Avi Trost, Frederic Sala2026-03-09🤖 cs.LG

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

Cet article propose une décomposition fonctionnelle en anneau de tenseurs reparamétrée, utilisant des représentations neuronales implicites et une analyse fréquentielle pour améliorer la récupération de données multidimensionnelles continues, surpassant ainsi les méthodes existantes dans des tâches telles que l'inpainting et la super-résolution.

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

LMU-Based Sequential Learning and Posterior Ensemble Fusion for Cross-Domain Infant Cry Classification

Cet article propose un cadre acoustique compact combinant un encodeur CNN multi-branches, une unité de mémoire Legendre (LMU) pour la modélisation temporelle efficace et une fusion d'ensemble postérieure calibrée, afin d'améliorer la classification des cris de nourrissons dans des scénarios inter-domaines malgré les défis liés aux signaux non stationnaires et aux décalages de distribution.

Niloofar Jazaeri, Hilmi R. Dajani, Marco Janeczek, Martin Bouchard2026-03-09🤖 cs.LG

Whisper-RIR-Mega: A Paired Clean-Reverberant Speech Benchmark for ASR Robustness to Room Acoustics

Ce papier présente Whisper-RIR-Mega, un nouveau jeu de données apparié de parole propre et réverbérée basé sur LibriSpeech et le corpus RIR-Mega, conçu pour évaluer et améliorer la robustesse des modèles de reconnaissance automatique de la parole face aux acoustiques de salle.

Mandip Goswami2026-03-09🤖 cs.AI

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

Le papier présente RigidSSL, un cadre d'apprentissage auto-supervisé géométrique qui améliore la conception de protéines et la modélisation des ensembles conformationnels en apprenant des priorités géométriques rigides via des perturbations simulées et des trajectoires de dynamique moléculaire, surpassant ainsi les méthodes existantes en termes de capacité de conception, de diversité et de réalisme biophysique.

Zhanghan Ni, Yanjing Li, Zeju Qiu, Bernhard Schölkopf, Hongyu Guo, Weiyang Liu, Shengchao Liu2026-03-09🤖 cs.AI

mlx-vis: GPU-Accelerated Dimensionality Reduction and Visualization on Apple Silicon

Le papier présente mlx-vis, une bibliothèque Python open source exploitant l'accélération GPU d'Apple Silicon via MLX pour exécuter efficacement six méthodes de réduction de dimensionnalité et un rendu visuel animé sans dépendre de Matplotlib.

Han Xiao2026-03-09🤖 cs.LG

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Ce papier propose Traversal-as-Policy, une méthode qui transforme les logs d'exécution OpenHands en arbres de comportement à portes (GBT) exécutables pour remplacer la génération de politique implicite par une navigation contrôlée et vérifiable, améliorant ainsi considérablement le taux de réussite, la sécurité et l'efficacité des agents LLM sur des tâches complexes.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

Information-Theoretic Privacy Control for Sequential Multi-Agent LLM Systems

Cet article propose un cadre d'entraînement régularisé pour contrôler la fuite d'information compositionnelle dans les systèmes séquentiels multi-agents LLM, démontrant que la confidentialité doit être traitée comme une propriété systémique plutôt que locale.

Sadia Asif, Mohammad Mohammadi Amiri2026-03-09🤖 cs.LG

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

Le papier présente RoboLayout, une extension de LayoutVLM qui intègre des contraintes de reachabilité dans un processus d'optimisation différentiable pour générer des scènes 3D sémantiquement cohérentes et physiquement réalisables par divers agents incarnés.

Ali Shamsaddinlou2026-03-09🤖 cs.AI

Clinical-Injection Transformer with Domain-Adapted MAE for Lupus Nephritis Prognosis Prediction

Cet article propose un cadre multimodal innovant combinant un Transformer à injection clinique et un auto-encodeur masqué adapté au domaine pour prédire avec une grande précision le pronostic de la néphropathie lupique pédiatrique à partir de biopsies standardisées et de données cliniques.

Yuewen Huang, Zhitao Ye, Guangnan Feng, Fudan Zheng, Xia Gao, Yutong Lu2026-03-09🤖 cs.LG

JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization

Cet article présente JAWS, une méthode de régularisation probabiliste adaptative spatialement qui améliore la stabilité à long terme et la fidélité des chocs des opérateurs neuronaux en modulant dynamiquement la contrainte de contraction selon la complexité physique locale, permettant ainsi une optimisation de trajectoire efficace en mémoire.

Fengxiang Nie, Yasuhiro Suzuki2026-03-09🤖 cs.AI

VDCook:DIY video data cook your MLLMs

VDCook est une plateforme auto-évolutive qui permet aux chercheurs de générer et de mettre à jour continuellement des ensembles de données vidéo spécialisés pour les modèles multimodaux via des requêtes en langage naturel, en combinant récupération de vidéos réelles et synthèse contrôlée.

Chengwei Wu2026-03-09🤖 cs.AI

Attention Meets Reachability: Structural Equivalence and Efficiency in Grammar-Constrained LLM Decoding

Cet article établit un cadre théorique unifié pour le décodage contraint par grammaire, démontrant que l'équivalence linguistique n'implique pas l'efficacité computationnelle et prouvant que la complexité structurelle inhérente à certaines grammaires impose des bornes inférieures incompressibles sur le coût de décodage, tout en fournissant des métriques d'optimisation et des garanties de distorsion pour les architectures de modèles de langage modernes.

Faruk Alpay, Bilge Senturk2026-03-09🤖 cs.LG

An intuitive rearranging of the Yates covariance decomposition for probabilistic verification of forecasts with the Brier score

Cet article propose une réorganisation algébrique intuitive de la décomposition de la covariance de Yates pour le score de Brier, décomposant l'erreur de prévision probabiliste en trois termes non négatifs qui rendent transparentes les conditions d'optimalité : l'adéquation de la variance, la corrélation parfaite et la calibration globale.

Bruno Hebling Vieira (Methods of Plasticity Research, Department of Psychology, University of Zurich, Zurich, Switzerland)2026-03-09🤖 cs.LG

IntSeqBERT: Learning Arithmetic Structure in OEIS via Modulo-Spectrum Embeddings

L'article présente IntSeqBERT, un modèle Transformer dual-stream qui encode les séquences d'entiers de l'OEIS via des embeddings de magnitude et de modulo, surpassant les approches par tokenisation grâce à une prédiction de termes suivante améliorée de sept fois et à une analyse prouvant que les moduli composites capturent plus efficacement la structure arithmétique.

Kazuhisa Nakasho2026-03-09🤖 cs.LG

Autocorrelation effects in a stochastic-process model for decision making via time series

Cette étude démontre qu'un modèle stochastique minimal explique comment l'autocorrélation négative ou positive d'un signal temporel améliore la prise de décision dans les problèmes de bandit à deux bras, selon que la somme des probabilités de gain est supérieure ou inférieure à un.

Tomoki Yamagami, Mikio Hasegawa, Takatomo Mihana, Ryoichi Horisaki, Atsushi Uchida2026-03-09🔬 physics.optics

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

Cette étude propose l'utilisation d'un autoencodeur de Koopman en temps continu comme modèle substitut léger et stable pour la prévision à long terme de l'état océanique, surpassant les modèles autoregressifs par une croissance d'erreur bornée et une inférence nettement plus rapide tout en préservant les statistiques énergétiques globales.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality

Ce papier propose un modèle théorique démontrant que l'IA générative, tout en homogénéisant les compétences individuelles, peut paradoxalement accroître les inégalités globales en concentrant la valeur économique sur des actifs complémentaires, créant ainsi deux régimes d'inégalité distincts selon la structure technologique et les institutions du marché du travail.

Xupeng Chen, Shuchen Meng2026-03-09🤖 cs.AI

Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment

Ce papier propose CDDS, un nouvel algorithme d'alignement cross-modal qui utilise un décodage contraint et un échantillonnage de distribution pour isoler les véritables sémantiques des informations modales, surpassant ainsi les méthodes de l'état de l'art de 6,6 % à 14,2 %.

Xiang Ma, Lexin Fang, Litian Xu, Caiming Zhang2026-03-09🤖 cs.LG

FuseDiff: Symmetry-Preserving Joint Diffusion for Dual-Target Structure-Based Drug Design

Le papier présente FuseDiff, un modèle de diffusion de bout en bout qui génère conjointement une molécule et ses deux poses de liaison spécifiques à des cibles distinctes en préservant les symétries et la cohérence topologique, permettant ainsi une conception de médicaments polypharmacologiques plus efficace.

Jianliang Wu, Anjie Qiao, Zhen Wang, Zhewei Wei, Sheng Chen2026-03-09🤖 cs.LG

← Précédent Suivant →