cs.LG articles | Gist.Science

QuantVLA: Scale-Calibrated Post-Training Quantization for Vision-Language-Action Models

Le papier présente QuantVLA, une méthode de quantification post-entraînement sans réapprentissage qui permet de déployer efficacement des modèles vision-langage-action sur des dispositifs contraints en réduisant la mémoire de 70 % tout en surpassant les performances des modèles en précision complète.

Jingxuan Zhang, Yunta Hsieh, Zhongwei Wan + 5 more2026-03-03🤖 cs.LG

Sparse Bayesian Deep Functional Learning with Structured Region Selection

Cet article propose le sBayFDNN, un modèle d'apprentissage profond bayésien parcimonieux qui combine la capacité d'approximation non linéaire des réseaux de neurones avec une sélection de régions structurée et interprétable, tout en établissant les premières garanties théoriques de consistance pour ce type de modèle fonctionnel.

Xiaoxian Zhu, Yingmeng Li, Shuangge Ma + 1 more2026-03-03📊 stat

Learning Quantum Data Distribution via Chaotic Quantum Diffusion Model

Cet article propose un modèle de diffusion quantique chaotique qui utilise l'évolution temporelle sous un Hamiltonien chaotique pour apprendre efficacement des distributions de données quantiques sur du matériel analogique, en surmontant les limitations de coût et de sensibilité des modèles de diffusion quantique traditionnels basés sur des circuits.

Quoc Hoan Tran, Koki Chinzei, Yasuhiro Endo + 1 more2026-03-03🌀 nlin

Support Tokens, Stability Margins, and a New Foundation for Robust LLMs

En réinterprétant les transformers dans un cadre probabiliste, cet article révèle l'existence de « tokens de support » et de marges de stabilité, conduisant à une méthode d'entraînement bayésienne simple qui améliore la robustesse des LLM grâce à une pénalité de barrière logarithmique.

Deepak Agarwal, Dhyey Dharmendrakumar Mavani, Suyash Gupta + 2 more2026-03-03📊 stat

BrepCoder: A Unified Multimodal Large Language Model for Multi-task B-rep Reasoning

Le papier présente BrepCoder, un modèle de langage multimodal unifié qui traite les représentations de limites (B-rep) comme du code pour effectuer diverses tâches de conception assistée par ordinateur grâce à une stratégie d'entraînement en deux étapes.

Mingi Kim, Yongjun Kim, Jungwoo Kang + 1 more2026-03-03🤖 cs.LG

OmniZip: Learning a Unified and Lightweight Lossless Compressor for Multi-Modal Data

Le papier présente OmniZip, un compresseur sans perte unifié et léger capable de traiter divers types de données multimodales grâce à une architecture innovante, surpassant les méthodes existantes tout en permettant une inférence en temps réel sur des appareils à ressources limitées.

Yan Zhao, Zhengxue Cheng, Junxuan Zhang + 4 more2026-03-03🔢 math

Predicting Multi-Drug Resistance in Bacterial Isolates Through Performance Comparison and LIME-based Interpretation of Classification Models

Cette étude propose un cadre d'apprentissage automatique interprétable, utilisant des modèles de type LightGBM et XGBoost couplés à la méthode LIME, pour prédire avec précision la résistance multi-médicamenteuse chez les isolats bactériens et identifier les antibiotiques déterminants afin d'améliorer la prise de décision clinique.

Santanam Wishal, Riad Sahara2026-03-03🤖 cs.LG

From Bias to Balance: Fairness-Aware Paper Recommendation for Equitable Peer Review

En introduisant Fair-PaperRec, un modèle de recommandation de papiers intégrant une régularisation équitable, cette étude démontre qu'il est possible d'augmenter significativement la participation des groupes sous-représentés dans le processus de révision par les pairs sans compromettre la qualité globale des publications.

Uttamasha Anjally Oyshi, Susan Gauch2026-03-03🤖 cs.AI

SideQuest: Model-Driven KV Cache Management for Long-Horizon Agentic Reasoning

Le papier présente SideQuest, une approche novatrice qui utilise le modèle de raisonnement lui-même pour gérer dynamiquement le cache KV via une tâche auxiliaire parallèle, réduisant ainsi l'empreinte mémoire de 65 % lors de tâches agencielles complexes tout en préservant la précision.

Sanjay Kariyappa, G. Edward Suh2026-03-03🤖 cs.AI

HyperKKL: Enabling Non-Autonomous State Estimation through Dynamic Weight Conditioning

Ce papier propose HyperKKL, une nouvelle approche d'apprentissage utilisant un hyper-réseau pour concevoir des observateurs KKL capables d'estimer l'état de systèmes non autonomes non linéaires en générant instantanément les paramètres de l'observateur à partir du signal d'entrée externe, surmontant ainsi les limitations des méthodes existantes qui peinent à généraliser aux dynamiques pilotées.

Yahia Salaheldin Shaaban, Salem Lahlou, Abdelrahman Sayed Sayed2026-03-03⚡ eess

OmniGAIA: Towards Native Omni-Modal AI Agents

Ce papier présente OmniGAIA, un benchmark évaluant les agents IA natifs omni-modaux, et OmniAtlas, un agent fondamental intégré aux outils qui améliore le raisonnement et l'utilisation d'outils à travers la vision, l'audio et le langage.

Xiaoxi Li, Wenxiang Jiao, Jiarui Jin + 8 more2026-03-03💬 cs.CL

Brain-OF: An Omnifunctional Foundation Model for fMRI, EEG and MEG

Le papier présente Brain-OF, le premier modèle fondamental omnifonctionnel préentraîné sur un vaste corpus multimodal (fMRI, EEG et MEG) qui intègre des mécanismes innovants d'échantillonnage, d'attention et de modélisation temporelle-fréquentielle pour unifier le traitement des signaux cérébraux et surpasser les performances sur diverses tâches de neurosciences.

Hanning Guo, Farah Abdellatif, Hanwen Bi + 4 more2026-03-03🧬 q-bio

V-MORALS: Visual Morse Graph-Aided Estimation of Regions of Attraction in a Learned Latent Space

Cet article présente V-MORALS, une méthode qui utilise des graphes de Morse visuels et un espace latent appris à partir de données d'images pour estimer les régions d'attraction d'un système sans avoir besoin de connaître son état complet ni ses dynamiques.

Faiz Aladin, Ashwin Balasubramanian, Lars Lindemann + 1 more2026-03-03🤖 cs.LG

Multivariate Spatio-Temporal Neural Hawkes Processes

Cet article propose un processus de Hawkes neuronal multivarié spatio-temporel qui intègre des dynamiques d'apprentissage de l'espace et du temps pour modéliser efficacement des données d'événements complexes, comblant ainsi les lacunes des approches purement temporelles et démontrant son efficacité sur des données de terrorisme au Pakistan.

Christopher Chukwuemeka, Hojun You, Mikyoung Jun2026-03-03📊 stat

Bug Severity Prediction in Software Projects Using Supervised Machine Learning Models

Cette étude évalue l'efficacité de divers modèles d'apprentissage automatique supervisé, allant des arbres de gradient aux transformers, pour prédire automatiquement la sévérité des bogues dans les projets logiciels en utilisant des données historiques d'Eclipse Bugzilla, révélant que les méthodes ensemblistes et DistilBERT offrent la meilleure précision globale tandis que les modèles linéaires sont supérieurs pour la détection des bogues critiques.

Nafisha Tamanna Nice2026-03-03🤖 cs.LG

Riemannian Dueling Optimization

Cet article propose et analyse des algorithmes d'optimisation par duel sur les variétés riemanniennes, à savoir la descente de gradient normalisé (RDNGD) et la méthode de Frank-Wolfe sans projection (RDFW), en établissant leurs complexités théoriques et en validant leur efficacité par des expériences numériques.

Yuxuan Ren, Abhishek Roy, Shiqian Ma2026-03-03🤖 cs.LG

Bilevel Optimization with Lower-Level Uniform Convexity: Theory and Algorithm

Cet article propose une nouvelle classe de problèmes d'optimisation bi-niveau basée sur la convexité uniforme du niveau inférieur, pour laquelle les auteurs établissent un nouveau théorème de différenciation implicite et conçoivent l'algorithme stochastique UniBiO, garantissant des taux de convergence optimaux pour trouver des points stationnaires.

Yuman Wu, Xiaochuan Gong, Jie Hao + 1 more2026-03-03🤖 cs.LG

GRIP: Geometric Refinement and Adaptive Information Potential for Data Efficiency

Le papier présente GRIP, un cadre unifiant l'équilibre global des distributions et la sélection locale d'instances via un espace géométrique adaptatif, permettant d'entraîner des modèles de langage plus performants avec des données nettement moins volumineuses que les ensembles non curatés.

Changhao Wang, Jiaolong Yang, Xinhao Yao + 7 more2026-03-03💬 cs.CL

StaTS: Spectral Trajectory Schedule Learning for Adaptive Time Series Forecasting with Frequency Guided Denoiser

L'article présente StaTS, un modèle de diffusion pour la prévision probabiliste de séries temporelles qui apprend de manière adaptative un calendrier de bruit et un débruiteur guidé par la fréquence afin d'améliorer la préservation structurelle et l'inversibilité des étapes de diffusion.

Jintao Zhang, Zirui Liu, Mingyue Cheng + 3 more2026-03-03🤖 cs.AI

CARE: Confounder-Aware Aggregation for Reliable LLM Evaluation

Ce papier présente CARE, un cadre d'agrégation conscient des facteurs de confusion qui améliore l'évaluation des LLM en modélisant explicitement les erreurs corrélées des juges pour isoler la qualité réelle sans étiquettes de vérité terrain, réduisant ainsi les erreurs d'agrégation jusqu'à 26,8 %.

Jitian Zhao, Changho Shin, Tzu-Heng Huang + 2 more2026-03-03📊 stat

← Précédent Suivant →