cs.LG articles | Gist.Science

Class Incremental Learning with Task-Specific Batch Normalization and Out-of-Distribution Detection

Cette étude propose un cadre d'apprentissage continu novateur pour l'apprentissage incrémental de classes (CIL) qui combine une normalisation par lots spécifique à la tâche et une détection hors distribution pour prédire l'identifiant de tâche, permettant ainsi d'adapter efficacement les méthodes de type TIL tout en minimisant l'oubli catastrophique et la croissance des paramètres.

Zhiping Zhou, Xuchen Xie, Yiqiao Qiu, Run Lin, Weishi Zheng, Ruixuan Wang2026-03-12🤖 cs.LG

Conditional Local Importance by Quantile Expectations

Ce papier propose CLIQUE, une nouvelle méthode agnostique au modèle pour calculer l'importance locale des variables, qui améliore les techniques existantes comme LIME et SHAP en capturant les dépendances locales et les interactions complexes tout en s'adaptant nativement aux problèmes de classification multi-classes.

Kelvyn K. Bladen, Adele Cutler, D. Richard Cutler, Kevin R. Moon2026-03-12📊 stat

A Novel Single-Layer Quantum Neural Network for Approximate SRBB-Based Unitary Synthesis

Cet article présente un nouveau réseau de neurones quantique à couche unique basé sur la base bloc récursive standard (SRBB) qui, en exploitant les algèbres de Lie et en réduisant exponentiellement le nombre de portes CNOT, permet une synthèse unitaire approximative efficace et scalable validée sur des simulateurs et du matériel réel.

Giacomo Belli, Marco Mordacci, Michele Amoretti2026-03-12⚛️ quant-ph

Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications

Cet article propose une nouvelle famille de modèles statistiques pour les comparaisons par paires qui se passe de l'hypothèse de transitivité stochastique, en utilisant une matrice antisymétrique de faible dimension pour capturer des dynamiques complexes et offrir une estimation optimale même avec des données éparses.

Sze Ming Lee, Yunxiao Chen2026-03-12📊 stat

Particle Trajectory Representation Learning with Masked Point Modeling

Cette présentation introduit PoLAr-MAE, une méthode d'apprentissage auto-supervisé utilisant la modélisation de points masqués pour extraire des représentations physiques significatives de données LArTPC, permettant d'atteindre des performances de segmentation comparables à l'état de l'art avec une fraction infime de données étiquetées.

Sam Young, Yeon-jae Jwa, Kazuhiro Terao2026-03-12⚛️ hep-ex

Graph machine learning for flight delay prediction due to holding manouver

Cette étude propose une approche de machine learning graphique pour prédire les retards aériens dus aux manœuvres d'attente, démontrant que le modèle CatBoost enrichi de caractéristiques graphiques surpasse les réseaux d'attention graphique (GAT) pour anticiper ces événements complexes et améliorer l'efficacité opérationnelle du trafic aérien.

Jorge L. Franco, Manoel V. Machado Neto, Filipe A. N. Verri + 1 more2026-03-12🤖 cs.LG

Logarithmic Regret for Online KL-Regularized Reinforcement Learning

Cet article propose un algorithme de bandit contextuel en ligne basé sur l'optimisme pour l'apprentissage par renforcement régularisé par KL, démontrant qu'il atteint une borne de regret logarithmique en exploitant le paysage d'optimisation favorable induit par la régularisation et l'estimation optimiste des récompenses, une analyse étendue ensuite aux problèmes d'apprentissage par renforcement complets.

Heyang Zhao, Chenlu Ye, Wei Xiong + 2 more2026-03-12📊 stat

Boosting Cross-problem Generalization in Diffusion-Based Neural Combinatorial Solver via Inference Time Adaptation

Cet article présente DIFU-Ada, un cadre d'adaptation à l'inférence sans entraînement qui permet aux solveurs d'optimisation combinatoire basés sur la diffusion de généraliser de manière zéro-shot à travers différentes échelles et problèmes, comme le PCTSP et l'OP, en partant d'un modèle entraîné uniquement sur le problème du voyageur de commerce.

Haoyu Lei, Kaiwen Zhou, Yinchuan Li, Zhitang Chen, Farzan Farnia2026-03-12🤖 cs.LG

Is CLIP ideal? No. Can we fix it? Yes!

En démontrant l'impossibilité fondamentale pour les modèles CLIP d'assurer simultanément la représentation de descriptions de base, de la liaison d'attributs, des relations spatiales et de la négation, cette étude propose les cartes de similarité cosinus denses (DCSM) comme méthode interprétable surmontant ces limites géométriques et améliorant les performances sur divers benchmarks.

Raphi Kang, Yue Song, Georgia Gkioxari, Pietro Perona2026-03-12🤖 cs.LG

Are Deep Speech Denoising Models Robust to Adversarial Noise?

Cette étude démontre que des modèles de suppression de bruit profond, pourtant largement utilisés dans des applications critiques, peuvent être rendus inintelligibles par l'ajout de bruit adversaire psychoacoustiquement masqué, soulignant ainsi la nécessité de contre-mesures avant leur déploiement dans des environnements sûrs.

Will Schwarzer, Neel Chaudhari, Philip S. Thomas, Andrea Fanelli, Xiaoyu Liu2026-03-12⚡ eess

Learn to Bid as a Price-Maker Wind Power Producer

Cet article propose un algorithme d'apprentissage en ligne basé sur des bandits contextuels pour optimiser les offres stratégiques des producteurs éoliens agissant comme preneurs de prix sur les marchés de l'électricité, surmontant ainsi les limitations des méthodes d'optimisation bilevel traditionnelles.

Shobhit Singhal, Marta Fochesato, Liviu Aolaritei + 1 more2026-03-12⚡ eess

An Algorithm to perform Covariance-Adjusted Support Vector Classification in Non-Euclidean Spaces

Cette étude propose un algorithme de classification SVM ajusté par la covariance utilisant la décomposition de Cholesky pour surmonter les limitations des méthodes traditionnelles dans les espaces non-euclidiens, démontrant ainsi des performances supérieures en termes de précision et de robustesse par rapport aux SVM classiques.

Satyajeet Sahoo, Jhareswar Maiti2026-03-12📊 stat

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

Cet article propose une nouvelle approche de fusion d'images en peu d'exemples qui introduit le concept de priors incomplets et un algorithme de calcul de granules de pixels (GBPC) pour permettre à un réseau de neurones léger d'apprendre des règles de fusion adaptatives sans nécessiter de véritables images de référence.

Minjie Deng, Yan Wei, An Wu, Yuncan Ouyang, Hao Zhai, Qianyao Peng2026-03-12⚡ eess

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Cet article propose une nouvelle approche pilotée par les données pour optimiser les politiques de tarification et de gestion des stocks en environnement hors ligne, en surmontant les défis posés par la demande censurée et dépendante grâce à l'approximation par des processus de décision markoviens d'ordre élevé et à l'estimation de politiques optimales via des algorithmes inspirés de l'apprentissage par renforcement hors ligne et de l'analyse de survie.

Korel Gundem, Zhengling Qi2026-03-12📊 stat

Score Matching Diffusion Based Feedback Control and Planning of Nonlinear Systems

Cet article propose un cadre déterministe de contrôle basé sur l'appariement de scores et les processus de diffusion pour piloter la densité de probabilité de systèmes non linéaires vers une distribution cible, en transformant la synthèse de commande en la construction d'un processus inverse qui agit comme une loi de rétroaction de débruitage.

Karthik Elamvazhuthi, Darshan Gadginmath, Fabio Pasqualetti2026-03-12⚡ eess

Scalable Multi-Task Learning through Spiking Neural Networks with Adaptive Task-Switching Policy for Intelligent Autonomous Agents

Le papier propose SwitchMT, une méthode novatrice utilisant des réseaux de neurones à impulsions avec une politique de commutation de tâches adaptative pour permettre un apprentissage multi-tâches évolutif et efficace aux agents autonomes, surmontant ainsi les interférences de tâches sans accroître la complexité du réseau.

Rachmad Vidya Wicaksana Putra, Avaneesh Devkota, Muhammad Shafique2026-03-12🤖 cs.AI

Panda: A pretrained forecast model for chaotic dynamics

Le papier présente Panda, un modèle pré-entraîné sur un vaste ensemble de systèmes dynamiques chaotiques synthétiques qui, grâce à une architecture d'attention par patches, parvient à effectuer des prévisions en zéro-shot sur des systèmes chaotiques inédits et à prédire des équations aux dérivées partielles sans réentraînement, démontrant ainsi l'efficacité des modèles fondés pour les dynamiques non linéaires.

Jeffrey Lai, Anthony Bao, William Gilpin2026-03-12🌀 nlin

LLLMs: A Data-Driven Survey of Evolving Research on Limitations of Large Language Models

Ce sondage de données-driven examine l'évolution rapide des recherches sur les limites des grands modèles de langage (LLLMs) de 2022 à 2025, révélant une croissance exponentielle des publications axées sur le raisonnement, les hallucinations et la sécurité, tout en offrant une méthodologie validée et un jeu de données annotées.

Aida Kostikova, Zhipin Wang, Deidamea Bajri, Ole Pütz, Benjamin Paaßen, Steffen Eger2026-03-12💬 cs.CL

Consistency-based Abductive Reasoning over Perceptual Errors of Multiple Pre-trained Models in Novel Environments

Cet article propose un cadre d'abduction basé sur la cohérence qui intègre les prédictions de multiples modèles pré-entraînés via des règles logiques pour atténuer les erreurs de perception dans des environnements nouveaux, surpassant ainsi les modèles individuels et les méthodes d'ensemble classiques en termes de précision et de rappel.

Mario Leiva, Noel Ngu, Joshua Shay Kricheli, Aditya Taparia, Ransalu Senanayake, Paulo Shakarian, Nathaniel Bastian, John Corcoran, Gerardo Simari2026-03-12🤖 cs.AI

CARTGen-IR: Synthetic Tabular Data Generation for Imbalanced Regression

Le papier propose CARTGen-IR, une méthode de suréchantillonnage synthétique basée sur les arbres de décision CART pour la régression déséquilibrée, qui génère des données tabulaires réalistes sans seuillage arbitraire tout en offrant rapidité et interprétabilité.

António Pedro Pinheiro, Rita P. Ribeiro2026-03-12🤖 cs.LG

← Précédent Suivant →