Class Incremental Learning with Task-Specific Batch Normalization and Out-of-Distribution Detection

Cette étude propose un cadre d'apprentissage continu novateur pour l'apprentissage incrémental de classes (CIL) qui combine une normalisation par lots spécifique à la tâche et une détection hors distribution pour prédire l'identifiant de tâche, permettant ainsi d'adapter efficacement les méthodes de type TIL tout en minimisant l'oubli catastrophique et la croissance des paramètres.

Zhiping Zhou, Xuchen Xie, Yiqiao Qiu, Run Lin, Weishi Zheng, Ruixuan Wang2026-03-12🤖 cs.LG

A Novel Single-Layer Quantum Neural Network for Approximate SRBB-Based Unitary Synthesis

Cet article présente un nouveau réseau de neurones quantique à couche unique basé sur la base bloc récursive standard (SRBB) qui, en exploitant les algèbres de Lie et en réduisant exponentiellement le nombre de portes CNOT, permet une synthèse unitaire approximative efficace et scalable validée sur des simulateurs et du matériel réel.

Giacomo Belli, Marco Mordacci, Michele Amoretti2026-03-12⚛️ quant-ph

Graph machine learning for flight delay prediction due to holding manouver

Cette étude propose une approche de machine learning graphique pour prédire les retards aériens dus aux manœuvres d'attente, démontrant que le modèle CatBoost enrichi de caractéristiques graphiques surpasse les réseaux d'attention graphique (GAT) pour anticiper ces événements complexes et améliorer l'efficacité opérationnelle du trafic aérien.

Jorge L. Franco, Manoel V. Machado Neto, Filipe A. N. Verri + 1 more2026-03-12🤖 cs.LG

Logarithmic Regret for Online KL-Regularized Reinforcement Learning

Cet article propose un algorithme de bandit contextuel en ligne basé sur l'optimisme pour l'apprentissage par renforcement régularisé par KL, démontrant qu'il atteint une borne de regret logarithmique en exploitant le paysage d'optimisation favorable induit par la régularisation et l'estimation optimiste des récompenses, une analyse étendue ensuite aux problèmes d'apprentissage par renforcement complets.

Heyang Zhao, Chenlu Ye, Wei Xiong + 2 more2026-03-12📊 stat

Boosting Cross-problem Generalization in Diffusion-Based Neural Combinatorial Solver via Inference Time Adaptation

Cet article présente DIFU-Ada, un cadre d'adaptation à l'inférence sans entraînement qui permet aux solveurs d'optimisation combinatoire basés sur la diffusion de généraliser de manière zéro-shot à travers différentes échelles et problèmes, comme le PCTSP et l'OP, en partant d'un modèle entraîné uniquement sur le problème du voyageur de commerce.

Haoyu Lei, Kaiwen Zhou, Yinchuan Li, Zhitang Chen, Farzan Farnia2026-03-12🤖 cs.LG

Is CLIP ideal? No. Can we fix it? Yes!

En démontrant l'impossibilité fondamentale pour les modèles CLIP d'assurer simultanément la représentation de descriptions de base, de la liaison d'attributs, des relations spatiales et de la négation, cette étude propose les cartes de similarité cosinus denses (DCSM) comme méthode interprétable surmontant ces limites géométriques et améliorant les performances sur divers benchmarks.

Raphi Kang, Yue Song, Georgia Gkioxari, Pietro Perona2026-03-12🤖 cs.LG

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

Cet article propose une nouvelle approche de fusion d'images en peu d'exemples qui introduit le concept de priors incomplets et un algorithme de calcul de granules de pixels (GBPC) pour permettre à un réseau de neurones léger d'apprendre des règles de fusion adaptatives sans nécessiter de véritables images de référence.

Minjie Deng, Yan Wei, An Wu, Yuncan Ouyang, Hao Zhai, Qianyao Peng2026-03-12⚡ eess

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Cet article propose une nouvelle approche pilotée par les données pour optimiser les politiques de tarification et de gestion des stocks en environnement hors ligne, en surmontant les défis posés par la demande censurée et dépendante grâce à l'approximation par des processus de décision markoviens d'ordre élevé et à l'estimation de politiques optimales via des algorithmes inspirés de l'apprentissage par renforcement hors ligne et de l'analyse de survie.

Korel Gundem, Zhengling Qi2026-03-12📊 stat

Score Matching Diffusion Based Feedback Control and Planning of Nonlinear Systems

Cet article propose un cadre déterministe de contrôle basé sur l'appariement de scores et les processus de diffusion pour piloter la densité de probabilité de systèmes non linéaires vers une distribution cible, en transformant la synthèse de commande en la construction d'un processus inverse qui agit comme une loi de rétroaction de débruitage.

Karthik Elamvazhuthi, Darshan Gadginmath, Fabio Pasqualetti2026-03-12⚡ eess

Scalable Multi-Task Learning through Spiking Neural Networks with Adaptive Task-Switching Policy for Intelligent Autonomous Agents

Le papier propose SwitchMT, une méthode novatrice utilisant des réseaux de neurones à impulsions avec une politique de commutation de tâches adaptative pour permettre un apprentissage multi-tâches évolutif et efficace aux agents autonomes, surmontant ainsi les interférences de tâches sans accroître la complexité du réseau.

Rachmad Vidya Wicaksana Putra, Avaneesh Devkota, Muhammad Shafique2026-03-12🤖 cs.AI

Panda: A pretrained forecast model for chaotic dynamics

Le papier présente Panda, un modèle pré-entraîné sur un vaste ensemble de systèmes dynamiques chaotiques synthétiques qui, grâce à une architecture d'attention par patches, parvient à effectuer des prévisions en zéro-shot sur des systèmes chaotiques inédits et à prédire des équations aux dérivées partielles sans réentraînement, démontrant ainsi l'efficacité des modèles fondés pour les dynamiques non linéaires.

Jeffrey Lai, Anthony Bao, William Gilpin2026-03-12🌀 nlin

LLLMs: A Data-Driven Survey of Evolving Research on Limitations of Large Language Models

Ce sondage de données-driven examine l'évolution rapide des recherches sur les limites des grands modèles de langage (LLLMs) de 2022 à 2025, révélant une croissance exponentielle des publications axées sur le raisonnement, les hallucinations et la sécurité, tout en offrant une méthodologie validée et un jeu de données annotées.

Aida Kostikova, Zhipin Wang, Deidamea Bajri, Ole Pütz, Benjamin Paaßen, Steffen Eger2026-03-12💬 cs.CL

Consistency-based Abductive Reasoning over Perceptual Errors of Multiple Pre-trained Models in Novel Environments

Cet article propose un cadre d'abduction basé sur la cohérence qui intègre les prédictions de multiples modèles pré-entraînés via des règles logiques pour atténuer les erreurs de perception dans des environnements nouveaux, surpassant ainsi les modèles individuels et les méthodes d'ensemble classiques en termes de précision et de rappel.

Mario Leiva, Noel Ngu, Joshua Shay Kricheli, Aditya Taparia, Ransalu Senanayake, Paulo Shakarian, Nathaniel Bastian, John Corcoran, Gerardo Simari2026-03-12🤖 cs.AI