cs.LG articles | Gist.Science

POET-X: Memory-efficient LLM Training by Scaling Orthogonal Transformation

Le papier présente POET-X, une variante économe en mémoire et efficace du cadre POET pour l'entraînement des grands modèles de langage, qui permet de préentraîner des modèles à plusieurs milliards de paramètres sur un seul GPU Nvidia H100 là où les optimiseurs standards échouent par manque de mémoire.

Zeju Qiu, Lixin Liu, Adrian Weller + 2 more2026-03-06🤖 cs.AI

RoboPocket: Improve Robot Policies Instantly with Your Phone

Le papier présente RoboPocket, un système portable utilisant la réalité augmentée sur smartphone pour visualiser les prédictions d'un robot et permettre une itération de politique instantanée et sans robot physique, doublant ainsi l'efficacité des données par rapport aux stratégies hors ligne.

Junjie Fang, Wendi Chen, Han Xue + 7 more2026-03-06🤖 cs.AI

Recurrent Action Transformer with Memory

Ce papier présente RATE, une architecture de transformer récurrent avec mémoire conçue pour l'apprentissage par renforcement hors ligne, qui améliore significativement la prise de décision dans des environnements partiellement observables en régulant la rétention d'informations sur de longues séquences tout en restant compétitive sur des tâches standard.

Egor Cherepanov, Alexey Staroverov, Alexey K. Kovalev + 1 more2026-03-05🤖 cs.AI

Crystal-GFN: sampling crystals with desirable properties and constraints

Ce papier présente Crystal-GFN, un modèle génératif basé sur les GFlowNets capable de concevoir efficacement des structures cristallines valides et diversifiées répondant à des contraintes géométriques et physico-chimiques spécifiques pour accélérer la découverte de matériaux.

Mila AI4Science, :, Alex Hernandez-Garcia + 11 more2026-03-05🤖 cs.LG

GeoTop: Advancing Image Classification with Geometric-Topological Analysis

Le cadre GeoTop unifie l'analyse topologique des données et les courbures de Lipschitz-Killing pour surmonter l'équivalence topologique en imagerie diagnostique, offrant ainsi une classification précise et interprétable des lésions cutanées grâce à la différenciation géométrique fine.

Mariem Abaach, Ian Morilla2026-03-05🤖 cs.LG

Sample-Optimal Locally Private Hypothesis Selection and the Provable Benefits of Interactivity

Les auteurs proposent un algorithme de sélection d'hypothèses sous confidentialité différentielle locale qui, grâce à une interaction limitée, atteint une complexité en échantillons optimale de $\Theta(k)$ , brisant ainsi la barrière de $\Omega(k \log k)$ imposée aux méthodes non interactives.

Alireza F. Pour, Hassan Ashtiani, Shahab Asoodeh2026-03-05🤖 cs.LG

Graph Neural Networks in EEG-based Emotion Recognition: A Survey

Cette étude propose une enquête complète sur l'utilisation des réseaux de neurones graphiques pour la reconnaissance des émotions à partir de l'EEG, en présentant un cadre unifié de construction de graphes, en catégorisant les méthodes existantes et en identifiant les défis futurs pour guider les recherches dans ce domaine.

Chenyu Liu, Yuqiu Deng, Yihao Wu + 10 more2026-03-05🤖 cs.LG

List Sample Compression and Uniform Convergence

Cet article démontre que, bien que l'uniforme convergence reste équivalente à l'apprenabilité dans le cadre de l'apprentissage par listes, la conjecture de compression d'échantillon de Littlestone et Warmuth échoue, car il existe des classes apprenables par listes qui ne peuvent pas être compressées, même avec des listes de reconstruction arbitrairement grandes.

Steve Hanneke, Shay Moran, Tom Waknine2026-03-05🤖 cs.LG

Agnostic Tomography of Stabilizer Product States

Les auteurs proposent un algorithme efficace pour la tomographie agnostique des états produits de stabilisateurs à $n$ qubits, permettant d'obtenir une description succincte d'un état approximant un état inconnu $\rho$ aussi bien que le meilleur état de cette classe, avec une complexité polynomiale en $n$ et $1/\varepsilon$ pour une fidélité constante.

Sabee Grewal, Vishnu Iyer, William Kretschmer + 1 more2026-03-05⚛️ quant-ph

A Review of Reward Functions for Reinforcement Learning in the context of Autonomous Driving

Cet article examine les défis de conception des fonctions de récompense pour l'apprentissage par renforcement dans la conduite autonome en catégorisant les objectifs, en identifiant leurs limites actuelles et en proposant des pistes de recherche futures pour des récompenses structurées, contextuelles et validées.

Ahmed Abouelazm, Jonas Michel, J. Marius Zoellner2026-03-05🤖 cs.AI

Tracking solutions of time-varying variational inequalities

Cet article étend les garanties de suivi des solutions d'inéquations variationnelles dépendantes du temps à des cas non monotones et périodiques, tout en démontrant que les systèmes dynamiques discrets associés peuvent soit converger soit présenter un comportement chaotique.

Hédi Hadiji, Sarah Sachs, Cristóbal Guzmán2026-03-05🤖 cs.LG

Black Box Meta-Learning Intrinsic Rewards

Cet article présente une méthode de méta-apprentissage qui optimise les récompenses intrinsèques pour les agents d'apprentissage par renforcement en traitant les mises à jour de la politique comme des boîtes noires, améliorant ainsi l'efficacité de l'apprentissage et l'exploration dans des environnements à récompenses clairsemées.

Octavio Pappalardo, Rodrigo Ramele, Juan Miguel Santos2026-03-05🤖 cs.LG

AuToMATo: An Out-Of-The-Box Persistence-Based Clustering Algorithm

Ce papier présente AuToMATo, un algorithme de clustering basé sur l'homologie persistante qui, grâce à des paramètres par défaut robustes et une procédure de bootstrapping, offre une solution « prête à l'emploi » surpassant souvent les meilleurs réglages d'autres méthodes et s'intégrant parfaitement à l'écosystème scikit-learn et à l'analyse de données topologiques.

Marius Huber, Sara Kalisnik, Patrick Schnider2026-03-05🤖 cs.LG

A computational transition for detecting correlated stochastic block models by low-degree polynomials

Cet article établit que la détection de la corrélation entre deux graphes stochastiques en blocs subsampelés est possible par des polynômes de bas degré si et seulement si le taux d'échantillonnage dépasse le minimum entre la constante d'Otter et le seuil de Kesten-Stigum, définissant ainsi la frontière entre les régimes facile et difficile pour ce problème.

Guanyi Chen, Jian Ding, Shuyang Gong + 1 more2026-03-05🤖 cs.LG

Diffusion & Adversarial Schrödinger Bridges via Iterative Proportional Markovian Fitting

Ce papier propose la procédure IPMF, une méthode unifiée combinant l'ajustement proportionnel itératif et l'ajustement markovien itératif pour résoudre efficacement les ponts de Schrödinger et les ponts adversariaux, tout en garantissant la convergence et en offrant un compromis flexible entre similarité d'images et qualité de génération.

Sergei Kholkin, Grigoriy Ksenofontov, David Li + 6 more2026-03-05🤖 cs.LG

Toward Reasoning on the Boundary: A Mixup-based Approach for Graph Anomaly Detection

L'article présente ANOMIX, une approche novatrice pour la détection d'anomalies dans les graphes qui améliore la capacité de raisonnement des modèles en synthétisant des contre-exemples difficiles via une stratégie de mixup pour mieux distinguer les anomalies subtiles situées à la frontière des données normales.

Hwan Kim, Junghoon Kim, Sungsu Lim2026-03-05🤖 cs.AI

Curriculum-enhanced GroupDRO: Challenging the Norm of Avoiding Curriculum Learning in Subpopulation Shift Setups

Les auteurs proposent une approche d'optimisation robuste distributive par groupes enrichie par un apprentissage par curriculum (CeGDRO) qui, en priorisant les échantillons les plus difficiles à confirmer les biais et les plus faciles à les contredire, surpasse les méthodes actuelles sur les scénarios de décalage de sous-population en évitant l'ancrage prématuré dans des corrélations spurious.

Antonio Barbalau2026-03-05🤖 cs.AI

FlowCLAS: Enhancing Normalizing Flow Via Contrastive Learning For Anomaly Segmentation

Le papier présente FlowCLAS, un cadre hybride qui améliore les flux normalisants pour la segmentation d'anomalies en robotique en combinant une fonction de perte de vraisemblance maximale avec un apprentissage contrastif basé sur l'exposition aux valeurs aberrantes, établissant ainsi de nouvelles performances de pointe sur plusieurs benchmarks.

Chang Won Lee, Selina Leveugle, Svetlana Stolpner + 4 more2026-03-05🤖 cs.LG

FSMLP: Modelling Channel Dependencies With Simplex Theory Based Multi-Layer Perceptions In Frequency Domain

Cet article présente FSMLP, un cadre innovant pour la prévision de séries temporelles qui intègre une couche MLP contrainte par la théorie des simplexes pour réduire le surajustement dans la modélisation des dépendances inter-canaux et opérer dans le domaine fréquentiel, démontrant ainsi une précision et une efficacité supérieures sur plusieurs jeux de données de référence.

Zhengnan Li, Haoxuan Li, Hao Wang + 3 more2026-03-05🤖 cs.LG

Unraveling the Complexity of Memory in RL Agents: an Approach for Classification and Evaluation

Cet article propose une définition précise et une méthodologie standardisée pour classifier et évaluer les capacités de mémoire des agents d'apprentissage par renforcement, en s'inspirant des sciences cognitives afin de remédier au manque de clarté actuel et d'éviter des jugements erronés.

Egor Cherepanov, Nikita Kachaev, Artem Zholus + 2 more2026-03-05🤖 cs.AI

← Précédent Suivant →