cs.LG articles | Gist.Science

SoFlow: Solution Flow Models for One-Step Generative Modeling

Ce papier présente SoFlow, un cadre de modélisation des flux de solutions permettant une génération en une seule étape sans calcul de produit Jacobien-vecteur, et démontrant des performances supérieures aux modèles MeanFlow sur ImageNet 256x256.

Tianze Luo, Haotian Yuan, Zhuang Liu2026-03-03🤖 cs.LG

Dynamic Tool Dependency Retrieval for Efficient Function Calling

Ce papier propose DTDR, une méthode de récupération dynamique des dépendances d'outils qui, en s'adaptant au contexte d'exécution évolutif des agents d'appel de fonctions, améliore considérablement les taux de réussite par rapport aux méthodes statiques existantes.

Bhrij Patel, Davide Belli, Amir Jalalirad + 3 more2026-03-03🤖 cs.LG

RMAAT: Astrocyte-Inspired Memory Compression and Replay for Efficient Long-Context Transformers

Cet article présente RMAAT, une architecture de transformateur inspirée des astrocytes qui intègre une mémoire récurrente compressée et un mécanisme d'attention linéaire pour surmonter la complexité quadratique des modèles à long contexte tout en maintenant une haute efficacité computationnelle.

Md Zesun Ahmed Mia, Malyaban Bal, Abhronil Sengupta2026-03-03🤖 cs.AI

Aligned explanations in neural networks

Cet article propose les PiNets, un cadre d'apprentissage profond fondé sur le principe de lisibilité du modèle, qui garantit par conception que les explications des prédictions sont alignées avec le processus de décision réel du réseau, offrant ainsi des justifications fidèles, robustes et significatives.

Corentin Lobet, Francesca Chiaromonte2026-03-03📊 stat

AgentOCR: Reimagining Agent History via Optical Self-Compression

Le papier présente AgentOCR, un cadre qui optimise l'efficacité des agents autonomes en convertissant leur historique d'interactions en images compactes via un cache optique segmenté et une auto-compression adaptative, réduisant ainsi considérablement la consommation de tokens et de mémoire tout en préservant plus de 95 % des performances.

Lang Feng, Fuchao Yang, Feng Chen + 5 more2026-03-03🤖 cs.AI

TP-Blend: Textual-Prompt Attention Pairing for Precise Object-Style Blending in Diffusion Models

Le papier présente TP-Blend, un cadre léger et sans entraînement qui fusionne de manière précise un objet et un style distincts dans les modèles de diffusion en combinant une fusion d'attention croisée optimisée par transport optimal et une fusion d'attention auto-attentionnelle sensible aux détails via une normalisation instance.

Xin Jin, Yichuan Zhong, Yapeng Tian2026-03-03🤖 cs.AI

Silence the Judge: Reinforcement Learning with Self-Verifier via Latent Geometric Clustering

Ce papier propose Latent-GRPO, un cadre d'apprentissage par renforcement qui élimine le besoin de vérificateurs externes coûteux en exploitant la géométrie de l'espace latent pour générer des récompenses intrinsèques continues via un algorithme d'estimation de centroïde robuste, permettant ainsi d'accélérer l'entraînement des modèles de langage de plus de deux fois tout en maintenant leurs performances.

Nonghai Zhang, Weitao Ma, Zhanyu Ma + 5 more2026-03-03💬 cs.CL

Counterfactual Explanations on Robust Perceptual Geodesics

Cet article présente les Perceptual Counterfactual Geodesics (PCG), une méthode qui génère des explications contrefactuelles en suivant des géodésiques dans un espace latent muni d'une métrique riemannienne perceptuelle, garantissant ainsi des transitions sémantiquement valides et robustes aux artefacts hors-manifold.

Eslam Zaher, Maciej Trzaskowski, Quan Nguyen + 1 more2026-03-03🤖 cs.LG

LLAMA LIMA: A Living Meta-Analysis on the Effects of Generative AI on Learning Mathematics

Cet article présente la deuxième version d'une méta-analyse vivante révisée selon les directives PRISMA-LSR, qui intègre continuellement de nouvelles études sur l'impact de l'IA générative en mathématiques et révèle un effet positif modéré (g = 0,42) malgré une base de preuves encore limitée.

Anselm Strohmaier, Samira Bödefeld, Oliver Straser + 1 more2026-03-03🤖 cs.LG

Analysis of Shuffling Beyond Pure Local Differential Privacy

Cet article propose une nouvelle analyse asymptotique du mécanisme de brouillage qui, en introduisant un « indice de brouillage » basé sur la divergence de couverture, permet d'évaluer l'amplification de la confidentialité au-delà des limites du paramètre de pureté locale $\varepsilon_0$ et offre un algorithme FFT efficace pour le calcul numérique de ces garanties.

Shun Takagi, Seng Pei Liew2026-03-03🔢 math

Domain Expansion: A Latent Space Construction Framework for Multi-Task Learning

Ce papier présente le cadre « Domain Expansion », qui utilise un mécanisme de regroupement orthogonal pour structurer l'espace latent en sous-espaces mutuellement exclusifs, évitant ainsi l'effondrement des représentations dans l'apprentissage multi-tâches et permettant une manipulation interprétable des concepts.

Chi-Yao Huang, Khoa Vo, Aayush Atul Verma + 2 more2026-03-03🤖 cs.LG

Sparse clustering via the Deterministic Information Bottleneck algorithm

Cet article présente un cadre théorique basé sur le principe de l'information bottleneck déterministe pour réaliser un clustering parcimonieux et un pondération conjointe des caractéristiques, surmontant ainsi les défis posés par les données éparses et démontrant son efficacité sur des données génomiques réelles.

Efthymios Costa, Ioanna Papatsouma, Angelos Markos2026-03-03📊 stat

GNN Explanations that do not Explain and How to find Them

Cet article révèle que les explications fournies par les réseaux de neurones graphiques auto-explicatifs (SE-GNN) peuvent être fondamentalement déconnectées de la logique de prédiction du modèle, même en cas de performance optimale, et propose une nouvelle métrique de fidélité pour détecter ces défaillances dégénérées, qu'elles soient malveillantes ou naturelles.

Steve Azzolin, Stefano Teso, Bruno Lepri + 2 more2026-03-03🤖 cs.AI

Reward Models Inherit Value Biases from Pretraining

Cette étude démontre que les modèles de récompense héritent de biais de valeurs spécifiques de leurs modèles de base préentraînés, privilégiant systématiquement l'« agence » pour Llama et la « communion » pour Gemma, indépendamment des données de préférence utilisées lors du fine-tuning.

Brian Christian, Jessica A. F. Thompson, Elle Michelle Yang + 4 more2026-03-03💬 cs.CL

When Anomalies Depend on Context: Learning Conditional Compatibility for Anomaly Detection

Cet article présente CAAD-3K, un nouveau benchmark, et un cadre d'apprentissage de compatibilité conditionnelle basé sur des représentations vision-langage pour détecter les anomalies contextuelles en modélisant la compatibilité sujet-environnement, surpassant ainsi les méthodes existantes sur plusieurs jeux de données.

Shashank Mishra, Didier Stricker, Jason Rambach2026-03-03🤖 cs.LG

Decoupled Diffusion Sampling for Inverse Problems on Function Spaces

Les auteurs proposent le DDIS, un cadre génératif découplé en espace fonctionnel qui associe un opérateur neuronal à un modèle de diffusion pour résoudre des problèmes inverses d'EDP avec une efficacité supérieure en données et une meilleure précision que les approches couplées existantes.

Thomas Y. L. Lin, Jiachen Yao, Lufang Chiang + 2 more2026-03-03🔢 math

Gradient-Aligned Calibration for Post-Training Quantization of Diffusion Models

Cet article propose une méthode de quantisation post-entraînement novatrice pour les modèles de diffusion, qui améliore l'efficacité en apprenant à attribuer des poids optimaux aux échantillons de calibration afin d'aligner les gradients à travers les différents pas de temps.

Dung Anh Hoang, Cuong Pham anh Trung Le, Jianfei Cai + 1 more2026-03-03🤖 cs.LG

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Ce papier présente le benchmark VDR-Bench, conçu pour évaluer de manière plus réaliste les capacités de recherche visuelle et textuelle des modèles de langage multimodaux en surmontant les limites des benchmarks existants, tout en proposant une méthode de recherche par recadrage itératif pour améliorer leurs performances.

Yu Zeng, Wenxuan Huang, Zhen Fang + 14 more2026-03-03💬 cs.CL

Learning to Explore with Parameter-Space Noise: A Deep Dive into Parameter-Space Noise for Reinforcement Learning with Verifiable Rewards

Ce papier propose PSN-RLVR, une méthode qui améliore l'exploration dans l'apprentissage par renforcement avec récompenses vérifiables en perturbant les paramètres du modèle plutôt que les actions, permettant ainsi de découvrir de nouvelles stratégies de raisonnement et d'obtenir de meilleures performances sur des tâches mathématiques complexes.

Bizhe Bai, Xinyue Wang, Peng Ye + 1 more2026-03-03🤖 cs.AI

Relaxed Triangle Inequality for Kullback-Leibler Divergence Between Multivariate Gaussian Distributions

Cet article établit la borne supérieure exacte de la divergence de Kullback-Leibler entre trois distributions gaussiennes multivariées satisfaisant une inégalité triangulaire relâchée, comblant ainsi une lacune théorique et démontrant son utilité pour la détection de données hors distribution et l'apprentissage par renforcement sûr.

Shiji Xiao, Yufeng Zhang, Chubo Liu + 3 more2026-03-03📊 stat

← Précédent Suivant →