Benefits and Pitfalls of Reinforcement Learning for Language Model Planning: A Theoretical Perspective

Cette étude théorique démontre que, bien que l'apprentissage par renforcement améliore la planification des modèles de langage en évitant les solutions erronées du fine-tuning supervisé grâce à l'exploration, les méthodes de gradient de politique souffrent d'un effondrement de la diversité, contrairement à l'apprentissage Q qui préserve cette diversité mais nécessite une conception rigoureuse des récompenses pour éviter les biais.

Siwei Wang, Yifei Shen, Haoran Sun + 5 more2026-03-04📊 stat

Death of the Novel(ty): Beyond n-Gram Novelty as a Metric for Textual Creativity

Cette étude démontre que la nouveauté des n-grammes est un indicateur insuffisant de la créativité textuelle car elle néglige l'adéquation pragmatique, révélant que la majorité des expressions très novatrices sont jugées non créatives et que les modèles de langage actuels peinent à distinguer la véritable créativité des productions non pragmatiques.

Arkadiy Saakyan, Najoung Kim, Smaranda Muresan + 1 more2026-03-04💬 cs.CL

AccurateRAG: A Framework for Building Accurate Retrieval-Augmented Question-Answering Applications

Ce papier présente AccurateRAG, un cadre innovant optimisant le développement et les performances des applications de réponse aux questions par génération augmentée par récupération (RAG) grâce à une pipeline complète allant du traitement des données à l'évaluation, surpassant ainsi les méthodes existantes sur des benchmarks.

Linh The Nguyen, Chi Tran, Dung Ngoc Nguyen + 3 more2026-03-04💬 cs.CL

Mitigating Over-Refusal in Aligned Large Language Models via Inference-Time Activation Energy

Cet article présente l'Energy Landscape Steering (ELS), un cadre novateur et sans réentraînement qui atténue le sur-rejet dans les grands modèles de langage alignés en guidant dynamiquement leurs activations internes vers des états désirables via un modèle externe basé sur l'énergie, améliorant ainsi la conformité aux requêtes bénignes tout en préservant la sécurité.

Eric Hanchen Jiang, Weixuan Ou, Run Liu + 8 more2026-03-04📊 stat

STARS: Synchronous Token Alignment for Robust Supervision in Large Language Models

Le papier présente STARS, un algorithme d'alignement synchrone qui améliore la fiabilité et l'efficacité matérielle des grands modèles de langage en remplaçant la segmentation basée sur l'incertitude par une vérification à intervalles fixes, permettant ainsi de détecter les erreurs manquées par les métriques d'incertitude tout en maximisant le débit du système.

Mohammad Atif Quamar, Mohammad Areeb, Mikhail Kuznetsov + 2 more2026-03-04💬 cs.CL

Are We Asking the Right Questions? On Ambiguity in Natural Language Queries for Tabular Data Analysis

En requalifiant l'ambiguïté des requêtes en langage naturel comme une caractéristique d'interaction coopérative plutôt que comme une défaillance, cette étude propose un cadre conceptuel pour distinguer les requêtes résolvables des requêtes non coopératives afin d'améliorer la conception et l'évaluation des interfaces d'analyse de données tabulaires.

Daniel Gomm, Cornelius Wolff, Madelon Hulsebos2026-03-04💬 cs.CL

Automated Data Enrichment using Confidence-Aware Fine-Grained Debate among Open-Source LLMs for Mental Health and Online Safety

Cet article propose un cadre de débat fin et conscient de la confiance (CFD) utilisant des modèles de langage open-source pour enrichir automatiquement les données d'indicateurs de santé mentale et de sécurité en ligne, démontrant ainsi une amélioration significative des performances des tâches en aval par rapport aux approches de base.

Junyu Mao, Anthony Hills, Talia Tseriotou + 10 more2026-03-04💬 cs.CL

Activation Steering for Masked Diffusion Language Models

Cet article propose une méthode de guidage des activations pour les modèles de diffusion masqués, démontrant qu'une intervention globale sur un sous-espace d'activation unidimensionnel permet un contrôle efficace et transférable du comportement du modèle, surpassant les approches basées sur l'optimisation ou les invites, tout en révélant des spécificités architecturales distinctes par rapport aux modèles autoregressifs.

Adi Shnaidman, Erin Feiglin, Osher Yaari + 3 more2026-03-04💬 cs.CL