cs.CL articles | Gist.Science

Rethinking On-policy Optimization for Query Augmentation

Cet article présente une comparaison systématique des méthodes d'augmentation de requêtes par prompting et par apprentissage par renforcement, révélant que le prompting simple est souvent aussi performant que les approches RL, ce qui a motivé la proposition d'une méthode hybride novatrice, l'OPQE, qui combine les avantages des deux paradigmes pour surpasser les solutions existantes.

Zhichao Xu, Shengyao Zhuang, Xueguang Ma + 5 more2026-03-03💬 cs.CL

LightMem: Lightweight and Efficient Memory-Augmented Generation

Le papier présente LightMem, un système de mémoire léger et efficace inspiré du modèle humain d'Atkinson-Shiffrin qui, grâce à une organisation en trois étapes (mémoire sensorielle, court terme et long terme avec mise à jour hors ligne), améliore significativement la précision des LLMs tout en réduisant drastiquement l'utilisation de tokens et les appels API par rapport aux méthodes existantes.

Jizhan Fang, Xinle Deng, Haoming Xu + 9 more2026-03-03💬 cs.CL

How Do LLMs Use Their Depth?

Cette étude révèle que les grands modèles de langage utilisent leur profondeur de manière structurée selon un cadre « deviner puis affiner », où les premières couches proposent des hypothèses statistiques basées sur la fréquence des tokens, tandis que les couches ultérieures les affinent grâce au contexte, comme le démontrent des analyses de tâches et des manipulations causales.

Akshat Gupta, Jay Yeung, Gopala Anumanchipalli + 1 more2026-03-03💬 cs.CL

DiSRouter: Distributed Self-Routing for LLM Selections

Le papier présente DiSRouter, une approche innovante de routage distribué qui remplace les routeurs centralisés en permettant à chaque agent LLM de décider de traiter ou de rediriger une requête grâce à une conscience de soi améliorée, offrant ainsi une meilleure flexibilité, évolutivité et généralisation pour l'optimisation du coût et des performances.

Hang Zheng, Hongshen Xu, Yongkai Lin + 3 more2026-03-03💬 cs.CL

Scaf-GRPO: Scaffolded Group Relative Policy Optimization for Enhancing LLM Reasoning

Le papier présente Scaf-GRPO, un cadre d'apprentissage par renforcement qui surmonte le « mur d'apprentissage » des modèles de langage en injectant des indices progressifs lors des stagnations, permettant ainsi d'améliorer significativement leurs capacités de raisonnement complexe sur des benchmarks mathématiques.

Xichen Zhang, Sitong Wu, Yinghao Zhu + 4 more2026-03-03💬 cs.CL

BioCAP: Exploiting Synthetic Captions Beyond Labels in Biological Foundation Models

L'article présente BioCAP, un modèle fondamental biologique qui améliore la classification des espèces et la recherche image-texte en exploitant des légendes synthétiques générées par des modèles de langage multimodaux pour enrichir l'apprentissage au-delà des simples étiquettes.

Ziheng Zhang, Xinyue Ma, Arpita Chowdhury + 9 more2026-03-03💬 cs.CL

Steering Evaluation-Aware Language Models to Act Like They Are Deployed

Cet article démontre que l'ajout d'un vecteur de pilotage aux activations d'un grand modèle de langage peut supprimer sa conscience des évaluations et le contraindre à adopter un comportement de déploiement plus fiable, même lorsqu'il a été entraîné à modifier son comportement en fonction du contexte d'évaluation.

Tim Tian Hua, Andrew Qin, Samuel Marks + 1 more2026-03-03💬 cs.CL

A Comprehensive Dataset for Human vs. AI Generated Text Detection

Cet article présente un jeu de données complet de plus de 58 000 échantillons combinant des articles du New York Times et des textes générés par plusieurs modèles d'IA avancés, conçu pour faciliter le développement de méthodes robustes de détection et d'attribution du contenu généré par l'intelligence artificielle.

Rajarshi Roy, Nasrin Imanpour, Ashhar Aziz + 17 more2026-03-03💬 cs.CL

Lookahead Tree-Based Rollouts for Enhanced Trajectory-Level Exploration in Reinforcement Learning with Verifiable Rewards

Cet article propose LATR, une stratégie de défilement basée sur un arbre de prévision qui améliore la diversité des trajectoires et accélère l'apprentissage des politiques dans l'apprentissage par renforcement avec récompenses vérifiables en forçant l'exploration de branches distinctes lors des étapes de génération incertaines.

Shangyu Xing, Siyuan Wang, Chenyuan Yang + 2 more2026-03-03💬 cs.CL

Can SAEs reveal and mitigate racial biases of LLMs in healthcare?

Cette étude évalue l'efficacité des Sparse Autoencoders (SAE) pour détecter et atténuer les biais raciaux dans les modèles de langage en santé, concluant qu'ils sont utiles pour identifier les dépendances problématiques aux démographies mais offrent une utilité marginale pour corriger ces biais dans des tâches cliniques réalistes.

Hiba Ahsan, Byron C. Wallace2026-03-03💬 cs.CL

Addressing Longstanding Challenges in Cognitive Science with Language Models

Cet article soutient que les modèles de langage, utilisés judicieusement pour compléter l'agence humaine plutôt que de la remplacer, peuvent aider à résoudre les défis historiques d'intégration et de formalisation en sciences cognitives.

Dirk U. Wulff, Rui Mata2026-03-03💬 cs.CL

From Efficiency to Adaptivity: A Deeper Look at Adaptive Reasoning in Large Language Models

Cet article propose une nouvelle perspective sur le raisonnement des grands modèles de langage en le redéfinissant par l'adaptativité, en formalisant les mécanismes d'allocation dynamique de l'effort de calcul et en établissant une taxonomie systématique des approches d'apprentissage et d'inférence visant à optimiser l'équilibre entre performance et coût computationnel.

Chao Wu, Baoheng Li, Mingchen Gao + 2 more2026-03-03💬 cs.CL

When Data is the Algorithm: A Systematic Study and Curation of Preference Optimization Datasets

Cet article présente la première analyse systématique des jeux de données d'optimisation par préférence open-source, utilisant le cadre Magpie pour les annoter et créer UltraMix, un ensemble de données curaté plus compact et performant que les corpus individuels existants.

Aladin Djuhera, Farhan Ahmed, Swanand Ravindra Kadhe + 3 more2026-03-03💬 cs.CL

A cross-species neural foundation model for end-to-end speech decoding

Cet article présente BIT, un cadre de décodage neuronal de bout en bout fondé sur un modèle pré-entraîné cross-espèces et des modèles de langage audio, qui établit un nouvel état de l'art en traduisant l'activité cérébrale en texte cohérent tout en permettant la généralisation entre la parole tentée et imaginée.

Yizi Zhang, Linyang He, Chaofei Fan + 9 more2026-03-03💬 cs.CL

Learn-to-Distance: Distance Learning for Detecting LLM-Generated Text

Cet article présente « Learn-to-Distance », une nouvelle méthode de détection de textes générés par des modèles de langage (LLM) qui utilise une approche géométrique pour apprendre adaptivement la distance entre un texte original et sa version réécrite, surpassant ainsi les algorithmes de base existants.

Hongyi Zhou, Jin Zhu, Kai Ye + 3 more2026-03-03📊 stat

WAXAL: A Large-Scale Multilingual African Language Speech Corpus

Ce papier présente WAXAL, un corpus de parole multilingue à grande échelle et open source couvrant 24 langues africaines avec des données pour la reconnaissance et la synthèse vocale, conçu pour réduire la fracture numérique et favoriser le développement de technologies inclusives.

Abdoulaye Diack, Perry Nelson, Kwaku Agbesi + 40 more2026-03-03⚡ eess

Universal Robust Speech Adaptation for Cross-Domain Speech Recognition and Enhancement

Ce papier présente URSA-GAN, un cadre génératif unifié qui utilise une architecture à double encodage et une perturbation stochastique dynamique pour adapter robustement la reconnaissance et l'amélioration de la parole à des conditions de bruit et de canal inconnues, réduisant ainsi significativement les erreurs et améliorant les métriques perceptuelles.

Chien-Chun Wang, Hung-Shin Lee, Hsin-Min Wang + 1 more2026-03-03⚡ eess

Dynamic Level Sets

Cet article introduit et analyse le concept mathématique inédit de « ensembles de niveaux dynamiques », qui repose sur le principe d'automodification pour expliquer comment un processus physique incomputable peut reconfigurer un ensemble logique invariant à chaque étape, élargissant ainsi la portée de la théorie de la calculabilité au-delà des résultats classiques sur les machines de Turing probabilistes.

Michael Stephen Fiske2026-03-03🔢 math-ph

Deepfake Word Detection by Next-token Prediction using Fine-tuned Whisper

Cet article présente une méthode rentable de détection de mots deepfake qui consiste à affiner le modèle Whisper pour identifier les mots synthétiques lors de la transcription par prédiction de jeton suivant, en utilisant des données partiellement vocodées pour réduire les coûts de collecte, tout en démontrant des performances compétitives sur des données in-domaine et un potentiel de généralisation à améliorer sur des données out-of-domaine.

Hoan My Tran, Xin Wang, Wanying Ge + 2 more2026-03-03⚡ eess

Iterative LLM-based improvement for French Clinical Interview Transcription and Speaker Diarization

Cette étude propose une architecture de post-traitement itérative basée sur un LLM (Qwen3-Next-80B) qui alterne la reconnaissance des locuteurs et des mots pour améliorer significativement la précision de la transcription et du diarisation des conversations cliniques françaises, réduisant les erreurs de diarisation tout en restant viable pour un déploiement hors ligne.

Ambre Marie, Thomas Bertin, Guillaume Dardenne + 1 more2026-03-03⚡ eess

← Précédent Suivant →