cs.CL articles | Gist.Science

EnsembleLink: Accurate Record Linkage Without Training Data

L'article présente EnsembleLink, une méthode de liaison de données précise qui exploite les modèles de langage pré-entraînés pour atteindre des performances élevées sans nécessiter de données d'entraînement étiquetées.

Noah Dasanaike2026-03-03💬 cs.CL

Learn-to-Distance: Distance Learning for Detecting LLM-Generated Text

Cet article présente « Learn-to-Distance », une nouvelle méthode de détection de textes générés par des modèles de langage (LLM) qui utilise une approche géométrique pour apprendre adaptivement la distance entre un texte original et sa version réécrite, surpassant ainsi les algorithmes de base existants.

Hongyi Zhou, Jin Zhu, Kai Ye + 3 more2026-03-03📊 stat

From Generative Modeling to Clinical Classification: A GPT-Based Architecture for EHR Notes

Cette étude propose une architecture de classification de textes cliniques basée sur un modèle GPT pré-entraîné et adapté via un fine-tuning sélectif, démontrant ainsi une méthode efficace et économe en ressources pour l'analyse de notes médicales non structurées, en particulier sur des données de rapports de radiologie.

Fariba Afrin Irany, Sampson Akwafuo2026-03-03💬 cs.CL

When Agents "Misremember" Collectively: Exploring the Mandela Effect in LLM-based Multi-Agent Systems

Cet article présente MANBENCH, un nouveau benchmark conçu pour étudier et atténuer l'effet Mandela dans les systèmes multi-agents basés sur les grands modèles de langage, en identifiant ses causes et en proposant des stratégies de défense qui réduisent ce biais de 74,40 %.

Naen Xu, Hengyu An, Shuo Shi + 7 more2026-03-03💬 cs.CL

Out of the Memory Barrier: A Highly Memory Efficient Training System for LLMs with Million-Token Contexts

Ce papier présente OOMB, un système d'entraînement économe en mémoire pour les grands modèles de langage qui permet de gérer des contextes de plusieurs millions de tokens sur une seule carte graphique grâce à une architecture de récurrentité par blocs, une recomputation dynamique des activations et une gestion optimisée du cache KV.

Wenhao Li, Daohai Yu, Gen Luo + 7 more2026-03-03💬 cs.CL

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Ce papier présente le benchmark VDR-Bench, conçu pour évaluer de manière plus réaliste les capacités de recherche visuelle et textuelle des modèles de langage multimodaux en surmontant les limites des benchmarks existants, tout en proposant une méthode de recherche par recadrage itératif pour améliorer leurs performances.

Yu Zeng, Wenxuan Huang, Zhen Fang + 14 more2026-03-03💬 cs.CL

WAXAL: A Large-Scale Multilingual African Language Speech Corpus

Ce papier présente WAXAL, un corpus de parole multilingue à grande échelle et open source couvrant 24 langues africaines avec des données pour la reconnaissance et la synthèse vocale, conçu pour réduire la fracture numérique et favoriser le développement de technologies inclusives.

Abdoulaye Diack, Perry Nelson, Kwaku Agbesi + 40 more2026-03-03⚡ eess

FASA: Frequency-aware Sparse Attention

FASA est un cadre innovant qui résout le goulot d'étranglement de la mémoire des modèles de langage à contexte long en exploitant la parcimonie fonctionnelle au niveau des chunks de fréquence (FC) pour éliminer dynamiquement et efficacement les tokens non essentiels, atteignant ainsi des performances quasi-oracles avec une réduction significative de l'empreinte mémoire.

Yifei Wang, Yueqi Wang, Zhenrui Yue + 6 more2026-03-03💬 cs.CL

Universal Robust Speech Adaptation for Cross-Domain Speech Recognition and Enhancement

Ce papier présente URSA-GAN, un cadre génératif unifié qui utilise une architecture à double encodage et une perturbation stochastique dynamique pour adapter robustement la reconnaissance et l'amélioration de la parole à des conditions de bruit et de canal inconnues, réduisant ainsi significativement les erreurs et améliorant les métriques perceptuelles.

Chien-Chun Wang, Hung-Shin Lee, Hsin-Min Wang + 1 more2026-03-03⚡ eess

Investigating Disability Representations in Text-to-Image Models

Cette étude examine les représentations des personnes handicapées dans les modèles de génération d'images comme Stable Diffusion XL et DALL-E 3, révélant des déséquilibres persistants et soulignant la nécessité d'évaluations continues pour promouvoir des portrayals plus inclusifs.

Yang Tian, Yu Fan, Liudmila Zavolokina + 1 more2026-03-03💬 cs.CL

Online Causal Kalman Filtering for Stable and Effective Policy Optimization

Ce papier propose KPO, une méthode d'optimisation de politique stable et efficace pour les grands modèles de langage qui utilise un filtrage de Kalman causal en ligne pour lisser les ratios d'importance sampling et corriger les déviations hors politique locales, surpassant ainsi les méthodes actuelles sur des tâches de raisonnement mathématique.

Shuo He, Lang Feng, Xin Cheng + 2 more2026-03-03💬 cs.CL

MiniCPM-SALA: Hybridizing Sparse and Linear Attention for Efficient Long-Context Modeling

Ce papier présente MiniCPM-SALA, une architecture hybride de 9 milliards de paramètres combinant l'attention sparse et linéaire pour permettre un traitement efficace de contextes ultra-long jusqu'à 1 million de tokens tout en réduisant les coûts d'entraînement de 75 % par rapport à un entraînement à partir de zéro.

MiniCPM Team, Wenhao An, Yingfa Chen + 44 more2026-03-03💬 cs.CL

Unleashing Low-Bit Inference on Ascend NPUs: A Comprehensive Evaluation of HiFloat Formats

Cette étude évalue les formats HiFloat (HiF8 et HiF4) sur les NPU Ascend pour l'inférence de grands modèles de langage, démontrant leur supériorité dans la gestion des données à forte variance et leur capacité à éviter l'effondrement de la précision en 4 bits par rapport aux formats entiers, tout en restant compatibles avec les cadres de quantification actuels.

Pengxiang Zhao, Hui-Ling Zhen, Xing Li + 10 more2026-03-03💬 cs.CL

Are LLMs Ready to Replace Bangla Annotators?

Cette étude démontre que les grands modèles de langage ne sont pas encore prêts à remplacer les annotateurs humains pour la détection de discours haineux en bengali, révélant des biais significatifs et une instabilité des jugements qui ne s'améliorent pas nécessairement avec l'échelle du modèle.

Md. Najib Hasan, Touseef Hasan, Souvika Sarkar2026-03-03💬 cs.CL

Large Language Models are Algorithmically Blind

Cette étude révèle que les grands modèles de langage souffrent d'une « cécité algorithmique » fondamentale, échouant systématiquement à raisonner correctement sur les processus computationnels malgré leurs vastes connaissances déclaratives.

Sohan Venkatesh, Ashish Mahendran Kurapath, Tejas Melkote2026-03-03💬 cs.CL

Dynamic Level Sets

Cet article introduit et analyse le concept mathématique inédit de « ensembles de niveaux dynamiques », qui repose sur le principe d'automodification pour expliquer comment un processus physique incomputable peut reconfigurer un ensemble logique invariant à chaque étape, élargissant ainsi la portée de la théorie de la calculabilité au-delà des résultats classiques sur les machines de Turing probabilistes.

Michael Stephen Fiske2026-03-03🔢 math-ph

Deepfake Word Detection by Next-token Prediction using Fine-tuned Whisper

Cet article présente une méthode rentable de détection de mots deepfake qui consiste à affiner le modèle Whisper pour identifier les mots synthétiques lors de la transcription par prédiction de jeton suivant, en utilisant des données partiellement vocodées pour réduire les coûts de collecte, tout en démontrant des performances compétitives sur des données in-domaine et un potentiel de généralisation à améliorer sur des données out-of-domaine.

Hoan My Tran, Xin Wang, Wanying Ge + 2 more2026-03-03⚡ eess

Iterative LLM-based improvement for French Clinical Interview Transcription and Speaker Diarization

Cette étude propose une architecture de post-traitement itérative basée sur un LLM (Qwen3-Next-80B) qui alterne la reconnaissance des locuteurs et des mots pour améliorer significativement la précision de la transcription et du diarisation des conversations cliniques françaises, réduisant les erreurs de diarisation tout en restant viable pour un déploiement hors ligne.

Ambre Marie, Thomas Bertin, Guillaume Dardenne + 1 more2026-03-03⚡ eess

LIDS: LLM Summary Inference Under the Layered Lens

Cet article présente LIDS, une nouvelle méthode d'inférence de résumés par les grands modèles de langage qui combine une métrique de direction basée sur la SVD de BERT et l'algorithme SOFARI pour évaluer avec précision et interprétabilité la qualité des résumés tout en contrôlant le taux de fausses découvertes.

Dylan Park, Yingying Fan, Jinchi Lv2026-03-03📊 stat

FeynTune: Large Language Models for High-Energy Theory

Ce papier présente FeynTune, une série de modèles de langage spécialisés en physique théorique des hautes énergies, obtenus par affinage de Llama-3.1 sur des résumés d'arXiv, qui surpassent le modèle de base et les grands modèles commerciaux sur des tâches de complétion de résumés dans ce domaine.

Paul Richmond, Prarit Agarwal, Borun Chowdhury + 2 more2026-03-02⚛️ hep-th

← Précédent Suivant →