cs.CL articles | Gist.Science

RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs

Le papier présente RexDrug, un cadre d'extraction de relations amélioré par le raisonnement et basé sur des modèles de langage de grande taille, qui surpasse les méthodes existantes pour l'extraction fiable de combinaisons médicamenteuses complexes (n-aires) à partir de la littérature biomédicale grâce à une stratégie d'entraînement en deux étapes combinant un mécanisme collaboratif multi-agents et un apprentissage par renforcement.

Zhijun Wang, Ling Luo, Dinghao Pan, Huan Zhuang, Lejing Yu, Yuanyuan Sun, Hongfei Lin2026-03-10💬 cs.CL

Is continuous CoT better suited for multi-lingual reasoning?

Cette étude démontre que le raisonnement en chaîne continu (Continuous Chain-of-Thought) surpasse le raisonnement explicite en termes de robustesse multilingue, notamment pour les langues à ressources limitées, tout en offrant une compression des traces de raisonnement de 29 à 50 fois.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

TildeOpen LLM: Leveraging Curriculum Learning to Achieve Equitable Language Representation

Le papier présente TildeOpen LLM, un modèle de langage open-weight de 30 milliards de paramètres optimisé pour 34 langues européennes grâce à l'apprentissage par curriculum et à l'échantillonnage de données, permettant d'atteindre des performances supérieures et une équité linguistique accrue avec des ressources de calcul réduites.

Toms Bergmanis, Martins Kronis, Ingus J\=anis Pretkalninš, D\=avis Nicmanis, Jelizaveta Jelinska, Roberts Rozis, Rinalds V\=iksna, M\=arcis Pinnis2026-03-10💬 cs.CL

Supporting Workflow Reproducibility by Linking Bioinformatics Tools across Papers and Executable Code

Ce papier présente CoPaLink, une approche automatisée qui améliore la reproductibilité des workflows bioinformatiques en reliant les mentions d'outils dans les articles scientifiques à leur implémentation dans le code exécutable grâce à la reconnaissance d'entités nommées et à l'ancrage sur des bases de connaissances.

Clémence Sebe, Olivier Ferret, Aurélie Névéol, Mahdi Esmailoghli, Ulf Leser, Sarah Cohen-Boulakia2026-03-10💬 cs.CL

The Conundrum of Trustworthy Research on Attacking Personally Identifiable Information Removal Techniques

Cet article met en lumière les limites méthodologiques actuelles des recherches sur les attaques de reconstruction de données PII, soulignant que l'absence de données privées accessibles et reproductibles empêche une évaluation véritablement fiable de l'efficacité des techniques de suppression de données personnelles.

Sebastian Ochs, Ivan Habernal2026-03-10💬 cs.CL

DualTurn: Learning Turn-Taking from Dual-Channel Generative Speech Pretraining

Le papier présente DualTurn, un modèle préentraîné sur des conversations audio à double canal qui génère de manière autonome les futures paroles des deux interlocuteurs pour apprendre implicitement la dynamique conversationnelle et prédire avec précision les signaux de prise de parole, surpassant ainsi les approches existantes en réduisant les interruptions et en anticipant plus tôt les transitions.

Shangeth Rajaa2026-03-10💬 cs.CL

Quantifying Cross-Lingual Transfer in Paralinguistic Speech Tasks

Cet article introduit la Matrice de Transfert Interlinguistique (CLTM), une méthode systématique pour quantifier les interactions entre paires de langues dans des tâches paralinguistiques, révélant que l'impact des données d'une langue source sur les performances d'une langue cible varie de manière significative selon la tâche et la langue, contredisant ainsi l'idée que ces tâches sont purement agnostiques à la langue.

Pol Buitrago, Oriol Pareras, Federico Costa, Javier Hernando2026-03-10💬 cs.CL

Fibration Policy Optimization

Ce papier propose Fibration Policy Optimization (FiberPO), un cadre unifié qui intègre la théorie des régions de confiance et une structure algébrique de fibrés pour optimiser les politiques des grands modèles de langage à travers plusieurs échelles hiérarchiques, de la tokenisation jusqu'aux domaines entiers.

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Sensivity of LLMs' Explanations to the Training Randomness:Context, Class & Task Dependencies

Cette étude démontre que la sensibilité des explications des modèles de langage aux aléas d'entraînement varie statistiquement de manière significative selon le contexte syntaxique, les classes et les tâches, cette dernière ayant l'impact le plus important.

Romain Loncour, Jérémie Bogaert, François-Xavier Standaert2026-03-10💬 cs.CL

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

Ce papier propose un cadre d'apprentissage de la reconnaissance audiovisuelle de la parole pour des langues sans ressources, en générant des flux visuels synthétiques par synchronisation labiale d'images statiques avec de l'audio réel, permettant d'entraîner un modèle performant sur le catalan sans corpus vidéo annoté.

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier Hernando2026-03-10💬 cs.CL

Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement

Le papier présente CoFiCot, un cadre adaptatif de raffinement grossier-à-fin qui alloue dynamiquement des ressources de calcul en fonction de la difficulté des requêtes, en triant les questions via un classificateur multi-métrique et en appliquant une correction contextuelle étatique pour éviter la fragmentation du contexte tout en assurant la cohérence logique.

Dongxu Zhang, Hongqiang Lin, Yiding Sun, Pengyu Wang, Qirui Wang, Ning Yang, Jihua Zhu2026-03-10💬 cs.CL

NCL-UoR at SemEval-2026 Task 5: Embedding-Based Methods, Fine-Tuning, and LLMs for Word Sense Plausibility Rating

Ce papier présente la participation de NCL-UoR à la tâche 5 de SemEval-2026 sur l'évaluation de la plausibilité des sens des mots, démontrant qu'une stratégie d'incitation structurée avec des règles de décision surpasse les méthodes d'embedding et le fine-tuning, révélant que la conception de l'incitation est plus déterminante que l'échelle du modèle.

Tong Wu, Thanet Markchom, Huizhi Liang2026-03-10💬 cs.CL

How Much Do LLMs Hallucinate in Document Q&A Scenarios? A 172-Billion-Token Study Across Temperatures, Context Lengths, and Hardware Platforms

Cette étude de 172 milliards de tokens, menée sur 35 modèles avec la méthodologie RIKER, révèle que les hallucinations dans les réponses documentaires augmentent considérablement avec la longueur du contexte, varient principalement selon le choix du modèle plutôt que la taille ou le matériel, et que l'ajustement de la température permet de réduire les boucles infinies au détriment d'une précision légèrement moindre.

JV Roig2026-03-10💬 cs.CL

AdaCultureSafe: Adaptive Cultural Safety Grounded by Cultural Knowledge in Large Language Models

L'article AdaCultureSafe propose un cadre intégrant connaissances et sécurité culturelles pour pallier le manque de corrélation entre ces deux aspects dans les grands modèles de langage, en s'appuyant sur un nouveau jeu de données vérifié manuellement et une méthode d'alignement qui améliore significativement la sécurité culturelle en ancrant les réponses dans des connaissances culturelles précises.

Hankun Kang, Di Lin, Zhirong Liao, Pengfei Bai, Xinyi Zeng, Jiawei Jiang, Yuanyuan Zhu, Tieyun Qian2026-03-10💬 cs.CL

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Cette étude évalue la capacité des modèles de langage à réviser des propositions de subventions EPSRC via des perturbations structurées, révélant que l'approche par sections surpasse les autres architectures mais que les systèmes actuels manquent de fiabilité et privilégient la conformité plutôt que l'évaluation holistique.

William Thorne, Joseph James, Yang Wang, Chenghua Lin, Diana Maynard2026-03-10💬 cs.CL

Using Multimodal and Language-Agnostic Sentence Embeddings for Abstractive Summarization

Le papier présente SBARThez, un cadre novateur d'abstractive multilingue et multimodal basé sur BART et enrichi par une injection d'entités nommées, qui améliore la cohérence factuelle et la concision des résumés, notamment pour les langues à ressources limitées.

Chaimae Chellaf, Salima Mdhaffar, Yannick Estève, Stéphane Huet2026-03-10💬 cs.CL

LAMUS: A Large-Scale Corpus for Legal Argument Mining from U.S. Caselaw using LLMs

Ce papier présente LAMUS, un corpus à grande échelle pour l'extraction d'arguments juridiques à partir de décisions judiciaires américaines, construit grâce à une pipeline combinant collecte de données, annotation automatisée par des modèles de langage et raffinement humain, afin de pallier le manque de ressources annotées pour la recherche en TAL juridique.

Serene Wang, Lavanya Pobbathi, Haihua Chen2026-03-10💬 cs.CL

Learning Multiple Utterance-Level Attribute Representations with a Unified Speech Encoder

Cet article propose un cadre d'entraînement postérieur unifié permettant à un modèle de base de la parole unique de générer simultanément plusieurs représentations de niveau énonciatif, telles que sémantiques et parleur, pour améliorer les tâches de recherche multilingue et de reconnaissance vocale.

Maryem Bouziane, Salima Mdhaffar, Yannick Estève2026-03-10💬 cs.CL

SlowBA: An efficiency backdoor attack towards VLM-based GUI agents

Ce papier présente SlowBA, une nouvelle attaque par porte dérobée qui cible l'efficacité des agents d'interface graphique basés sur des modèles vision-langage en induisant des chaînes de raisonnement excessivement longues via des déclencheurs discrets, augmentant ainsi considérablement la latence de réponse tout en préservant la précision des tâches.

Junxian Li, Tu Lan, Haozhen Tan, Yan Meng, Haojin Zhu2026-03-10💬 cs.CL

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

Le papier présente SPD-RAG, un cadre hiérarchique multi-agents qui améliore la qualité et l'efficacité des systèmes de génération augmentée par la récupération (RAG) pour les questions complexes sur de vastes corpus de documents en traitant chaque document via un agent dédié et en fusionnant leurs réponses partielles.

Yagiz Can Akay, Muhammed Yusuf Kartal, Esra Alparslan, Faruk Ortakoyluoglu, Arda Akpinar2026-03-10💬 cs.CL

← Précédent Suivant →