cs.CL papers | Gist.Science

RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs

Dit paper introduceert RexDrug, een betrouwbaar framework dat grote taalmodellen met een redeneringsversterkende aanpak gebruikt om complexe, n-ary medicijncombinaties uit biomedische literatuur nauwkeurig te extraheren.

Zhijun Wang, Ling Luo, Dinghao Pan, Huan Zhuang, Lejing Yu, Yuanyuan Sun, Hongfei Lin2026-03-10💬 cs.CL

Is continuous CoT better suited for multi-lingual reasoning?

Dit onderzoek toont aan dat continu redeneren in een latente ruimte, in tegenstelling tot expliciete Chain-of-Thought, aanzienlijk robuustere en efficiëntere meertalige redeneercapaciteiten biedt, vooral voor taakgebieden met beperkte bronnen en in zero-shot scenario's.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

TildeOpen LLM: Leveraging Curriculum Learning to Achieve Equitable Language Representation

Dit artikel introduceert TildeOpen LLM, een open-weight foundation model met 30 miljard parameters dat door middel van curriculum learning en data-oversampling is getraind om de prestaties en taalevenwicht voor 34 Europese talen, met name minder gebruikte talen, aanzienlijk te verbeteren zonder extra rekencapaciteit.

Toms Bergmanis, Martins Kronis, Ingus J\=anis Pretkalninš, D\=avis Nicmanis, Jelizaveta Jelinska, Roberts Rozis, Rinalds V\=iksna, M\=arcis Pinnis2026-03-10💬 cs.CL

Supporting Workflow Reproducibility by Linking Bioinformatics Tools across Papers and Executable Code

Dit paper introduceert CoPaLink, een geautomatiseerde aanpak die bio-informatica-tools in werkstroomcode koppelt aan hun vermeldingen in wetenschappelijke artikelen om reproduceerbaarheid en transparantie te verbeteren.

Clémence Sebe, Olivier Ferret, Aurélie Névéol, Mahdi Esmailoghli, Ulf Leser, Sarah Cohen-Boulakia2026-03-10💬 cs.CL

The Conundrum of Trustworthy Research on Attacking Personally Identifiable Information Removal Techniques

Dit artikel betoogt dat de huidige evaluaties van aanvallen op PII-verwijeringstechnieken door datalekken en contaminatie vertekend zijn, en dat het gebrek aan toegang tot echte privédata het publieke onderzoek verhindert om de werkelijke privacybescherming van deze methoden betrouwbaar te verifiëren.

Sebastian Ochs, Ivan Habernal2026-03-10💬 cs.CL

DualTurn: Learning Turn-Taking from Dual-Channel Generative Speech Pretraining

DualTurn is een model dat door middel van generatieve pretraining op dubbelkanaals spraak natuurlijke wisselgesprekken leert en zo de onnatuurlijke stilte-tijdouten van traditionele spraakpijplijnen overbrugt door continue anticipatie op wisselpunten en het genereren van agent-acties.

Shangeth Rajaa2026-03-10💬 cs.CL

Quantifying Cross-Lingual Transfer in Paralinguistic Speech Tasks

Deze studie introduceert de Cross-Lingual Transfer Matrix (CLTM) om systematisch te kwantificeren hoe donor-taaldata de prestaties van paralinguïstische taken, zoals geslachtsidentificatie en sprekerverificatie, beïnvloedt bij cross-linguale overdracht, waarbij blijkt dat deze effecten systematisch en taalspecifiek zijn.

Pol Buitrago, Oriol Pareras, Federico Costa, Javier Hernando2026-03-10💬 cs.CL

Fibration Policy Optimization

Dit paper introduceert Fibration Policy Optimization (FiberPO), een unificerend framework dat trust-region theorie en een algebraïsche fibratiestructuur combineert om multi-schaal stabiliteitscontrole en verbeterde token-efficiëntie te bieden voor de optimalisatie van grote taalmodellen.

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Sensivity of LLMs' Explanations to the Training Randomness:Context, Class & Task Dependencies

Dit artikel toont aan dat de uitleg van transformermodellen statistisch significant beïnvloed wordt door trainingsrandomness, waarbij de taak de grootste invloed heeft, gevolgd door de klassen en ten slotte de context.

Romain Loncour, Jérémie Bogaert, François-Xavier Standaert2026-03-10💬 cs.CL

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

Dit paper introduceert een framework voor audiovisuele spraakherkenning in talen zonder bestaande video-corpora door gebruik te maken van synthetische visuele data gegenereerd via lip-syncing, wat resulteert in een model dat presteert op het niveau van de state-of-the-art met aanzienlijk minder trainingsdata.

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier Hernando2026-03-10💬 cs.CL

Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement

Dit paper introduceert CoFiCot, een adaptief framework dat de testtijd-berekening van LLM's optimaliseert door query's dynamisch te triageren op basis van moeilijkheidsgraad en vervolgens een stateful correctiecyclus toe te passen die granulaire foutlocatie combineert met globale logische coherentie.

Dongxu Zhang, Hongqiang Lin, Yiding Sun, Pengyu Wang, Qirui Wang, Ning Yang, Jihua Zhu2026-03-10💬 cs.CL

NCL-UoR at SemEval-2026 Task 5: Embedding-Based Methods, Fine-Tuning, and LLMs for Word Sense Plausibility Rating

Dit artikel presenteert de NCL-UoR-bijdrage aan SemEval-2026 Taak 5, waarbij wordt aangetoond dat gestructureerde promptontwerpen met expliciete besluitregels voor grote taalmodellen de beste prestaties leveren bij het beoordelen van de plausibiliteit van woordbetekenissen, en dat promptontwerp belangrijker is dan modelgrootte.

Tong Wu, Thanet Markchom, Huizhi Liang2026-03-10💬 cs.CL

How Much Do LLMs Hallucinate in Document Q&A Scenarios? A 172-Billion-Token Study Across Temperatures, Context Lengths, and Hardware Platforms

Deze studie, gebaseerd op een evaluatie van 172 miljard tokens, onthult dat hallucinaties in documentgebaseerde vragenbeantwoording aanzienlijk toenemen bij langere contextvensters en dat modelkeuze de belangrijkste factor is, terwijl hardwareplatforms en temperatuur-instellingen slechts een beperkt effect hebben op de nauwkeurigheid.

JV Roig2026-03-10💬 cs.CL

AdaCultureSafe: Adaptive Cultural Safety Grounded by Cultural Knowledge in Large Language Models

Dit paper introduceert AdaCultureSafe, een nieuw framework en dataset die culturele veiligheid en kennis in grote taalmodellen gezamenlijk modelleren, en aantoont dat het integreren van autoritaire culturele kennis essentieel is om veilige en respectvolle antwoorden te genereren.

Hankun Kang, Di Lin, Zhirong Liao, Pengfei Bai, Xinyi Zeng, Jiawei Jiang, Yuanyuan Zhu, Tieyun Qian2026-03-10💬 cs.CL

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Dit onderzoek toont aan dat hoewel LLM's nuttige aanvullende waarde kunnen bieden bij het beoordelen van EPSRC-subsidieaanvragen, hun prestaties sterk variëren en ze vooral gericht zijn op naleving in plaats van een holistische beoordeling, waarbij een sectievoor-bij-sectie-analyse de meest betrouwbare architectuur blijkt te zijn.

William Thorne, Joseph James, Yang Wang, Chenghua Lin, Diana Maynard2026-03-10💬 cs.CL

Using Multimodal and Language-Agnostic Sentence Embeddings for Abstractive Summarization

Dit artikel introduceert SBARThez, een nieuw raamwerk dat multimodale en taalagnostische zinsembeddings combineert met een Named Entity Injection-mechanisme om hallucinaties te verminderen en nauwkeurige, abstracte samenvattingen te genereren voor zowel tekst als spraak in meertalige contexten.

Chaimae Chellaf, Salima Mdhaffar, Yannick Estève, Stéphane Huet2026-03-10💬 cs.CL

LAMUS: A Large-Scale Corpus for Legal Argument Mining from U.S. Caselaw using LLMs

Dit paper introduceert LAMUS, een groot corpus voor juridisch argumentatie-mining in Amerikaanse rechtspraak, dat is opgebouwd met behulp van een datacentrische pijplijn met LLM's en menselijke validatie om de beperkingen aan grote, hoogwaardige datasets voor deze taak weg te nemen.

Serene Wang, Lavanya Pobbathi, Haihua Chen2026-03-10💬 cs.CL

Learning Multiple Utterance-Level Attribute Representations with a Unified Speech Encoder

Dit paper introduceert een unify post-training framework dat een enkel spraakfundamentmodel in staat stelt om meerdere soorten representaties op zinsniveau, zoals semantische en sprekerinformatie, te genereren voor effectieve multilinguale spraakzoekopdrachten en sprekerherkenning.

Maryem Bouziane, Salima Mdhaffar, Yannick Estève2026-03-10💬 cs.CL

SlowBA: An efficiency backdoor attack towards VLM-based GUI agents

Dit paper introduceert SlowBA, een nieuwe backdoor-aanval op VLM-gebaseerde GUI-agenten die de reactietijd aanzienlijk vertraagt door via een twee-trapsreinforcement learning-strategie specifieke triggers te gebruiken die lange redeneringsketens veroorzaken, terwijl de taaknauwkeurigheid behouden blijft.

Junxian Li, Tu Lan, Haozhen Tan, Yan Meng, Haojin Zhu2026-03-10💬 cs.CL

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

Het artikel introduceert SPD-RAG, een hiërarchisch multi-agent framework dat complexe vragen over meerdere documenten beantwoordt door elk document te laten verwerken door een gespecialiseerd agent, wat resulteert in een aanzienlijke verbetering van de antwoordkwaliteit en schaalbaarheid ten opzichte van bestaande RAG-methoden.

Yagiz Can Akay, Muhammed Yusuf Kartal, Esra Alparslan, Faruk Ortakoyluoglu, Arda Akpinar2026-03-10💬 cs.CL

← Vorige Volgende →