cs.CL papers | Gist.Science

Build, Borrow, or Just Fine-Tune? A Political Scientist's Guide to Choosing NLP Models

Dit paper biedt politiekwetenschappers een praktisch beslissingskader voor het kiezen tussen het bouwen, lenen of fijnstemmen van NLP-modellen, waarbij een experiment met conflictgegevens aantoont dat een gefine-tuned ModernBERT-model bijna net zo goed presteert als een gespecialiseerd model, tenzij het gaat om zeldzame gebeurtenisclassificaties.

Shreyas MeherWed, 11 Ma💬 cs.CL

Surgical Repair of Collapsed Attention Heads in ALiBi Transformers

Dit paper introduceert een chirurgische herinitialisatietechniek die de systematische instorting van 31-44% van de aandachtskoppen in ALiBi-gebaseerde BLOOM-modellen corrigeert door gerichte herschikking van Q/K/V-parameters, waardoor de operationele capaciteit van het model aanzienlijk wordt hersteld en de prestaties op trainingsperplexiteit met 25% worden verbeterd.

Palmer SchallonWed, 11 Ma💬 cs.CL

X-GS: An Extensible Open Framework Unifying 3DGS Architectures with Downstream Multimodal Models

Dit paper introduceert X-GS, een uitbreidbaar open raamwerk dat 3D-Gaussische splatting (3DGS) verenigt met multimodale modellen via een efficiënte pijplijn die real-time semantische 3D-scènes genereert uit ongepositioneerde video's voor downstream-taken zoals objectdetectie en embodied AI.

Yueen Ma, Irwin KingWed, 11 Ma💬 cs.CL

Tracking Cancer Through Text: Longitudinal Extraction From Radiology Reports Using Open-Source Large Language Models

Dit artikel presenteert een volledig open-source, lokaal inzetbaar systeem dat de Qwen2.5-72B-taalmodel gebruikt om uit radiologieverslagen longitudinale tumorinformatie volgens RECIST-criteria te extraheren met hoge nauwkeurigheid, waardoor privacy en reproduceerbaarheid in de gezondheidszorg worden gewaarborgd.

Luc Builtjes, Alessa HeringWed, 11 Ma💬 cs.CL

Understanding the Interplay between LLMs' Utilisation of Parametric and Contextual Knowledge: A keynote at ECIR 2025

Deze keynote op ECIR 2025 belicht het onderzoek naar de interactie tussen parametrische en contextuele kennis in taalmodellen, met name gericht op het diagnosticeren van kennisconflicten en het begrijpen van hoe modellen context integreren of negeren.

Isabelle AugensteinWed, 11 Ma💬 cs.CL

Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

Deze studie introduceert een geautomatiseerd classificatiekader voor het beheer van hartklierenrisico bij ouderen, waarbij een aangepaste Transformer-architectie die lange contextuele afhankelijkheden in ongestructureerde patiëntendossiers verwerkt, superieure prestaties levert ten opzichte van traditionele methoden en generatieve grote taalmodellen.

Jacopo Vitale, David Della Morte, Luca Bacco, Mario Merone, Mark de Groot, Saskia Haitjema, Leandro Pecchia, Bram van EsWed, 11 Ma🤖 cs.AI

Fusing Semantic, Lexical, and Domain Perspectives for Recipe Similarity Estimation

Dit onderzoek presenteert een methode om recepten te vergelijken door semantische, lexische en domeinspecifieke aspecten te combineren, wat wordt gevalideerd door experts en nuttig is voor gepersonaliseerde voeding en automatische receptgeneratie.

Denica Kjorvezir, Danilo Najkov, Eva Valencič, Erika Jesenko, Barbara Koroišic Seljak, Tome Eftimov, Riste StojanovWed, 11 Ma💬 cs.CL

ESAinsTOD: A Unified End-to-End Schema-Aware Instruction-Tuning Framework for Task-Oriented Dialog Modeling

Dit paper introduceert ESAinsTOD, een uniek end-to-end raamwerk voor taakgericht dialogen dat door middel van instructie- en schema-aanpassing grote taalmodellen in staat stelt om zich flexibel aan te passen aan diverse scenario's, superieure prestaties te leveren op bestaande benchmarks en robuust te zijn in low-resource en ruisige omgevingen.

Dechuan Teng, Chunlin Lu, Libo Qin, Wanxiang CheWed, 11 Ma🤖 cs.AI

ActiveUltraFeedback: Efficient Preference Data Generation using Active Learning

Dit paper introduceert ActiveUltraFeedback, een modulaire actieve leer-pijplijn die onzekerheidsschattingen en nieuwe selectiemethoden gebruikt om het labelen van voorkeursdata voor het uitlijnen van grote taalmodellen aanzienlijk te versnellen en te optimaliseren met slechts een fractie van de benodigde annotatie.

Davit Melikidze, Marian Schneider, Jessica Lam, Martin Wertich, Ido Hakimi, Barna Pásztor, Andreas KrauseWed, 11 Ma🤖 cs.AI

Mousse: Rectifying the Geometry of Muon with Curvature-Aware Preconditioning

Dit paper introduceert Mousse, een nieuwe optimizer die de stabiliteit van Muon combineert met de geometrische aanpassing van Shampoo door spectrale updates uit te voeren in een witgemaakte coördinatenruimte, wat leidt tot een aanzienlijke versnelling van het trainingsproces voor taalmodellen zonder noemenswaardige rekenkosten.

Yechen Zhang, Shuhao Xing, Junhao Huang, Kai Lv, Yunhua Zhou, Xipeng Qiu, Qipeng Guo, Kai ChenWed, 11 Ma🤖 cs.AI

Evaluation of LLMs in retrieving food and nutritional context for RAG systems

Deze studie toont aan dat grote taalmodellen (LLMs) effectief kunnen worden ingezet in RAG-systemen voor het vertalen van natuurlijke taal naar gestructureerde metadata om voedsel- en voedingsgegevens te raadplegen, hoewel hun betrouwbaarheid afneemt bij complexe vragen met beperkingen die niet direct in de metadata-formaat kunnen worden uitgedrukt.

Maks Požarnik Vavken, Matevž Ogrinc, Tome Eftimov, Barbara Koroušic SeljakWed, 11 Ma💬 cs.CL

MUGEN: Evaluating and Improving Multi-audio Understanding of Large Audio-Language Models

Dit paper introduceert MUGEN, een benchmark die de beperkingen van grote audio-taalmodellen bij het verwerken van meerdere simultane audio-invoeren blootlegt en aantoont dat trainingsvrije strategieën zoals Audio-Permutational Self-Consistency de prestaties aanzienlijk verbeteren.

Chih-Kai Yang, Yun-Shao Tsai, Yu-Kai Guo, Ping-Le Tsai, Yen-Ting Piao, Hung-Wei Chen, Ting-Lin Hsiao, Yun-Man Hsu, Ke-Han Lu, Hung-yi LeeWed, 11 Ma🤖 cs.AI

RbtAct: Rebuttal as Supervision for Actionable Review Feedback Generation

Dit paper introduceert RbtAct, een methode die gebruikmaakt van auteursrebuttals als impliciete supervisie om grote taalmodellen te trainen in het genereren van specifiekere en actievere peer-review feedback.

Sihong Wu, Yiling Ma, Yilun Zhao, Tiansheng Hu, Owen Jiang, Manasi Patwardhan, Arman CohanWed, 11 Ma🤖 cs.AI

EXPLORE-Bench: Egocentric Scene Prediction with Long-Horizon Reasoning

Dit paper introduceert EXPLORE-Bench, een benchmark voor het evalueren van het vermogen van multimodale grote taalmodellen tot lang-horizon redenering in egocentrische omgevingen, en toont aan dat deze modellen significant achterblijven bij menselijke prestaties ondanks verbeteringen door stapsgewijze redenering.

Chengjun Yu, Xuhan Zhu, Chaoqun Du, Pengfei Yu, Wei Zhai, Yang Cao, Zheng-Jun ZhaWed, 11 Ma🤖 cs.AI

Beyond Fine-Tuning: Robust Food Entity Linking under Ontology Drift with FoodOntoRAG

Dit paper introduceert FoodOntoRAG, een fijnstemmingsvrij RAG-pipeline dat robuuste food entity linking bereikt door een hybride zoek- en agent-systeem te gebruiken voor few-shot matching met ontologieën, waardoor de kosten worden verlaagd en de weerstand tegen ontologie-drift wordt verbeterd.

Jan Drole, Ana Gjorgjevikj, Barbara Korouši'c Seljak, Tome EftimovWed, 11 Ma💬 cs.CL

EPIC-EuroParl-UdS: Information-Theoretic Perspectives on Translation and Interpreting

Dit artikel introduceert de geüpdatete en gecombineerde EPIC-EuroParl-UdS-corpora voor Engels en Duits, die zijn aangepast met nieuwe annotaties en informatie-theoretische maatstaven om onderzoek te ondersteunen naar taalvariatie, vertaling en het voorspellen van vullende woorden in tolken.

Maria Kunilovskaya, Christina PollkläsenerWed, 11 Ma💬 cs.CL

MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations

Dit paper introduceert MITRA, een lokaal gehoste RAG-gebaseerde AI-assistent die gebruikmaakt van een geautomatiseerde documentpypeline en een tweelaagse vectordatabase om veilig en nauwkeurig contextbewuste vragen te beantwoorden over fysicanalyses binnen grote wetenschappelijke samenwerkingen zoals CMS.

Abhishikth Mallampalli, Sridhara DasuWed, 11 Ma🤖 cs.AI

One-Eval: An Agentic System for Automated and Traceable LLM Evaluation

Dit paper introduceert One-Eval, een agentisch systeem dat natuurlijke taalverzoeken omzet in traceerbare en aanpasbare evaluatieworkflows voor grote taalmodellen, waardoor de handmatige inspanning voor benchmarkselectie, dataverwerking en rapportage aanzienlijk wordt verminderd.

Chengyu Shen, Yanheng Hou, Minghui Pan, Runming He, Zhen Hao Wong, Meiyi Qiang, Zhou Liu, Hao Liang, Peichao Lai, Zeang Sheng, Wentao ZhangWed, 11 Ma💬 cs.CL

Chow-Liu Ordering for Long-Context Reasoning in Chain-of-Agents

Dit paper introduceert een Chow-Liu-baas voor het ordenen van tekstchunks in Chain-of-Agents-systemen, waarbij een breedte-eerst-doorloop van de afgeleide afhankelijkheidsboom de informatieverlies minimaliseert en consequent betere prestaties levert dan standaard of semantische ordeningsmethodes op lange-contexttaken.

Naman Gupta, Vaibhav Singh, Arun Iyer, Kirankumar Shiragur, Pratham Grover, Ramakrishna B. Bairi, Ritabrata Maiti, Sankarshan Damle, Shachee Mishra Gupta, Rishikesh Maurya, Vageesh D. CWed, 11 Ma💬 cs.CL

N-gram-like Language Models Predict Reading Time Best

Dit artikel toont aan dat taalmodellen die het meest lijken op n-gramstatistieken, de leestijden bij het lezen van natuurlijke tekst het beste voorspellen, omdat leestijden gevoeliger zijn voor eenvoudige statistieken dan voor de complexe patronen van geavanceerde transformer-modellen.

James A. Michaelov, Roger P. LevyWed, 11 Ma💬 cs.CL

← Vorige Volgende →