cs.CL papers | Gist.Science

Scaling Self-Supervised Speech Models Uncovers Deep Linguistic Relationships: Evidence from the Pacific Cluster

Het onderzoek toont aan dat het opschalen van zelftoezichtende spraakmodellen naar 4.017 talen een niet-lineaire verschuiving teweegbrengt die diepgaande genealogische relaties en complexe taalcontacten blootlegt, met name door de vorming van een robuust macro-cluster in de Stille Oceaan dat gedeelde akoestische kenmerken vastlegt.

Minu Kim, Hoirin Kim, David R. Mortensen2026-03-10💬 cs.CL

Taiwan Safety Benchmark and Breeze Guard: Toward Trustworthy AI for Taiwanese Mandarin

Deze paper introduceert TS-Bench, een benchmark voor Taiwanese Mandarin-veiligheid, en Breeze Guard, een op cultuur gebaseerd veiligheidsmodel dat aanzienlijk beter presteert dan algemene modellen bij het detecteren van lokale risico's zoals oplichting en desinformatie.

Po-Chun Hsu, Meng-Hsi Chen, Tsu Ling Chao, Chia Tien Han, Da-shan Shiu2026-03-10💬 cs.CL

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

Dit paper introduceert een derde ambitie voor kunstmatige intelligentie naast productiviteit en alignement, namelijk het gebruik van grote taalmodellen als wetenschappelijke instrumenten om menselijk gedrag, cultuur en morele redenering te bestuderen door de in hun training opgenomen symbolische patronen te analyseren.

W. Russell Neuman, Chad Coleman2026-03-10💬 cs.CL

To Predict or Not to Predict? Towards reliable uncertainty estimation in the presence of noise

Deze studie toont aan dat Monte Carlo dropout-technieken voor onzekerheidsschatting betrouwbaarder zijn dan softmax-gebaseerde methoden voor meertalige tekstclassificatie onder ruis en domeinverschuivingen, en dat het afzien van voorspellingen voor de meest onzekere instances de prestaties aanzienlijk verbetert.

Nouran Khallaf, Serge Sharoff2026-03-10💬 cs.CL

How Much Noise Can BERT Handle? Insights from Multilingual Sentence Difficulty Detection

Deze studie toont aan dat hoewel BERT-modellen inherent robuust zijn voor ruis bij het detecteren van zinsmoeilijkheid in meertalige data, het toepassen van specifieke denoising-technieken zoals GMM-filtering de prestaties aanzienlijk kan verbeteren, vooral bij kleinere datasets.

Nouran Khallaf, Serge Sharoff2026-03-10💬 cs.CL

RILEC: Detection and Generation of L1 Russian Interference Errors in English Learner Texts

Dit paper introduceert RILEC, een groot dataset en een generatief raamwerk voor het detecteren en simuleren van door het Russisch beïnvloerde fouten in Engelstalige teksten van lerenden, waarmee de prestaties van modellen voor het identificeren van dergelijke interferentiefouten aanzienlijk worden verbeterd.

Darya Kharlamova, Irina Proskurina2026-03-10💬 cs.CL

Position: LLMs Must Use Functor-Based and RAG-Driven Bias Mitigation for Fairness

Dit position paper pleit voor een tweeledige aanpak om bias in grote taalmodellen te bestrijden door categorietheoretische functors te combineren met retrieval-augmented generation (RAG) voor zowel structurele als contextuele rechtvaardigheid.

Ravi Ranjan, Utkarsh Grover, Agorista Polyzou2026-03-10💬 cs.CL

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Dit artikel onderzoekt domeinspecifieke kwaliteitsschatting voor machinevertaling in laag-resourced scenario's tussen het Engels en Indic-talen, waarbij wordt aangetoond dat het aanpassen van tussenliggende lagen van open-source taalmodellen via Low-Rank Adaptatie (ALOPE en LoRMA) robuustere resultaten oplevert dan prompt-only methoden, vooral in complexe domeinen zoals gezondheidszorg en recht.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

Dit SoK-papier biedt het eerste unified framework voor Agentic RAG-systemen door deze te formaliseren als gedeeltelijk waarneembare Markov-beslissingsprocessen, een uitgebreide taxonomie te ontwikkelen, kritieke risico's zoals hallucinatie-propagatie te analyseren en een roadmap te schetsen voor toekomstig onderzoek naar betrouwbare en schaalbare autonome systemen.

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

Can Large Language Models Keep Up? Benchmarking Online Adaptation to Continual Knowledge Streams

Deze paper introduceert OAKS, een benchmark voor het evalueren van de online aanpassing van grote taalmodellen aan continu stromende kennis, en toont aan dat zowel state-of-the-art modellen als agente geheugensystemen moeite hebben met het accuraat volgen van dynamische feitenveranderingen.

Jiyeon Kim, Hyunji Lee, Dylan Zhou, Sue Hyun Park, Seunghyun Yoon, Trung Bui, Franck Dernoncourt, Sungmin Cha, Minjoon Seo2026-03-10💬 cs.CL

AQuA: Toward Strategic Response Generation for Ambiguous Visual Questions

Dit paper introduceert AQuA, een gedetailleerd dataset en framework dat Vision-Language Models in staat stelt om ambiguïteit in visuele vragen te herkennen en strategisch te reageren door de juiste respons te kiezen, zoals het vragen om verduidelijking of het geven van alternatieve antwoorden, in plaats van overmoedig te antwoorden.

Jihyoung Jang, Hyounghun Kim2026-03-10💬 cs.CL

Generalization in Online Reinforcement Learning for Mobile Agents

Dit paper introduceert AndroidWorld-Generalization, een benchmark en een schaalbaar RL-trainingsysteem dat Group Relative Policy Optimization (GRPO) combineert om de generalisatie van vision-language-model agents voor mobiele apparaten te evalueren en te verbeteren, waarbij wordt aangetoond dat versterkte leerprestaties significant zijn voor onbekende taakinstanties maar nog beperkt blijven voor onbekende sjablonen en applicaties.

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning

Dit paper introduceert PACT, een fijnafstappingsframework dat veiligheidsdrift voorkomt door de betrouwbaarheid van het model op specifieke veiligheidstokens te regulariseren tijdens het trainen op onschadelijke data, waardoor de veiligheid behouden blijft zonder de prestaties op downstream-taken te schaden.

Guoli Wang, Haonan Shi, Tu Ouyang, An Wang2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Dit paper introduceert Dial, een kennisgebaseerd framework dat de vertaling van natuurlijke taal naar SQL voor verschillende database-systemen verbetert door dialectbewuste logica, een hiërarchische kennisbank en een uitvoeringsgedreven debugcyclus te combineren, wat resulteert in een aanzienlijke stijging van vertaalnauwkeurigheid en dialectondersteuning.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Image Generation Models: A Technical History

Dit paper biedt een uitgebreid technisch overzicht van de evolutie van beeldgeneratiemodellen, variërend van VAEs en GANs tot diffusiemodellen, inclusief hun architectuur, trainingsmethoden, beperkingen, recente doorbraken in videogenereatie en de noodzaak van verantwoord gebruik.

Rouzbeh Shirvani2026-03-10💬 cs.CL

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

Dit paper introduceert de Dual-Stream Transformer, een nieuwe architectuur die het residu-stroom ontbindt in een token-stroom en een context-stroom om een instelbare afweging tussen interpretatie en prestaties te bieden, waarbij specifieke mengstrategieën slechts een minimale kosten van 2,5% opleveren.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Cross-Modal Taxonomic Generalization in (Vision-) Language Models

Dit onderzoek toont aan dat taalkundige modellen binnen vision-language modellen hyperoniemen van objecten op afbeeldingen kunnen voorspellen en generaliseren, zelfs zonder expliciete training, dankzij een combinatie van taalkundige kennis en de coherentie van visuele input.

Tianyang Xu, Marcelo Sandoval-Castaneda, Karen Livescu, Greg Shakhnarovich, Kanishka Misra2026-03-10💬 cs.CL

Skip to the Good Part: Representation Structure & Inference-Time Layer Skipping in Diffusion vs. Autoregressive LLMs

Deze studie toont aan dat diffusietaalmodellen door hun trainingsdoel een meer hiërarchische en redundante representatiestructuur bezitten dan autoregressieve modellen, wat een effectieve, cache-onafhankelijke inferentie-optimalisatie via statisch laagoverslaan mogelijk maakt zonder prestatieverlies.

Raghavv Goel, Risheek Garrepalli, Sudhanshu Agrawal, Chris Lott, Mingu Lee, Fatih Porikli2026-03-10💬 cs.CL

A Joint Neural Baseline for Concept, Assertion, and Relation Extraction from Clinical Text

Dit paper introduceert een nieuw end-to-end systeem dat conceptherkenning, assertieclassificatie en relatie-extractie uit klinische tekst gezamenlijk optimaliseert, wat aanzienlijk betere resultaten oplevert dan bestaande pijplijnbenaderingen.

Fei Cheng, Ribeka Tanaka, Sadao Kurohashi2026-03-10💬 cs.CL

Bolbosh: Script-Aware Flow Matching for Kashmiri Text-to-Speech

In dit artikel presenteren de auteurs Bolbosh, het eerste open-source neurale tekst-naar-spraak-systeem voor het Kasjmiri, dat door middel van scriptbewuste stroommatching en een geoptimaliseerde verwerkingspijplijn aanzienlijk betere spraakkwaliteit bereikt dan bestaande meertalige basismodellen.

Tajamul Ashraf, Burhaan Rasheed Zargar, Saeed Abdul Muizz, Ifrah Mushtaq, Nazima Mehdi, Iqra Altaf Gillani, Aadil Amin Kak, Janibul Bashir2026-03-10💬 cs.CL

← Vorige Volgende →