Scaling Self-Supervised Speech Models Uncovers Deep Linguistic Relationships: Evidence from the Pacific Cluster

Het onderzoek toont aan dat het opschalen van zelftoezichtende spraakmodellen naar 4.017 talen een niet-lineaire verschuiving teweegbrengt die diepgaande genealogische relaties en complexe taalcontacten blootlegt, met name door de vorming van een robuust macro-cluster in de Stille Oceaan dat gedeelde akoestische kenmerken vastlegt.

Minu Kim, Hoirin Kim, David R. Mortensen2026-03-10💬 cs.CL

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Dit artikel onderzoekt domeinspecifieke kwaliteitsschatting voor machinevertaling in laag-resourced scenario's tussen het Engels en Indic-talen, waarbij wordt aangetoond dat het aanpassen van tussenliggende lagen van open-source taalmodellen via Low-Rank Adaptatie (ALOPE en LoRMA) robuustere resultaten oplevert dan prompt-only methoden, vooral in complexe domeinen zoals gezondheidszorg en recht.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

Dit SoK-papier biedt het eerste unified framework voor Agentic RAG-systemen door deze te formaliseren als gedeeltelijk waarneembare Markov-beslissingsprocessen, een uitgebreide taxonomie te ontwikkelen, kritieke risico's zoals hallucinatie-propagatie te analyseren en een roadmap te schetsen voor toekomstig onderzoek naar betrouwbare en schaalbare autonome systemen.

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

Can Large Language Models Keep Up? Benchmarking Online Adaptation to Continual Knowledge Streams

Deze paper introduceert OAKS, een benchmark voor het evalueren van de online aanpassing van grote taalmodellen aan continu stromende kennis, en toont aan dat zowel state-of-the-art modellen als agente geheugensystemen moeite hebben met het accuraat volgen van dynamische feitenveranderingen.

Jiyeon Kim, Hyunji Lee, Dylan Zhou, Sue Hyun Park, Seunghyun Yoon, Trung Bui, Franck Dernoncourt, Sungmin Cha, Minjoon Seo2026-03-10💬 cs.CL

Generalization in Online Reinforcement Learning for Mobile Agents

Dit paper introduceert AndroidWorld-Generalization, een benchmark en een schaalbaar RL-trainingsysteem dat Group Relative Policy Optimization (GRPO) combineert om de generalisatie van vision-language-model agents voor mobiele apparaten te evalueren en te verbeteren, waarbij wordt aangetoond dat versterkte leerprestaties significant zijn voor onbekende taakinstanties maar nog beperkt blijven voor onbekende sjablonen en applicaties.

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Dit paper introduceert Dial, een kennisgebaseerd framework dat de vertaling van natuurlijke taal naar SQL voor verschillende database-systemen verbetert door dialectbewuste logica, een hiërarchische kennisbank en een uitvoeringsgedreven debugcyclus te combineren, wat resulteert in een aanzienlijke stijging van vertaalnauwkeurigheid en dialectondersteuning.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Skip to the Good Part: Representation Structure & Inference-Time Layer Skipping in Diffusion vs. Autoregressive LLMs

Deze studie toont aan dat diffusietaalmodellen door hun trainingsdoel een meer hiërarchische en redundante representatiestructuur bezitten dan autoregressieve modellen, wat een effectieve, cache-onafhankelijke inferentie-optimalisatie via statisch laagoverslaan mogelijk maakt zonder prestatieverlies.

Raghavv Goel, Risheek Garrepalli, Sudhanshu Agrawal, Chris Lott, Mingu Lee, Fatih Porikli2026-03-10💬 cs.CL

Bolbosh: Script-Aware Flow Matching for Kashmiri Text-to-Speech

In dit artikel presenteren de auteurs Bolbosh, het eerste open-source neurale tekst-naar-spraak-systeem voor het Kasjmiri, dat door middel van scriptbewuste stroommatching en een geoptimaliseerde verwerkingspijplijn aanzienlijk betere spraakkwaliteit bereikt dan bestaande meertalige basismodellen.

Tajamul Ashraf, Burhaan Rasheed Zargar, Saeed Abdul Muizz, Ifrah Mushtaq, Nazima Mehdi, Iqra Altaf Gillani, Aadil Amin Kak, Janibul Bashir2026-03-10💬 cs.CL