cs.CL papers | Gist.Science

GPUTOK: GPU Accelerated Byte Level BPE Tokenization

Dit paper introduceert GPUTOK, een GPU-versnelde byte-level BPE-tokenizer die bij lange contexten tot 7,6 keer sneller is dan bestaande CPU-oplossingen terwijl het de outputkwaliteit behoudt.

Venu Gopal Kadamba, Kanishkha Jaisankar2026-03-04💬 cs.CL

Think, But Don't Overthink: Reproducing Recursive Language Models

Deze studie toont aan dat het vergroten van de recursiediepte bij Recursive Language Models, ondanks de belofte van onbeperkte context, leidt tot 'overdenken' dat de prestaties op eenvoudige taken verslechtert en de uitvoeringstijd en kosten exponentieel doet stijgen.

Daren Wang2026-03-04💬 cs.CL

StitchCUDA: An Automated Multi-Agents End-to-End GPU Programing Framework with Rubric-based Agentic Reinforcement Learning

StitchCUDA is een geautomatiseerd multi-agent framework dat rubric-gebaseerde agente versterkende leer gebruikt om volledige, hoogpresterende GPU-programma's te genereren en zo de beperkingen van eerdere methoden die zich enkel op individuele kernels richtten, overbrugt.

Shiyang Li, Zijian Zhang, Winson Chen + 3 more2026-03-04💬 cs.CL

Credibility Governance: A Social Mechanism for Collective Self-Correction under Weak Truth Signals

Dit artikel introduceert Credibility Governance, een sociaal mechanisme dat collectieve zelfcorrectie bevordert door de invloed van actoren te herschikken op basis van hun langetermijnovereenstemming met bewijs, waardoor online platforms robuuster worden tegen manipulatie en valse informatie.

Wanying He, Yanxi Lin, Ziheng Zhou + 5 more2026-03-04💬 cs.CL

Real-Time Generation of Game Video Commentary with Multimodal LLMs: Pause-Aware Decoding Approaches

Deze paper introduceert een pause-bewuste, dynamische decodingstrategie voor multimodale grote taalmodellen die real-time gamecommentaar genereert dat qua timing en inhoud beter aansluit bij menselijke spraak zonder dat finetuning nodig is.

Anum Afzal, Yuki Saito, Hiroya Takamura + 5 more2026-03-04💬 cs.CL

Evaluating Cross-Modal Reasoning Ability and Problem Characteristics with Multimodal Item Response Theory

Deze paper introduceert M3IRT, een multimodaal en multidimensionaal item response theory-framework dat cross-modale redeneervermogens van multimodale grote taalmodellen nauwkeuriger evalueert en benchmarks optimaliseert door te onderscheiden tussen vragen die op basis van één modality of alleen door cross-modale integratie kunnen worden opgelost.

Shunki Uebayashi, Kento Masui, Kyohei Atarashi + 5 more2026-03-04💬 cs.CL

ITLC at SemEval-2026 Task 11: Normalization and Deterministic Parsing for Formal Reasoning in LLMs

Dit paper introduceert een methode voor ITLC bij SemEval-2026 Taak 11 die syllogismen omzet naar canonieke logische representaties en deterministische parsing toepast om inhoudseffecten in meertalige redeneertaken te verminderen, wat resulteert in top-5 prestaties zonder complexe fine-tuning.

Wicaksono Leksono Muhamad, Joanito Agili Lopo, Tack Hwa Wong + 2 more2026-03-04💬 cs.CL

HateMirage: An Explainable Multi-Dimensional Dataset for Decoding Faux Hate and Subtle Online Abuse

Dit paper introduceert HateMirage, een nieuw, verklaarbaar dataset van 4.530 YouTube-commentaren die subtiel haatzaaien op basis van desinformatie analyseren via drie dimensies (doelwit, intentie en implicatie) om de beperkingen van bestaande modellen voor overt haatzaaien te overbruggen.

Sai Kartheek Reddy Kasu, Shankar Biradar, Sunil Saumya + 1 more2026-03-04💬 cs.CL

Graph-GRPO: Stabilizing Multi-Agent Topology Learning via Group Relative Policy Optimization

Het artikel introduceert Graph-GRPO, een nieuw framework dat Group Relative Policy Optimization toepast om de stabiliteit en effectiviteit van het leren van communicatietopologieën in multi-agent systemen op basis van grote taalmodellen te verbeteren door relatieve prestaties binnen een groep van topologieën te gebruiken in plaats van absolute beloningen.

Yueyang Cang, Xiaoteng Zhang, Erlu Zhao + 7 more2026-03-04💬 cs.CL

Sensory-Aware Sequential Recommendation via Review-Distilled Representations

Deze paper introduceert \textsc{ASEGR}, een tweestapsframework dat ongestructureerde productrecensies via een groot taalmodel distilleert naar gestructureerde zintuiglijke kenmerken, die vervolgens worden geïntegreerd in sequentiële aanbevelingsmodellen om de prestaties en interpretatieerbaarheid te verbeteren.

Yeo Chan Yoon2026-03-04💬 cs.CL

Efficient Self-Evaluation for Diffusion Language Models via Sequence Regeneration

Dit artikel introduceert DiSE, een efficiënte zelfevaluatiemethode voor diffusie-taalmodellen die de kwaliteit van gegenereerde sequenties kwantificeert via token-regeneratie, waardoor zowel betrouwbaardere onzekerheidsmeting als adaptieve generatie met flexibele lengte mogelijk wordt.

Linhao Zhong, Linyu Wu, Wen Wang + 5 more2026-03-04💬 cs.CL

From Solver to Tutor: Evaluating the Pedagogical Intelligence of LLMs with KMP-Bench

Deze paper introduceert KMP-Bench, een uitgebreid benchmark voor K-8 wiskundepedagogiek, en KMP-Pile, een groot dataset, om de pedagogische intelligentie van LLM's te evalueren en aan te tonen dat fijnafstemming op pedagogisch rijke data de effectiviteit van AI-tutors aanzienlijk verbetert.

Weikang Shi, Houxing Ren, Junting Pan + 8 more2026-03-04💬 cs.CL

OCR or Not? Rethinking Document Information Extraction in the MLLMs Era with Real-World Large-Scale Datasets

Deze studie toont aan dat krachtige multimodale grote taalmodellen documentinformatie-extractie even effectief kunnen uitvoeren zonder OCR, mits ze worden ondersteund door zorgvuldig ontworpen schema's, voorbeelden en instructies.

Jiyuan Shen, Peiyue Yuan, Atin Ghosh + 2 more2026-03-04💬 cs.CL

Guideline-Grounded Evidence Accumulation for High-Stakes Agent Verification

Dit artikel introduceert GLEAN, een betrouwbaar verificatiekader voor LLM-agenten in hoog-risico domeinen zoals klinische diagnose, dat door richtlijn-gebaseerde bewijsaccumulatie en actieve verificatie de nauwkeurigheid en kalibratie aanzienlijk verbetert.

Yichi Zhang, Nabeel Seedat, Yinpeng Dong + 3 more2026-03-04💬 cs.CL

Faster, Cheaper, More Accurate: Specialised Knowledge Tracing Models Outperform LLMs

Dit artikel toont aan dat gespecialiseerde kennis-tracering-modellen voor educatieve toepassingen grotere voorspellingsnauwkeurigheid bieden en aanzienlijk sneller en goedkoper zijn dan grote taalmodellen (LLMs).

Prarthana Bhattacharyya, Joshua Mitton, Ralph Abboud + 1 more2026-03-04💬 cs.CL

The Distribution of Phoneme Frequencies across the World's Languages: Macroscopic and Microscopic Information-Theoretic Models

Dit artikel biedt een verenigde informatie-theoretische uitleg voor de frequentieverdeling van fonemen in wereldwijd talen door macroscopische patronen die overeenkomen met een Dirichlet-verdeling en microscopische voorspellingen gebaseerd op een Maximum Entropy-model te combineren.

Fermín Moscoso del Prado Martín, Suchir Salhan2026-03-04💬 cs.CL

Nodes Are Early, Edges Are Late: Probing Diagram Representations in Large Vision-Language Models

Dit onderzoek toont aan dat grote visueel-taalmodellen diagrammen beter begrijpen dan relaties tussen elementen, omdat informatie over knopen en structurele kenmerken al vroeg in de visuele encoder lineair gecodeerd is, terwijl randinformatie pas later in de taalmodulatie ontstaat, wat de moeite met het interpreteren van richtingen en relaties verklaart.

Haruto Yoshida, Keito Kudo, Yoichi Aoki + 4 more2026-03-04💬 cs.CL

Eval4Sim: An Evaluation Framework for Persona Simulation

Eval4Sim is een evaluatiekader dat de nauwkeurigheid van door persona's gestuurde gesprekken meet door drie complementaire dimensies te analyseren: de impliciete codering van achtergrondkennis, de consistentie van de identiteit en de natuurlijkheid van de conversatiestroom, waarbij afwijkingen van menselijke gesprekspatronen worden bestraft in plaats van alleen optimalisatie te stimuleren.

Eliseo Bao, Anxo Perez, Xi Wang + 1 more2026-03-04💬 cs.CL

ACE-Merging: Data-Free Model Merging with Adaptive Covariance Estimation

Dit paper introduceert ACE-Merging, een data-vrij raamwerk dat inter-taak interferentie bij het samenvoegen van modellen effectief oplost door een adaptieve schatting van de covariantie te gebruiken, wat leidt tot nieuwe state-of-the-art resultaten zonder extra trainingsdata.

Bo Xu, Haotian Wu, Hehai Lin + 4 more2026-03-04💬 cs.CL

Contextualized Privacy Defense for LLM Agents

Dit paper introduceert Contextualized Defense Instructing (CDI), een nieuw privacyverdedigingsparadigma voor LLM-agenten dat via versterkingslering contextbewuste, proactieve richtlijnen genereert om privacy en nuttigheid effectiever te balanceren dan bestaande statische methoden.

Yule Wen, Yanzhe Zhang, Jianxun Lian + 3 more2026-03-04💬 cs.CL

← Vorige Volgende →