BeamPERL: Parameter-Efficient RL with Verifiable Rewards Specializes Compact LLMs for Structured Beam Mechanics Reasoning

Dit onderzoek toont aan dat versterkingslering met exacte, verifieerbare beloningen een compact taalmodel weliswaar kan leren beam-mechanica-oplossingen te genereren, maar dat het model hierbij vooral procedurele sjablonen leert in plaats van de onderliggende fysische principes te internaliseren, wat resulteert in beperkte generalisatie bij topologische veranderingen.

Tarjei Paule Hage, Markus J. Buehler2026-03-05🔬 cond-mat.mtrl-sci

VietNormalizer: An Open-Source, Dependency-Free Python Library for Vietnamese Text Normalization in TTS and NLP Applications

Deze paper introduceert VietNormalizer, een open-source, afhankelijkheidsloze Python-bibliotheek die Vietnamese tekst normaliseert naar spreekbare vormen voor TTS- en NLP-toepassingen door een efficiënt, op regels gebaseerd systeem te gebruiken voor het verwerken van getallen, datums, valuta en leenwoorden.

Hung Vu Nguyen, Loan Do, Thanh Ngoc Nguyen + 5 more2026-03-05💬 cs.CL

Memex(RL): Scaling Long-Horizon LLM Agents via Indexed Experience Memory

Dit paper introduceert Memex, een mechanisme voor geïndexeerd ervaringsgeheugen dat, in combinatie met het versterkingsleringsframework MemexRL, lange-horizon LLM-agenten in staat stelt om volledige interacties te archiveren en op vraag op te halen, waardoor de contextbeperkingen worden overwonnen zonder dat er essentiële informatie verloren gaat door samenvattingen.

Zhenting Wang, Huancheng Chen, Jiayun Wang + 1 more2026-03-05🤖 cs.LG

Position: Vector Prompt Interfaces Should Be Exposed to Enable Customization of Large Language Models

Dit standpuntspaper pleit ervoor dat modelproviders vectorprompt-ingangen blootleggen als publieke interface voor het aanpassen van grote taalmodellen, omdat deze methode schaalbaarder en stabieler is dan tekstgebaseerde prompting en beter voldoet aan de eisen van inferentie-only-aanpassing zonder de beveiligingsrisico's aanzienlijk te vergroten.

Liangwei Yang, Shiyu Wang, Haolin Chen + 12 more2026-03-05✓ Author reviewed 💬 cs.CL

World Properties without World Models: Recovering Spatial and Temporal Structure from Co-occurrence Statistics in Static Word Embeddings

Deze studie toont aan dat statische woordembeddings, die zijn gebaseerd op co-occurrence-statistieken, reeds aanzienlijke ruimtelijke en temporele structuren bevatten, wat aangeeft dat de herwinbaarheid van wereldkennis uit LLM-verborgen toestanden niet noodzakelijk wijst op geavanceerde wereldmodellen maar eerder op de rijke structuur die al in de tekst zelf aanwezig is.

Elan Barenholtz2026-03-05🤖 cs.AI

AILS-NTUA at SemEval-2026 Task 12: Graph-Based Retrieval and Reflective Prompting for Abductive Event Reasoning

Het AILS-NTUA-team behaalde de eerste plaats bij SemEval-2026 Taak 12 met een driestapsysteem dat grafgebaseerde retriever, reflectieve prompt-evolutie en consistentiehandhaving combineert voor abductieve redenering, waarbij een analyse van 14 modellen drie systematische foutpatronen in meervoudige causale redenering blootlegde.

Nikolas Karafyllis, Maria Lymperaiou, Giorgos Filandrianos + 2 more2026-03-05💬 cs.CL

Dual-Modality Multi-Stage Adversarial Safety Training: Robustifying Multimodal Web Agents Against Cross-Modal Attacks

Dit artikel introduceert DMAST, een tweestadiaantig trainingskader dat multimodale webagenten robuuster maakt tegen cross-modale aanvallen door het agent-attacker-interactieproces te modelleren als een nul-som Markov-spel en te co-trainen via imitatielearning, orakel-gestuurde fine-tuning en adversariaal reinforcement learning.

Haoyu Liu, Dingcheng Li, Lukas Rutishauser + 1 more2026-03-05🤖 cs.AI

ττ-Knowledge: Evaluating Conversational Agents over Unstructured Knowledge

Dit paper introduceert I¨„Ï„-Knowledge, een nieuwe benchmark die conversatie-agenten evalueert op hun vermogen om ongestructureerde kennis en tools te integreren in complexe, realistische scenario's zoals die in de fintech-sector, waarbij zelfs geavanceerde modellen moeite hebben met het nauwkeurig ophalen van documenten en het toepassen van beleidsregels.

Quan Shi, Alexandra Zytek, Pedram Razavi + 2 more2026-03-05🤖 cs.AI