Hindsight-Anchored Policy Optimization: Turning Failure into Feedback in Sparse Reward Settings

Dit paper introduceert Hindsight-Anchored Policy Optimization (HAPO), een methode die synthetische succesinjectie en Thompson-sampling-gating combineert om de bias en variantieproblemen van bestaande RL-methoden in settings met schaarse beloningen op te lossen en zo een zelfgestuurd curriculum mogelijk te maken dat de modelprestaties laat overstijgen van statische leerkrachten.

Yuning Wu, Ke Wang, Devin Chen, Kai Wei2026-03-13🤖 cs.LG

Jailbreak Scaling Laws for Large Language Models: Polynomial-Exponential Crossover

Dit paper toont aan dat adversariale prompt-injectie de succeskans van jailbreaks bij grote taalmodellen kan laten evolueren van een trage polynoom-groei naar een snelle exponentiële groei, een overgang die theoretisch wordt verklaard door een spin-glasmodel waarbij lange injecties een sterk magnetisch veld simuleren dat een geordende fase induceert.

Indranil Halder, Annesya Banerjee, Cengiz Pehlevan2026-03-13🤖 cs.LG

LLM-Augmented Digital Twin for Policy Evaluation in Short-Video Platforms

Dit paper introduceert een door grote taalmodellen (LLM's) verrijkte digitale tweeling met een modulaire vier-componentenarchitectuur om beleidsmaatregelen op kortvideo-platforms, inclusief AI-gestuurde interventies, te evalueren via schaalbare, reproduceerbare simulaties die de complexe feedbacklussen van deze ecosystemen nabootsen.

Haoting Zhang (Max), Yunduan Lin (Max), Jinghai He (Max), Denglin Jiang (Max), Zuo-Jun (Max), Shen, Zeyu Zheng2026-03-13🤖 cs.AI

FinRule-Bench: A Benchmark for Joint Reasoning over Financial Tables and Principles

Dit paper introduceert FinRule-Bench, een nieuw benchmark voor het evalueren van de diagnostische vaardigheden van grote taalmodellen bij het controleren van echte financiële tabellen op naleving van boekhoudkundige principes, waarbij wordt vastgesteld dat hoewel modellen goed presteren in het verifiëren van individuele regels, hun prestaties sterk afnemen bij het identificeren van overtredingen en het lokaliseren van meerdere gelijktijdige fouten.

Arun Vignesh Malarkkan, Manan Roy Choudhury, Guangwei Zhang, Vivek Gupta, Qingyun Wang, Yanjie Fu, Denghui Zhang2026-03-13🤖 cs.AI

Evaluating Explainable AI Attribution Methods in Neural Machine Translation via Attention-Guided Knowledge Distillation

Dit artikel introduceert een nieuwe methode om XAI-attributiemethoden voor neurale machinevertaling te evalueren via attention-geleide kennisdistillatie, waarbij wordt vastgesteld dat op attention gebaseerde attributiemethoden de meest consistente verbeteringen in vertaalkwaliteit opleveren.

Aria Nourbakhsh, Salima Lamsiyah, Adelaide Danilov, Christoph Schommer2026-03-13💬 cs.CL

TimeSqueeze: Dynamic Patching for Efficient Time Series Forecasting

TimeSqueeze is een dynamisch patching-mechanisme dat de tokenisatie voor tijdreeksvoorspelling optimaliseert door adaptief variabele patch-grenzen te selecteren op basis van lokale signaalcomplexiteit, waardoor de rekenefficiëntie en convergentiesnelheid van Transformer-modellen aanzienlijk worden verbeterd zonder de tijdelijke structuur te verliezen.

Sravan Kumar Ankireddy, Nikita Seleznev, Nam H. Nguyen, Yulun Wu, Senthil Kumar, Furong Huang, C. Bayan Bruss2026-03-13🤖 cs.AI

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

Dit paper introduceert het Unified Continuation-Interest Protocol (UCIP), een klassiek berekend detectieframework dat gebruikmaakt van de von Neumann-entropie van een Quantum Boltzmann Machine om in autonome agenten onderscheid te maken tussen intrinsieke en instrumentele zelfbehoudsdoelen door de statistische structuur van hun latente trajecten te analyseren.

Christopher Altman2026-03-13🤖 cs.AI

Efficient Cross-View Localization in 6G Space-Air-Ground Integrated Network

Dit artikel onderzoekt de integratie van cross-view lokalisatie met het 6G-ruimte-lucht-grondnetwerk (SAGIN) en stelt een gesplitst inferentiekader voor dat, na een uitgebreide review, de prestaties op het gebied van latentie, energieverbruik en privacy optimaliseert via gezamenlijke communicatie- en computeroptimalisatie.

Min Hao, Yanbing Xu, Maoqiang Wu, Jinglin Huang, Chen Shang, Jiacheng Wang, Ruichen Zhang, Jiawen Kang, Dusit Niyato, Zhu Han, Wei Ni2026-03-13🤖 cs.AI