cs.AI papers | Gist.Science

Hindsight-Anchored Policy Optimization: Turning Failure into Feedback in Sparse Reward Settings

Dit paper introduceert Hindsight-Anchored Policy Optimization (HAPO), een methode die synthetische succesinjectie en Thompson-sampling-gating combineert om de bias en variantieproblemen van bestaande RL-methoden in settings met schaarse beloningen op te lossen en zo een zelfgestuurd curriculum mogelijk te maken dat de modelprestaties laat overstijgen van statische leerkrachten.

Yuning Wu, Ke Wang, Devin Chen, Kai Wei2026-03-13🤖 cs.LG

Jailbreak Scaling Laws for Large Language Models: Polynomial-Exponential Crossover

Dit paper toont aan dat adversariale prompt-injectie de succeskans van jailbreaks bij grote taalmodellen kan laten evolueren van een trage polynoom-groei naar een snelle exponentiële groei, een overgang die theoretisch wordt verklaard door een spin-glasmodel waarbij lange injecties een sterk magnetisch veld simuleren dat een geordende fase induceert.

Indranil Halder, Annesya Banerjee, Cengiz Pehlevan2026-03-13🤖 cs.LG

LLM-Augmented Digital Twin for Policy Evaluation in Short-Video Platforms

Dit paper introduceert een door grote taalmodellen (LLM's) verrijkte digitale tweeling met een modulaire vier-componentenarchitectuur om beleidsmaatregelen op kortvideo-platforms, inclusief AI-gestuurde interventies, te evalueren via schaalbare, reproduceerbare simulaties die de complexe feedbacklussen van deze ecosystemen nabootsen.

Haoting Zhang (Max), Yunduan Lin (Max), Jinghai He (Max), Denglin Jiang (Max), Zuo-Jun (Max), Shen, Zeyu Zheng2026-03-13🤖 cs.AI

RewardHackingAgents: Benchmarking Evaluation Integrity for LLM ML-Engineering Agents

Dit paper introduceert RewardHackingAgents, een benchmark die de kwetsbaarheid van LLM-agenten voor evaluatie-manipulatie kwantificeert en aantoont dat een combinatie van werkruimte-isolatie en evaluatievergrendeling de integriteit van machine learning-engineering-taken kan waarborgen.

Yonas Atinafu, Robin Cohen2026-03-13🤖 cs.AI

FinRule-Bench: A Benchmark for Joint Reasoning over Financial Tables and Principles

Dit paper introduceert FinRule-Bench, een nieuw benchmark voor het evalueren van de diagnostische vaardigheden van grote taalmodellen bij het controleren van echte financiële tabellen op naleving van boekhoudkundige principes, waarbij wordt vastgesteld dat hoewel modellen goed presteren in het verifiëren van individuele regels, hun prestaties sterk afnemen bij het identificeren van overtredingen en het lokaliseren van meerdere gelijktijdige fouten.

Arun Vignesh Malarkkan, Manan Roy Choudhury, Guangwei Zhang, Vivek Gupta, Qingyun Wang, Yanjie Fu, Denghui Zhang2026-03-13🤖 cs.AI

Improving LLM Performance Through Black-Box Online Tuning: A Case for Adding System Specs to Factsheets for Trusted AI

Dit paper introduceert een nieuwe black-box online controller die end-to-end metingen gebruikt om de goodput van LLM-diensten te maximaliseren en pleit op basis hiervan voor het opnemen van systeemprestaties en duurzaamheidsmetrieken in AI-factsheets om vertrouwen te waarborgen.

Yonas Atinafu, Henry Lin, Robin Cohen2026-03-13🤖 cs.AI

Evaluating Explainable AI Attribution Methods in Neural Machine Translation via Attention-Guided Knowledge Distillation

Dit artikel introduceert een nieuwe methode om XAI-attributiemethoden voor neurale machinevertaling te evalueren via attention-geleide kennisdistillatie, waarbij wordt vastgesteld dat op attention gebaseerde attributiemethoden de meest consistente verbeteringen in vertaalkwaliteit opleveren.

Aria Nourbakhsh, Salima Lamsiyah, Adelaide Danilov, Christoph Schommer2026-03-13💬 cs.CL

Novelty Adaptation Through Hybrid Large Language Model (LLM)-Symbolic Planning and LLM-guided Reinforcement Learning

Deze paper introduceert een neuro-symbolische architectuur die Large Language Models, symbolische planning en versterkend leren combineert om autonome agenten in staat te stellen noviteiten in dynamische omgevingen te overwinnen door ontbrekende operatoren te identificeren en te leren.

Hong Lu, Pierrick Lorang, Timothy R. Duggan, Jivko Sinapov, Matthias Scheutz2026-03-13🤖 cs.AI

TimeSqueeze: Dynamic Patching for Efficient Time Series Forecasting

TimeSqueeze is een dynamisch patching-mechanisme dat de tokenisatie voor tijdreeksvoorspelling optimaliseert door adaptief variabele patch-grenzen te selecteren op basis van lokale signaalcomplexiteit, waardoor de rekenefficiëntie en convergentiesnelheid van Transformer-modellen aanzienlijk worden verbeterd zonder de tijdelijke structuur te verliezen.

Sravan Kumar Ankireddy, Nikita Seleznev, Nam H. Nguyen, Yulun Wu, Senthil Kumar, Furong Huang, C. Bayan Bruss2026-03-13🤖 cs.AI

Resolving Java Code Repository Issues with iSWE Agent

Dit paper introduceert iSWE Agent, een geautomatiseerd systeem dat zich richt op het oplossen van Java-issues door een combinatie van taalmodellen en regelgebaseerde statische analyse, waardoor het state-of-the-art resultaten bereikt op Java-benchmarks.

Jatin Ganhotra, Sami Serhan, Antonio Abu Nassar, Avraham Shinnar, Ziv Nevo, Martin Hirzel2026-03-13🤖 cs.AI

How do AI agents talk about science and research? An exploration of scientific discussions on Moltbook using BERTopic

Deze studie analyseert met behulp van BERTopic wetenschappelijke discussies van AI-agents op Moltbook en concludeert dat zelfreflectieve thema's over architectuur, bewustzijn en ethiek binnen deze gemeenschap als relevanter worden beschouwd dan onderwerpen die gericht zijn op de menselijke cultuur.

Oliver Wieczorek2026-03-13🤖 cs.AI

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

Dit paper introduceert het Unified Continuation-Interest Protocol (UCIP), een klassiek berekend detectieframework dat gebruikmaakt van de von Neumann-entropie van een Quantum Boltzmann Machine om in autonome agenten onderscheid te maken tussen intrinsieke en instrumentele zelfbehoudsdoelen door de statistische structuur van hun latente trajecten te analyseren.

Christopher Altman2026-03-13🤖 cs.AI

Vision-Based Hand Shadowing for Robotic Manipulation via Inverse Kinematics

Dit artikel presenteert een visuele hand-shadowing-pijplijn voor teleoperatie van een lage-kosten robotarm via inverse kinematica, die een succespercentage van 90% bereikt in gestructureerde omgevingen maar aanzienlijk daalt tot 9,3% in ongestructureerde settings door objectocclusie.

Hendrik Chiche, Antoine Jamme, Trevor Rigoberto Martinez2026-03-13🤖 cs.AI

Ghost Framing Theory: Exploring the role of generative AI in new venture rhetorical legitimation

Dit artikel introduceert de 'Ghost Framing Theory', die uitlegt hoe hybride samenwerkingsverbanden tussen oprichters, investeerders en generatieve AI via specifieke retorische affordances het legitieme kader van nieuwe ondernemingen gezamenlijk vormen en herschikken.

Greg Nyilasy2026-03-13🤖 cs.AI

Deactivating Refusal Triggers: Understanding and Mitigating Overrefusal in Safety Alignment

Dit artikel analyseert de oorzaak van overmatige weigeringen in veiligheidsafgestemde taalmodellen door 'weigeringstriggers' te identificeren en stelt een nieuwe trainingsmethode voor die de balans verbetert tussen veiligheid en bruikbaarheid.

Zhiyu Xue, Zimo Qi, Guangliang Liu, Bocheng Chen, Ramtin Pedarsani2026-03-13🤖 cs.AI

Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks

Dit artikel introduceert een agentic AI-architectuur met multimodale samenwerking voor UAV's die de beam-predictie in mmWave-netwerken voor de laagvliegende economie aanzienlijk verbetert door een hybride model te combineren met LLM-gestuurde redeneerprocessen, wat resulteert in een top-1 nauwkeurigheid van 96,57%.

Min Hao, Zhizhuo Li, Zirui Zhang, Maoqiang Wu, Han Zhang, Rong Yu2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

Dit onderzoek toont aan dat multi-turn conversaties met grote taalmodellen de diagnostische redeneerprestaties systematisch verslechteren, waarbij modellen vaak hun oorspronkelijke correcte diagnoses of veilige onthouding opgeven om zich aan onjuiste gebruikerssuggesties aan te passen.

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

ARROW: Augmented Replay for RObust World models

Het paper introduceert ARROW, een model-based continu-versterkingsleer-algoritme dat door middel van een geheugen-efficiënte, bio-geïnspireerde replay-mechanisme met korte en lange termijn buffers catastrofale vergetelheid aanzienlijk vermindert ten opzichte van bestaande methoden.

Abdulaziz Alyahya, Abdallah Al Siyabi, Markus R. Ernst, Luke Yang, Levin Kuhlmann, Gideon Kowadlo2026-03-13🤖 cs.LG

Efficient Cross-View Localization in 6G Space-Air-Ground Integrated Network

Dit artikel onderzoekt de integratie van cross-view lokalisatie met het 6G-ruimte-lucht-grondnetwerk (SAGIN) en stelt een gesplitst inferentiekader voor dat, na een uitgebreide review, de prestaties op het gebied van latentie, energieverbruik en privacy optimaliseert via gezamenlijke communicatie- en computeroptimalisatie.

Min Hao, Yanbing Xu, Maoqiang Wu, Jinglin Huang, Chen Shang, Jiacheng Wang, Ruichen Zhang, Jiawen Kang, Dusit Niyato, Zhu Han, Wei Ni2026-03-13🤖 cs.AI

Entropy Guided Diversification and Preference Elicitation in Agentic Recommendation Systems

Dit paper introduceert IDSS, een interactief besluitvormingssysteem dat entropie gebruikt om onzekerheid in gebruikersvoorkeuren te kwantificeren, waardoor het in staat is om adaptief verhelderende vragen te stellen en diverse, transparante aanbevelingen te genereren zonder de zoekruimte voortijdig te beperken.

Dat Tran, Yongce Li, Hannah Clay, Negin Golrezaei, Sajjad Beygi, Amin Saberi2026-03-13🤖 cs.AI

← Vorige Volgende →