cs.AI papers | Gist.Science

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Dit paper introduceert VMoER, een schaalbaar Bayesiaans framework dat variational inference toepast op de routering in Mixture-of-Experts Transformers om zo met minimale rekentijd gecalibreerde onzekerheidsschattingen te bieden voor foundation modellen.

Albus Yizhuo Li, Matthew Wicker2026-03-11🤖 cs.AI

Declarative Scenario-based Testing with RoadLogic

Dit paper introduceert RoadLogic, een open-source tool die declaratieve OpenSCENARIO-specificaties omzet in uitvoerbare simulaties voor het testen van autonome voertuigen door middel van Answer Set Programming, bewegingsplanning en specificatiegebaseerde monitoring.

Ezio Bartocci, Alessio Gambi, Felix Gigler, Cristinel Mateis, Dejan Ničkovic2026-03-11🤖 cs.AI

An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse

Deze studie identificeert en verklaart het fenomeen van 'task-level merging collapse', waarbij bepaalde taakcombinaties leiden tot catastrofale prestatiedalingen door fundamentele representatieve incompatibiliteit in plaats van parameterconflict, wat wordt onderbouwd door zowel empirische analyses als een theoretisch bewijs op basis van rate-distortion-theorie.

Yuan Cao, Dezhi Ran, Yuzhe Guo, Mengzhou Wu, Simin Chen, Linyi Li, Wei Yang, Tao Xie2026-03-11🤖 cs.AI

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

EvoDriveVLA is een nieuw kader voor autonoom rijden dat de prestaties van Vision-Language-Action-modellen verbetert door een collaboratieve distillatie van waarneming en planning te gebruiken, wat leidt tot state-of-the-art resultaten in zowel open- als gesloten-lus evaluaties.

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou Liu, Yang Wang, Shanghang Zhang2026-03-11🤖 cs.AI

Telogenesis: Goal Is All U Need

Dit artikel toont aan dat endogene prioriteiten, gegenereerd door epistemische gaten zoals onwetendheid, verrassing en veroudering, voldoende zijn om adaptieve waarnemingsstrategieën te ontwikkelen die presteren boven vaste methoden en zonder externe beloning de onderliggende structuur van de omgeving kunnen herontdekken.

Zhuoran Deng, Yizhi Zhang, Ziyi Zhang, Wan Shen2026-03-11🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

GenePlan is een nieuw raamwerk dat grote taalmodellen combineert met evolutionaire algoritmen om interpreteerbare, domein-specifieke PDDL-planners te genereren die presteren op het niveau van de state-of-the-art en aanzienlijk beter zijn dan andere LLM-baselines.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael Cashmore2026-03-11🤖 cs.AI

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

Dit artikel betoogt dat de interactie tussen menselijke redenering en generatieve AI leidt tot een emergente 'derde entiteit' die via 'vibe-creatie' tacit knowledge automatiseert, wat fundamentele implicaties heeft voor epistemologie, bewustzijn en onderwijs.

Ilya Levin2026-03-11🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Dit paper introduceert Temporal-Conditioned Normalizing Flows (tcNF), een nieuw raamwerk voor het detecteren van anomalieën in multivariate tijdsreeksen door complexe temporele afhankelijkheden en onzekerheid nauwkeurig te modelleren via autoregressieve conditionering op eerdere waarnemingen.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri Ramampiaro2026-03-11🤖 cs.AI

Evolving Prompt Adaptation for Vision-Language Models

Het artikel introduceert EvoPrompt, een nieuw raamwerk dat de adaptatie van vision-language modellen naar downstream-taken verbetert door een evolutionaire trainingsstrategie en geometrische regularisatie te gebruiken om prestaties te maximaliseren zonder de oorspronkelijke zero-shot-kennis te verliezen.

Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang Li2026-03-11🤖 cs.AI

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

Dit paper introduceert EDA, een parameter- en data-efficiënt framework dat de prestaties van speculatieve decoding op fijngetrainde LLM's herstelt door een ontkoppelde architectuur, data-regeneratie en selectieve steekproefneming te combineren, waardoor volledige hertraining overbodig wordt.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong Ji2026-03-11🤖 cs.AI

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Deze studie presenteert een methode om nepnieuwsontkrachting te personaliseren op basis van de Big Five-persoonlijkheidstrekken met behulp van LLM's, waarbij geautomatiseerde evaluatie aantoont dat dergelijke gepersonaliseerde boodschappen over het algemeen overtuigender zijn dan generieke versies.

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. Passaro2026-03-11🤖 cs.AI

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Dit artikel introduceert een compiler-gebaseerde implementatie van Mamba-2 in JAX die, dankzij het gebruik van standaard XLA-primitieven in plaats van aangepaste CUDA-kernels, portabele autoregressieve inferentie met $O(1)$ caching mogelijk maakt op CPU, NVIDIA GPU en Google TPU zonder host-synchronisatie.

Cosmo Santoni2026-03-11🤖 cs.AI

Routing without Forgetting

Dit paper introduceert 'Routing without Forgetting' (RwF), een transformer-architectuur die continu leren in online scenario's verbetert door dynamische prompts te genereren via energie-gebaseerde associatieve retrieval in plaats van traditionele parameter-efficiënte aanpassingen.

Alessio Masano, Giovanni Bellitto, Dipam Goswani, Joost Van de Weijer, Concetto Spampinato2026-03-11🤖 cs.AI

A Variational Latent Equilibrium for Learning in Cortex

Dit artikel presenteert een biologisch plausibel formalisme dat backpropagation through time benadert via een variatiele latente evenwichtstoestand, waardoor een lokaal en continu mechanisme voor spatiotemporale credit assignment in neurale netwerken wordt verkregen.

Simon Brandt, Paul Haider, Walter Senn, Federico Benitez, Mihai A. Petrovici2026-03-11🤖 cs.AI

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

Dit paper introduceert context engineering als een nieuwe discipline die prompt engineering overstijgt en samen met intent engineering en specificatie engineering een volwassenheidsmodel vormt voor het schaalbaar en autonoom inzetten van multi-agent AI-systemen in het bedrijfsleven.

Vera V. Vishnyakova2026-03-11🤖 cs.AI

Grounding Synthetic Data Generation With Vision and Language Models

Deze paper introduceert ARAS400k, een groot schaalbaar dataset voor remote sensing dat synthetische data combineert met echte beelden en een visueel-taal framework voor interpreteerbare augmentatie en evaluatie, wat resulteert in superieure prestaties voor semantische segmentatie en beeldbeschrijving.

Ümit Mert Ça\u{g}lar, Alptekin Temizel2026-03-11🤖 cs.AI

PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

Het paper introduceert PRECEPT, een unified framework voor testtijd-adaptatie dat de prestaties van LLM-agenten verbetert door deterministische regelretrieval, conflictbewust geheugen en een door Pareto-gestuurde prompt-evolutie (COMPASS) te combineren, wat leidt tot aanzienlijke winsten in generalisatie, robuustheid en leerefficiëntie.

Arash Shahmansoori2026-03-11🤖 cs.AI

MM-tau-p $^2$ : Persona-Adaptive Prompting for Robust Multi-Modal Agent Evaluation in Dual-Control Settings

Dit paper introduceert de MM-tau-p²-benchmark, een nieuw evaluatiekader met twaalf nieuwe metrics om de robuustheid van multimodale agenten in dual-control settings te beoordelen, met name in situaties waar persona-adaptatie en gebruikersinput een rol spelen.

Anupam Purwar, Aditya Choudhary2026-03-11🤖 cs.AI

MiniAppBench: Evaluating the Shift from Text to Interactive HTML Responses in LLM-Powered Assistants

Dit paper introduceert MiniAppBench, een nieuw benchmark en evaluatiekader (MiniAppEval) dat de prestaties van grote taalmodellen meet bij het genereren van interactieve HTML-toepassingen, een domein waar bestaande benchmarks tekortschieten.

Zuhao Zhang, Chengyue Yu, Yuante Li, Chenyi Zhuang, Linjian Mo, Shuai Li2026-03-11🤖 cs.AI

When to Lock Attention: Training-Free KV Control in Video Diffusion

Het paper introduceert KV-Lock, een trainingsvrije methode voor video-editing die dynamisch de achtergrondvastlegging en de conditionele geleiding aanpast op basis van hallucinatie-detectie om achtergrondconsistentie en voorgrondkwaliteit te optimaliseren in DiT-gebaseerde videodiffusiemodellen.

Tianyi Zeng, Jincheng Gao, Tianyi Wang, Zijie Meng, Miao Zhang, Jun Yin, Haoyuan Sun, Junfeng Jiao, Christian Claudel, Junbo Tan, Xueqian Wang2026-03-11🤖 cs.AI

← Vorige Volgende →

cs.AI