cs.AI papers | Gist.Science

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

Het paper introduceert EvoKernel, een zelfevoluerend agentiek framework dat door middel van een waardegedreven geheugenaanpak en versterkingsleer de uitdagingen van het ontbreken van trainingsdata voor NPU-kernels oplost, waardoor de correctheid van generatieve modellen van 11% naar 83% stijgt en de uitvoeringssnelheid met een factor 3,6 verbetert.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

Semantic Landmark Particle Filter for Robot Localisation in Vineyards

Dit artikel introduceert een Semantisch Landmark-deeltjesfilter dat LiDAR-gegevens combineert met de detectie van boomstammen en palen om robotlokalisatie in wijngaarden robuuster te maken door het probleem van perceptuele aliasing tussen parallelle rijen op te lossen.

Rajitha de Silva, Jonathan Cox, James R. Heselden, Marija Popovic, Cesar Cadena, Riccardo Polvara2026-03-12🤖 cs.AI

$V_{0.5}$ : Generalist Value Model as a Prior for Sparse RL Rollouts

Dit paper introduceert $V_{0.5}$ , een methode die een Generalist Value Model als prior combineert met empirische rollouts via real-time statistische testen en dynamische budgettoewijzing, waardoor een robuuste en efficiënte advantage-baseline wordt verkregen die significant betere prestaties en snellere convergentie bereikt dan GRPO en DAPO op wiskundige redeneerbenchmarks.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

Het paper introduceert GRACE, een geünificeerde 2D-simulatie- en benchmarkomgeving die multi-robot padplanningstaken op verschillende abstractieniveaus (raster, routekaart en continu) mogelijk maakt om transparante en reproduceerbare vergelijkingen tussen verschillende modellen en planners te faciliteren.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang Hönig2026-03-12🤖 cs.AI

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Deze paper introduceert een tweetalig corpus en een machine-actievere GND-taxonomie voor het trainen en evalueren van AI-systemen die bibliothecarissen ondersteunen bij het automatisch toewijzen van onderwerpswoorden aan catalogusrecords.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma Suominen2026-03-12💬 cs.CL

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

Deze paper introduceert een parameter-efficiënte Diffusion Transformer die, dankzij een 2D CNN-encoder en DDPO-finetuning, 200bp celtype-specifieke regulatoire DNA-sequenties genereert met een aanzienlijk snellere convergentie, minder memorisatie en een 38-voudige verbetering in voorspelde regulatoire activiteit vergeleken met eerdere modellen.

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Dit artikel introduceert Dynamics-Predictive Sampling (DPS), een methode die de effectiviteit van versterkingslering voor grote redeneermodellen verbetert door door middel van Bayesiaanse inferentie en een verborgen Markov-model de leerdynamiek van prompts te voorspellen, waardoor kostbare rollouts worden geminimaliseerd en het trainingsproces wordt versneld zonder in te leveren op de redeneerprestaties.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

A Hybrid Knowledge-Grounded Framework for Safety and Traceability in Prescription Verification

Dit paper introduceert PharmGraph-Auditor, een hybride framework dat een betrouwbaar farmaceutisch kennisbestand en een bewijsgebaseerde verificatiestrategie combineert om de veiligheid en traceerbaarheid van medicatieverificatie door apothekers te verbeteren.

Yichi Zhu, Kan Ling, Xu Liu, Hengrun Zhang, Huiqun Yu, Guisheng Fan2026-03-12🤖 cs.AI

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV is een lichtgewicht framework dat de prestaties van KV-cache-evictie verbetert door parameter-efficiënte modules te gebruiken om toekomstige belangrijke tokens te voorspellen zonder dure generatie, wat leidt tot een aanzienlijke vermindering van de uitvoeringstijd en kosten bij lange contexttaken.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

When Fine-Tuning Fails and when it Generalises: Role of Data Diversity and Mixed Training in LLM-based TTS

Dit onderzoek toont aan dat LoRA-finetuning van een compact LLM (Qwen-0.5B) voor tekst-naar-spraak, mits ondersteund door diverse trainingsdata, aanzienlijke verbeteringen oplevert in perceptuele kwaliteit, sprekerstrouw en signaalruisverhouding vergeleken met een bevroren basismodel.

Anupam Purwar, Aditya Choudhary2026-03-12🤖 cs.AI

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Dit paper introduceert "Historical Consensus Training", een iteratief selectieproces voor GMM-priors dat posterior collapse in variational autoencoders volledig elimineert door een stabiel historisch obstakel te creëren dat de degeneratie naar de prior onmogelijk maakt, ongeacht decodervariatie of regularisatiesterkte.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Deze paper introduceert RAD, een nieuw framework voor veilig Reinforcement Learning from Human Feedback dat in plaats van gemiddelde kosten First-Order Stochastic Dominance-constraints toepast via Optimal Transport om zeldzame catastrofale risico's te beheersen en de robuustheid van het model te verbeteren.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

Contact Coverage-Guided Exploration for General-Purpose Dexterous Manipulation

Dit artikel introduceert Contact Coverage-Guided Exploration (CCGE), een algemene exploratiemethode die het contactpatroon tussen hand en object gebruikt om de trainingsefficiëntie en succespercentages van dexterous manipulatie taken te verbeteren en robuuste overdracht naar echte robotsystemen mogelijk te maken.

Zixuan Liu, Ruoyi Qiao, Chenrui Tie, Xuanwei Liu, Yunfan Lou, Chongkai Gao, Zhixuan Xu, Lin Shao2026-03-12🤖 cs.AI

GroundCount: Grounding Vision-Language Models with Object Detection for Mitigating Counting Hallucinations

Het paper introduceert GroundCount, een framework dat Vision-Language-modellen verrijkt met objectdetectie-gebaseerde ruimtelijke grounding om hallucinaties bij het tellen van objecten te verminderen en de nauwkeurigheid aanzienlijk te verbeteren.

Boyuan Chen, Minghao Shao, Siddharth Garg, Ramesh Karri, Muhammad Shafique2026-03-12🤖 cs.AI

Artificial Intelligence as a Catalyst for Innovation in Software Engineering

Dit artikel onderzoekt hoe kunstmatige intelligentie, met name machine learning en natuurlijke taalverwerking, als katalysator fungeert voor innovatie in software engineering door Agile-praktijken te optimaliseren en repetitieve taken te automatiseren, wat leidt tot verbeterde kwaliteit en snelheid in de ontwikkeling.

Carlos Alberto Fernández-y-Fernández, Jorge R. Aguilar-Cisneros2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

Dit artikel analyseert op basis van interviews met experts de methodologische uitdagingen die de dynamische aard van geavanceerde AI-systemen oplevert voor human uplift-studies en biedt praktische oplossingen om de validiteit en bruikbaarheid van deze bewijslast voor hoog-risico beslissingen te waarborgen.

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

In een interdisciplinair onderzoek tussen computerwetenschappers en kunsthistorici wordt onderzocht hoe Vision Language Models kunststijlen herkennen en blijkt dat hun gebruikte concepten voor 90% relevant zijn en voor 73% semantisch zinvol worden bevonden door experts.

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

Instruction set for the representation of graphs

Dit artikel introduceert IsalGraph, een methode die de structuur van eindige grafen comprimeert tot een compacte string van negen karakters die door een virtuele machine kan worden gedecodeerd, waarbij elke string een geldige graaf oplevert en de sequenties sterk correleren met grafische bewerkingen voor toepassingen in vergelijkingszoekopdrachten en generatieve modellen.

Ezequiel Lopez-Rubio, Mario Pascual-Gonzalez2026-03-12💬 cs.CL

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

Het artikel introduceert V2M-Zero, een methode die video naar tijd-gealigneerde muziek vertaalt zonder gekoppelde trainingsdata, door gebruik te maken van binnen-modale gebeurteniskrommen om de gedeelde temporele structuur tussen video en muziek te benutten.

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

Dit paper introduceert NeFTY, een differentieerbaar fysica-framework dat gebruikmaakt van neurale velden en een strikte numerieke solver om materialen kwantitatief in 3D te reconstrueren op basis van oppervlaktetemperatuurmetingen, waardoor de beperkingen van traditionele thermografie en bestaande PINN-benaderingen voor het detecteren van ondergrondse defecten worden overwonnen.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

← Vorige Volgende →

cs.AI