cs.AI papers | Gist.Science

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

Dit paper introduceert ARKV, een lichtgewicht en adaptief framework dat de geheugenefficiëntie van Large Language Models bij lange contexten aanzienlijk verbetert door dynamisch precisieniveaus toe te wijzen aan tokens op basis van hun belang, waardoor het KV-cachegebruik met een factor 4 wordt gereduceerd zonder significante kwaliteitsverlies.

Jianlong Lei, Shashikant Ilager2026-03-11🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Dit onderzoek evalueert op meerdere kwantumplatforms de 'blinde reset'-methode voor het hergebruiken van ancilla-qubits zonder meting, en toont aan dat deze techniek de cycluslatentie aanzienlijk kan verminderen terwijl de reinheid van de qubits behouden blijft.

Sangkeum Lee2026-03-11⚛️ quant-ph

Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation

Dit artikel presenteert een systematische review en prestatie-evaluatie van federatief leertechnieken in edge-computingomgevingen, waarbij vijf toonaangevende algoritmen worden vergeleken op basis van nauwkeurigheid, communicatie-efficiëntie en energieconsumptie om bestaande uitdagingen te identificeren en een onderzoeksagenda voor de toekomst te schetsen.

Sales Aribe Jr., Gil Nicholas Cagande2026-03-11🤖 cs.AI

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

Dit artikel introduceert Auralink SDC, een architectuur met edge-geplaatste AI-agenten die autonome, veilige en responsieve beheeroplossingen biedt voor openbare laadinfrastructuur, waardoor de hoge uitvalpercentages en trage reparatietijden van bestaande cloudsystemen worden overwonnen.

Mohammed Cherifi2026-03-11🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Dit artikel presenteert een compressieframework voor Reservoir Computing dat gebruikmaakt van een op gevoeligheid gebaseerde prune-mechanisme om de afweging tussen kwantisatie, pruning en hardware-efficiëntie te optimaliseren, wat resulteert in aanzienlijke verbeteringen in resourcegebruik en energie-efficiëntie op FPGA's zonder merkbare nauwkeurigheidsverlies.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco Platzner2026-03-11🤖 cs.AI

Architectural Design and Performance Analysis of FPGA based AI Accelerators: A Comprehensive Review

Dit artikel biedt een uitgebreid overzicht van FPGA-gebaseerde AI-acceleratoren voor deep learning, waarbij het de architecturale ontwerpen, prestatieoptimalisaties en huidige uitdagingen analyseert om toekomstige innovaties te faciliteren.

Soumita Chatterjee, Sudip Ghosh, Tamal Ghosh, Hafizur Rahaman2026-03-11🤖 cs.AI

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

Dit paper introduceert Zipage, een hoog-concurrentie LLM-inferentie-engine die Compressed PagedAttention combineert met geavanceerde scheduling en compressie om de geheugenbottleneck bij redenerende modellen op te lossen en zo een snelheidswinst van meer dan 2,1x te bereiken met behoud van 95% van de prestaties.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu Wan2026-03-11🤖 cs.AI

Diagnosing FP4 inference: a layer-wise and block-wise sensitivity analysis of NVFP4 and MXFP4

Deze studie analyseert systematisch de gevoeligheid voor kwantisatie van twee FP4-formaten (MXFP4 en NVFP4) in Qwen2.5-modellen en onthult dat de MLP-up- en down-projectielagen het meest gevoelig zijn, terwijl de gevoeligheid niet uitsluitend beperkt blijft tot de laatste blokken.

Musa Cim, Burak Topcu, Mahmut Taylan Kandemir2026-03-11🤖 cs.AI

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Dit paper introduceert het VI 2D SSM, een nieuw architecturaal kader voor multivariate tijdreeksen dat de inherente permutatie-symmetrie respecteert door variabele-afhankelijkheden te vervangen door een canonieke vorm van lokale zelfdynamiek en globale interactie, wat leidt tot state-of-the-art prestaties en verbeterde schaalbaarheid.

Seungwoo Jeong, Heung-Il Suk2026-03-11🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

Dit paper introduceert HCAPO, een nieuw framework dat hindsight credit assignment integreert in LLM-agenten om de uitdagingen van credit assignment in lange-termijn taken aan te pakken en zo de prestaties significant te verbeteren ten opzichte van bestaande methoden zoals GRPO.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng Li2026-03-11🤖 cs.AI

Turn: A Language for Agentic Computation

Dit paper introduceert Turn, een gecompileerde, actor-gebaseerde programmeertaal die LLM-inferentie als een getypeerde primitief behandelt en via taalgebouwde constructies zoals cognitieve typeveiligheid en een capability-gebaseerd identiteitssysteem, kritieke invariants voor autonome agenten garandeert in plaats van ze als applicatieniveau-conventies te laten bestaan.

Muyukani Kizito2026-03-11🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

Dit artikel introduceert een fundamentele reductie die $G$ -invariante functies op productruimten, waar $G$ transitief werkt, reduceert tot $H$ -invarianten van de isotropiegroep, waardoor de beperkingen van bestaande methoden voor equivariante neurale velden worden opgeheven en ze kunnen worden toegepast op willekeurige groepswerkingen.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J Bekkers2026-03-11🤖 cs.AI

EDMFormer: Genre-Specific Self-Supervised Learning for Music Structure Segmentation

Deze paper introduceert EDMFormer, een transformer-model dat gebruikmaakt van zelftoezicht en een specifiek EDM-dataset (EDM-98) om de zwakke prestaties van bestaande modellen bij het segmenteren van elektronische dansmuziek te overwinnen door zich te richten op energie-, ritme- en timbre-veranderingen in plaats van op tekst of harmonie.

Sahal Sajeer, Krish Patel, Oscar Chung, Joel Song Bae2026-03-11🤖 cs.AI

Clear, Compelling Arguments: Rethinking the Foundations of Frontier AI Safety Cases

Dit artikel heroverweegt de bestaande veiligheidszorgkaders voor geavanceerde AI-systemen door lessen uit de traditionele veiligheidsindustrie te integreren en een robuuster raamwerk te presenteren dat specifiek ingaat op risico's zoals misleidende uitlijning en CBRN-capaciteiten.

Shaun Feakins, Ibrahim Habli, Phillip Morgan2026-03-11🤖 cs.AI

Multi-level meta-reinforcement learning with skill-based curriculum

Dit artikel introduceert een efficiënt multi-level meta-versterkingsleerframework dat Markov-beslissingsprocessen hiërarchisch comprimeert en een vaardigheidsgebaseerd curriculum leert om complexe taken te ontleden, de zoekruimte te reduceren en overdracht van vaardigheden tussen verschillende problemen en niveaus te bevorderen.

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)2026-03-11🤖 cs.AI

Large Language Model-Assisted Superconducting Qubit Experiments

Dit artikel introduceert een raamwerk dat grote taalmodellen (LLM's) gebruikt om experimenten met supergeleidende qubits te automatiseren door dynamisch hulpmiddelen te genereren op basis van een kennisbank, wat leidt tot snellere implementatie van standaardprotocollen en flexibeler controle van complexe kwantumhardware.

Shiheng Li, Jacob M. Miller, Phoebe J. Lee, Gustav Andersson, Christopher R. Conner, Yash J. Joshi, Bayan Karimi, Amber M. King, Howard L. Malc, Harsh Mishra, Hong Qiao, Minseok Ryu, Xuntao Wu, Siyuan Xing, Haoxiong Yan, Jian Shi, Andrew N. Cleland2026-03-11⚛️ quant-ph

Test-Driven AI Agent Definition (TDAD): Compiling Tool-Using Agents from Behavioral Specifications

Dit paper introduceert Test-Driven AI Agent Definition (TDAD), een methode die agent-prompten compilarieert vanuit gedragspecificaties via een iteratief testgedreven proces, waardoor de betrouwbaarheid en regressievrijheid van tool-gebruikende AI-agenten in productie wordt gewaarborgd.

Tzafrir Rehan2026-03-11🤖 cs.AI

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Het artikel introduceert Scale-Plan, een schaalbaar raamwerk dat grote taalmodellen combineert met gestructureerde grafzoekalgoritmen om irrelevante informatie te filteren en zo betrouwbare, langdurige taakplanning voor heterogene multi-robotteams mogelijk te maken, wat wordt gevalideerd met de nieuwe MAT2-THOR-benchmark.

Piyush Gupta, Sangjae Bae, Jiachen Li, David Isele2026-03-11🤖 cs.AI

Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage

Dit onderzoek toont aan dat er een sterke correlatie bestaat tussen op dekking gebaseerde zoekopdrachtmetrieken en de informatieafdekking van gegenereerde antwoorden in Retrieval-Augmented Generation-systemen, wat deze metrieken valideert als betrouwbare vroege indicatoren voor de uiteindelijke prestaties.

Saron Samuel, Alexander Martin, Eugene Yang, Andrew Yates, Dawn Lawrie, Ian Soborof, Laura Dietz, Benjamin Van Durme2026-03-11🤖 cs.AI

Fish Audio S2 Technical Report

Dit paper introduceert Fish Audio S2, een open-source tekst-naar-spraak-systeem dat multi-spreker- en multi-turn-generatie combineert met instructievolgende controle via natuurlijke taal, ondersteund door een schaalbaar trainingsproces en een productieklaar inferentie-engine met een zeer lage latentie.

Shijia Liao, Yuxuan Wang, Songting Liu, Yifan Cheng, Ruoyi Zhang, Tianyu Li, Shidong Li, Yisheng Zheng, Xingwei Liu, Qingzheng Wang, Zhizhuo Zhou, Jiahua Liu, Xin Chen, Dawei Han2026-03-11🤖 cs.AI

← Vorige Volgende →