cs.AI articoli | Gist.Science

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

Il paper presenta ARKV, un framework adattivo e leggero che ottimizza la gestione della cache KV per l'inferenza di LLM in contesti lunghi, riducendo l'uso di memoria GPU di 4 volte mantenendo il 97% dell'accuratezza di base senza richiedere riaddestramento o modifiche architetturali.

Jianlong Lei, Shashikant Ilager2026-03-11🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Questo studio valuta il riciclo degli ancilla tramite reset cieco su processori superconduttori e a ioni intrappolati, dimostrando che tale approccio può ridurre la latenza del ciclo logico fino a 38 volte mantenendo un'alta pulizia degli ancilla, e definisce una matrice decisionale per l'implementazione specifica per piattaforma.

Sangkeum Lee2026-03-11⚛️ quant-ph

Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation

Questo articolo presenta una revisione sistematica e una valutazione delle prestazioni delle tecniche di Federated Learning negli ambienti di edge computing, confrontando cinque algoritmi su metriche chiave e identificando le sfide attuali e le direzioni future per sistemi più robusti e scalabili.

Sales Aribe Jr., Gil Nicholas Cagande2026-03-11🤖 cs.AI

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

Il paper presenta Auralink SDC, un'architettura basata su agenti AI autonomi distribuiti al bordo della rete che gestisce le infrastrutture di ricarica per veicoli elettrici, ottenendo un tasso di risoluzione autonoma degli incidenti del 78% e una latenza inferiore a 50ms grazie a modelli linguistici specializzati e tecniche di reasoning adattivo.

Mohammed Cherifi2026-03-11🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Questo articolo presenta un framework di compressione per il Reservoir Computing che, sfruttando un meccanismo di pruning basato sulla sensibilità, permette di esplorare sistematicamente i compromessi tra livelli di quantizzazione, tassi di pruning, accuratezza ed efficienza hardware, ottenendo significativi miglioramenti nell'efficienza computazionale e nelle risorse su FPGA senza degradare le prestazioni del modello.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco Platzner2026-03-11🤖 cs.AI

Architectural Design and Performance Analysis of FPGA based AI Accelerators: A Comprehensive Review

Questo articolo esamina le ottimizzazioni hardware e le architetture degli acceleratori basati su FPGA per il deep learning, evidenziando i loro vantaggi rispetto a GPU e ASIC, le tecniche di ottimizzazione impiegate e le sfide future per migliorare prestazioni ed efficienza energetica.

Soumita Chatterjee, Sudip Ghosh, Tamal Ghosh, Hafizur Rahaman2026-03-11🤖 cs.AI

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

Il paper presenta Zipage, un motore di inferenza per LLM che utilizza la tecnica Compressed PagedAttention per superare i colli di bottiglia della memoria KV cache, garantendo un'elevata concorrenza e un'accelerazione superiore a 2,1 volte mantenendo il 95% delle prestazioni rispetto ai sistemi a KV cache completa.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu Wan2026-03-11🤖 cs.AI

Diagnosing FP4 inference: a layer-wise and block-wise sensitivity analysis of NVFP4 and MXFP4

Questo studio analizza sistematicamente la sensibilità alla quantizzazione in formato FP4 (MXFP4 e NVFP4) su diverse scale di modelli Qwen2.5, rivelando che i livelli di proiezione MLP sono i più critici e che la sensibilità non si limita esclusivamente ai blocchi finali del modello.

Musa Cim, Burak Topcu, Mahmut Taylan Kandemir2026-03-11🤖 cs.AI

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Questo lavoro introduce il modello VI 2D SSM, un'architettura di spazio degli stati bidimensionale che garantisce l'equivarianza rispetto alle permutazioni nelle serie temporali multivariate, eliminando le dipendenze sequenziali artificiali tra le variabili e ottenendo prestazioni all'avanguardia grazie a una struttura teoricamente fondata su dinamiche locali e interazioni globali aggregate.

Seungwoo Jeong, Heung-Il Suk2026-03-11🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

Il paper introduce HCAPO, un nuovo framework che risolve le sfide di assegnazione del credito negli agenti LLM a lungo termine integrando un ragionamento *hindsight* per affinare le stime dei valori e migliorare significativamente le prestazioni rispetto ai metodi esistenti su benchmark complessi.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng Li2026-03-11🤖 cs.AI

Turn: A Language for Agentic Computation

Il paper presenta Turn, un linguaggio di programmazione compilato e basato su attori progettato per il calcolo agentiche, che integra sicurezza dei tipi cognitiva, un operatore di confidenza, un modello di processo isolato, un sistema di identità basato sulle capacità e l'assorbimento degli schemi a tempo di compilazione per garantire invariants critici come l'isolamento delle credenziali e la validazione dell'output dei modelli linguistici.

Muyukani Kizito2026-03-11🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

Questo lavoro dimostra che qualsiasi funzione $G$ -invariante su uno spazio prodotto $X \times M$ , dove $G$ agisce transitivamente su $M$ , può essere ridotta a un'invariante del sottogruppo di isotropia $H$ che agisce su $X$ , permettendo così di estendere i campi neurali equivarianti a spazi di condizionamento omogenei arbitrari rimuovendo i vincoli strutturali delle metodologie esistenti.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J Bekkers2026-03-11🤖 cs.AI

EDMFormer: Genre-Specific Self-Supervised Learning for Music Structure Segmentation

Il paper introduce EDMFormer, un modello transformer basato su apprendimento auto-supervisionato e sul nuovo dataset EDM-98, che supera le limitazioni degli approcci esistenti nella segmentazione strutturale della musica EDM identificando con maggiore precisione sezioni come drop e buildup attraverso l'analisi di energia, ritmo e timbro.

Sahal Sajeer, Krish Patel, Oscar Chung, Joel Song Bae2026-03-11🤖 cs.AI

Clear, Compelling Arguments: Rethinking the Foundations of Frontier AI Safety Cases

Questo articolo propone un nuovo quadro teorico e metodologico per i casi di sicurezza dell'IA avanzata, criticando gli approcci attuali della comunità di allineamento e integrando lezioni tratte da settori ad alta criticità come l'aerospaziale e il nucleare per sviluppare argomentazioni più robuste e difendibili, con un caso di studio specifico su allineamento ingannevole e capacità CBRN.

Shaun Feakins, Ibrahim Habli, Phillip Morgan2026-03-11🤖 cs.AI

Multi-level meta-reinforcement learning with skill-based curriculum

Questo lavoro propone un framework di apprendimento per rinforzo multi-livello che, attraverso la compressione gerarchica dei processi decisionali e un curriculum didattico, facilita l'astrazione, la riduzione della stocasticità e il trasferimento di competenze tra diversi problemi e livelli di complessità.

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)2026-03-11🤖 cs.AI

Large Language Model-Assisted Superconducting Qubit Experiments

Questo lavoro presenta un framework che utilizza un modello linguistico su larga scala per automatizzare il controllo e la misurazione dei qubit superconduttori, dimostrando la sua efficacia nella caratterizzazione autonoma dei risonatori e nella riproduzione di procedure di caratterizzazione quantistica non distruttiva.

Shiheng Li, Jacob M. Miller, Phoebe J. Lee, Gustav Andersson, Christopher R. Conner, Yash J. Joshi, Bayan Karimi, Amber M. King, Howard L. Malc, Harsh Mishra, Hong Qiao, Minseok Ryu, Xuntao Wu, Siyuan Xing, Haoxiong Yan, Jian Shi, Andrew N. Cleland2026-03-11⚛️ quant-ph

Test-Driven AI Agent Definition (TDAD): Compiling Tool-Using Agents from Behavioral Specifications

Il paper presenta TDAD, una metodologia che tratta i prompt degli agenti AI come artefatti compilati, trasformando le specifiche comportamentali in test eseguibili e affinando iterativamente i prompt per garantire la conformità comportamentale e mitigare i rischi di regressione e spec gaming.

Tzafrir Rehan2026-03-11🤖 cs.AI

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Il paper presenta Scale-Plan, un framework scalabile che combina modelli linguistici e pianificazione simbolica per generare rappresentazioni compatte di compiti multi-robot eterogenei, superando le limitazioni di allucinazione e scalabilità degli approcci esistenti attraverso la filtrazione delle informazioni irrilevanti e la validazione su un nuovo benchmark MAT2-THOR.

Piyush Gupta, Sangjae Bae, Jiachen Li, David Isele2026-03-11🤖 cs.AI

Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage

Lo studio dimostra che le metriche di recupero basate sulla copertura sono forti indicatori predittivi della completezza informativa nelle risposte generate dai sistemi RAG, specialmente quando gli obiettivi di recupero e generazione sono allineati.

Saron Samuel, Alexander Martin, Eugene Yang, Andrew Yates, Dawn Lawrie, Ian Soborof, Laura Dietz, Benjamin Van Durme2026-03-11🤖 cs.AI

Fish Audio S2 Technical Report

Il documento presenta Fish Audio S2, un sistema open-source di sintesi vocale che supporta la generazione multi-parlante e multi-turno con controllo tramite istruzioni in linguaggio naturale, accompagnato da un motore di inferenza ottimizzato per lo streaming e risorse rilasciate pubblicamente.

Shijia Liao, Yuxuan Wang, Songting Liu, Yifan Cheng, Ruoyi Zhang, Tianyu Li, Shidong Li, Yisheng Zheng, Xingwei Liu, Qingzheng Wang, Zhizhuo Zhou, Jiahua Liu, Xin Chen, Dawei Han2026-03-11🤖 cs.AI

← Precedente Successivo →