Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Questo articolo presenta un framework di compressione per il Reservoir Computing che, sfruttando un meccanismo di pruning basato sulla sensibilità, permette di esplorare sistematicamente i compromessi tra livelli di quantizzazione, tassi di pruning, accuratezza ed efficienza hardware, ottenendo significativi miglioramenti nell'efficienza computazionale e nelle risorse su FPGA senza degradare le prestazioni del modello.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco Platzner2026-03-11🤖 cs.AI

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

Il paper presenta Zipage, un motore di inferenza per LLM che utilizza la tecnica Compressed PagedAttention per superare i colli di bottiglia della memoria KV cache, garantendo un'elevata concorrenza e un'accelerazione superiore a 2,1 volte mantenendo il 95% delle prestazioni rispetto ai sistemi a KV cache completa.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu Wan2026-03-11🤖 cs.AI

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Questo lavoro introduce il modello VI 2D SSM, un'architettura di spazio degli stati bidimensionale che garantisce l'equivarianza rispetto alle permutazioni nelle serie temporali multivariate, eliminando le dipendenze sequenziali artificiali tra le variabili e ottenendo prestazioni all'avanguardia grazie a una struttura teoricamente fondata su dinamiche locali e interazioni globali aggregate.

Seungwoo Jeong, Heung-Il Suk2026-03-11🤖 cs.AI

Turn: A Language for Agentic Computation

Il paper presenta Turn, un linguaggio di programmazione compilato e basato su attori progettato per il calcolo agentiche, che integra sicurezza dei tipi cognitiva, un operatore di confidenza, un modello di processo isolato, un sistema di identità basato sulle capacità e l'assorbimento degli schemi a tempo di compilazione per garantire invariants critici come l'isolamento delle credenziali e la validazione dell'output dei modelli linguistici.

Muyukani Kizito2026-03-11🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

Questo lavoro dimostra che qualsiasi funzione GG-invariante su uno spazio prodotto X×MX \times M, dove GG agisce transitivamente su MM, può essere ridotta a un'invariante del sottogruppo di isotropia HH che agisce su XX, permettendo così di estendere i campi neurali equivarianti a spazi di condizionamento omogenei arbitrari rimuovendo i vincoli strutturali delle metodologie esistenti.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J Bekkers2026-03-11🤖 cs.AI

Clear, Compelling Arguments: Rethinking the Foundations of Frontier AI Safety Cases

Questo articolo propone un nuovo quadro teorico e metodologico per i casi di sicurezza dell'IA avanzata, criticando gli approcci attuali della comunità di allineamento e integrando lezioni tratte da settori ad alta criticità come l'aerospaziale e il nucleare per sviluppare argomentazioni più robuste e difendibili, con un caso di studio specifico su allineamento ingannevole e capacità CBRN.

Shaun Feakins, Ibrahim Habli, Phillip Morgan2026-03-11🤖 cs.AI

Large Language Model-Assisted Superconducting Qubit Experiments

Questo lavoro presenta un framework che utilizza un modello linguistico su larga scala per automatizzare il controllo e la misurazione dei qubit superconduttori, dimostrando la sua efficacia nella caratterizzazione autonoma dei risonatori e nella riproduzione di procedure di caratterizzazione quantistica non distruttiva.

Shiheng Li, Jacob M. Miller, Phoebe J. Lee, Gustav Andersson, Christopher R. Conner, Yash J. Joshi, Bayan Karimi, Amber M. King, Howard L. Malc, Harsh Mishra, Hong Qiao, Minseok Ryu, Xuntao Wu, Siyuan Xing, Haoxiong Yan, Jian Shi, Andrew N. Cleland2026-03-11⚛️ quant-ph

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

Il paper presenta Scale-Plan, un framework scalabile che combina modelli linguistici e pianificazione simbolica per generare rappresentazioni compatte di compiti multi-robot eterogenei, superando le limitazioni di allucinazione e scalabilità degli approcci esistenti attraverso la filtrazione delle informazioni irrilevanti e la validazione su un nuovo benchmark MAT2-THOR.

Piyush Gupta, Sangjae Bae, Jiachen Li, David Isele2026-03-11🤖 cs.AI

Fish Audio S2 Technical Report

Il documento presenta Fish Audio S2, un sistema open-source di sintesi vocale che supporta la generazione multi-parlante e multi-turno con controllo tramite istruzioni in linguaggio naturale, accompagnato da un motore di inferenza ottimizzato per lo streaming e risorse rilasciate pubblicamente.

Shijia Liao, Yuxuan Wang, Songting Liu, Yifan Cheng, Ruoyi Zhang, Tianyu Li, Shidong Li, Yisheng Zheng, Xingwei Liu, Qingzheng Wang, Zhizhuo Zhou, Jiahua Liu, Xin Chen, Dawei Han2026-03-11🤖 cs.AI