cs.LG articoli | Gist.Science

Equitable Multi-Task Learning for AI-RANs

Questo articolo presenta il framework OWO-FMTL, un approccio di apprendimento multi-task online che garantisce equità a lungo termine nelle prestazioni di inferenza per utenti eterogenei nelle reti di accesso radio abilitate all'IA, bilanciando efficienza e giustizia attraverso un aggiornamento primale-duale leggero e una quantificazione basata sull'alpha-fairness generalizzata.

Panayiotis Raptis, Fatih Aslan, George IosifidisWed, 11 Ma🤖 cs.LG

KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware

Il paper presenta KernelCraft, il primo benchmark che valuta la capacità di agenti LLM di generare e ottimizzare automaticamente kernel a basso livello per acceleratori emergenti con nuove ISAs, dimostrando come un flusso di lavoro guidato da feedback possa ridurre i costi di sviluppo e produrre kernel validi ed efficienti.

Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren ZhaoWed, 11 Ma🤖 cs.LG

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

Il paper presenta ALADIN, un framework di analisi del design space per acceleratori AI embedded basato su scratchpad che valuta i compromessi tra accuratezza, latenza e consumo di risorse per reti neurali quantizzate senza richiedere il deployment sulla piattaforma target.

T. Baldi, D. Casini, A. BiondiWed, 11 Ma🤖 cs.AI

Performance Analysis of Edge and In-Sensor AI Processors: A Comparative Review

Questo articolo offre una revisione comparativa dei processori AI edge e in-sensor, integrando un'analisi architetturale con benchmark empirici su tre piattaforme rappresentative (GAP9, STM32N6 e Sony IMX500) per evidenziare i compromessi tra latenza, efficienza energetica e il crescente potenziale dell'elaborazione direttamente nel sensore.

Luigi Capogrosso, Pietro Bonazzi, Michele MagnoWed, 11 Ma🤖 cs.LG

Data-Rate-Aware High-Speed CNN Inference on FPGAs

Questo articolo presenta un'architettura acceleratore CNN per FPGA che, attraverso l'esplorazione dello spazio di progettazione e l'elaborazione multi-pixel, adatta dinamicamente l'implementazione hardware alle variazioni del tasso di dati tra i layer, massimizzando l'utilizzo delle risorse e riducendo il consumo di componenti aritmetici per l'esecuzione efficiente di reti complesse.

Tobias Habermann, Martin KummWed, 11 Ma🤖 cs.LG

Memory-Augmented Spiking Networks: Synergistic Integration of Complementary Mechanisms for Neuromorphic Vision

Questo studio dimostra che l'integrazione sinergica di meccanismi complementari, come l'apprendimento contrastivo supervisionato e le reti ricorrenti gerarchiche, in reti neurali a impulsi (SNN) supera i compromessi delle singole ottimizzazioni, raggiungendo prestazioni superiori in termini di accuratezza, efficienza energetica e organizzazione strutturale sul dataset N-MNIST.

Effiong Blessing, Chiung-Yi Tseng, Isaac Nkrumah, Junaid RehmanWed, 11 Ma🤖 cs.LG

Hebbian-Oscillatory Co-Learning

Il paper introduce HOC-L, un quadro dinamico unificato che combina la geometria iperbolica sparsa e la sincronizzazione oscillatoria per realizzare una co-apprendimento strutturale e di fase in architetture neurali bio-ispirate, garantendo convergenza teorica e complessità computazionale ridotta.

Hasi HaysWed, 11 Ma🤖 cs.LG

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

Il paper presenta Auralink SDC, un'architettura basata su agenti AI autonomi distribuiti al bordo della rete che gestisce le infrastrutture di ricarica per veicoli elettrici, ottenendo un tasso di risoluzione autonoma degli incidenti del 78% e una latenza inferiore a 50ms grazie a modelli linguistici specializzati e tecniche di reasoning adattivo.

Mohammed CherifiWed, 11 Ma🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Questo articolo presenta un framework di compressione per il Reservoir Computing che, sfruttando un meccanismo di pruning basato sulla sensibilità, permette di esplorare sistematicamente i compromessi tra livelli di quantizzazione, tassi di pruning, accuratezza ed efficienza hardware, ottenendo significativi miglioramenti nell'efficienza computazionale e nelle risorse su FPGA senza degradare le prestazioni del modello.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco PlatznerWed, 11 Ma🤖 cs.AI

The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

Il documento presenta la famiglia AetherFloat, un'architettura di punto flottante quad-radice (base-4) con mantissa esplicita progettata per acceleratori AI che elimina la necessità di blocchi di scalatura dinamica, riducendo significativamente area, potenza e ritardo critico rispetto agli standard IEEE 754.

Keita MorisakiWed, 11 Ma🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

Questo lavoro presenta un framework basato su reti neurali informate dalla fisica (PINN) che permette una stima robusta dei parametri biofisici e la ricostruzione degli stati nascosti in modelli neuronali multiscala, superando le limitazioni dei metodi tradizionali grazie alla sua efficacia anche con osservazioni parziali, rumorose e inizializzazioni non informative.

Changliang Wei, Yangyang Wang, Xueyu ZhuWed, 11 Ma🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Questo lavoro introduce il modello VI 2D SSM, un'architettura di spazio degli stati bidimensionale che garantisce l'equivarianza rispetto alle permutazioni nelle serie temporali multivariate, eliminando le dipendenze sequenziali artificiali tra le variabili e ottenendo prestazioni all'avanguardia grazie a una struttura teoricamente fondata su dinamiche locali e interazioni globali aggregate.

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

Il paper introduce HCAPO, un nuovo framework che risolve le sfide di assegnazione del credito negli agenti LLM a lungo termine integrando un ragionamento *hindsight* per affinare le stime dei valori e migliorare significativamente le prestazioni rispetto ai metodi esistenti su benchmark complessi.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng LiWed, 11 Ma🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

Questo lavoro dimostra che qualsiasi funzione $G$ -invariante su uno spazio prodotto $X \times M$ , dove $G$ agisce transitivamente su $M$ , può essere ridotta a un'invariante del sottogruppo di isotropia $H$ che agisce su $X$ , permettendo così di estendere i campi neurali equivarianti a spazi di condizionamento omogenei arbitrari rimuovendo i vincoli strutturali delle metodologie esistenti.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J BekkersWed, 11 Ma🤖 cs.AI

On the Formal Limits of Alignment Verification

Il documento dimostra che non è possibile creare un procedimento di verifica dell'allineamento dell'IA che soddisfi contemporaneamente le proprietà di correttezza, generalità e tracciabilità, stabilendo un trilemma fondamentale che delimita i limiti della certificazione formale della sicurezza.

Ayushi AgarwalWed, 11 Ma🤖 cs.LG

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

Il paper introduce SPREAD, un framework per l'apprendimento per imitazione lifelong che utilizza la decomposizione ai valori singolari per allineare le rappresentazioni delle politiche in sottospazi a basso rango preservando la geometria intrinseca dei compiti, combinato con una strategia di distillazione guidata dalla confidenza, ottenendo così prestazioni all'avanguardia nel benchmark LIBERO mitigando l'oblio catastrofico.

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman MoghadamWed, 11 Ma🤖 cs.LG

Micro-Diffusion Compression -- Binary Tree Tweedie Denoising for Online Probability Estimation

Il paper presenta Midicoth, un sistema di compressione senza perdita che migliora l'efficienza della previsione probabilistica nei modelli adattivi applicando un layer di denoising micro-diffusione basato su un albero binario per correggere le distorsioni delle stime di probabilità in modo online e data-efficiente.

Roberto TacconelliWed, 11 Ma🤖 cs.LG

Multi-level meta-reinforcement learning with skill-based curriculum

Questo lavoro propone un framework di apprendimento per rinforzo multi-livello che, attraverso la compressione gerarchica dei processi decisionali e un curriculum didattico, facilita l'astrazione, la riduzione della stocasticità e il trasferimento di competenze tra diversi problemi e livelli di complessità.

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)Wed, 11 Ma🤖 cs.AI

The Temporal Markov Transition Field

Il paper introduce il Temporal Markov Transition Field (TMTF), un'estensione del Markov Transition Field che, suddividendo la serie temporale in blocchi contigui e calcolando matrici di transizione locali, risolve il problema della perdita di informazioni temporali nei processi non stazionari, generando una rappresentazione immagine adatta alle reti neurali convoluzionali.

Michael LeznikWed, 11 Ma🤖 cs.LG

SoftJAX & SoftTorch: Empowering Automatic Differentiation Libraries with Informative Gradients

Il lavoro introduce SoftJAX e SoftTorch, librerie open-source che offrono rilassamenti "soft" differenziabili e completi per sostituire le operazioni rigide in JAX e PyTorch, fornendo gradienti informativi per l'ottimizzazione in campi scientifici.

Anselm Paulus, A. René Geist, Vít Musil, Sebastian Hoffmann, Onur Beker, Georg MartiusWed, 11 Ma🤖 cs.LG

← Precedente Successivo →