cs.LG articoli | Gist.Science

One Size Does Not Fit All: Token-Wise Adaptive Compression for KV Cache

Il paper presenta DynaKV, un innovativo framework di post-addestramento per la compressione del cache KV che assegna dinamicamente tassi di compressione a livello di token in base al loro significato semantico, ottenendo così una riduzione significativa della memoria e prestazioni superiori rispetto alle tecniche esistenti, specialmente se combinato con metodi di pruning come SnapKV.

Liming Lu, Kaixi Qiu, Jiayu Zhou + 6 more2026-03-06💻 cs

Decorrelating the Future: Joint Frequency Domain Learning for Spatio-temporal Forecasting

Il paper propone FreST Loss, un obiettivo di addestramento basato sulla trasformata di Fourier congiunta che supera i limiti delle funzioni di perdita tradizionali decorrelando le dipendenze spaziali e temporali nel dominio frequenziale, migliorando così le prestazioni dei modelli di previsione spaziotemporale su diversi dataset reali.

Zepu Wang, Bowen Liao, Jeff + 1 more2026-03-06💻 cs

Context-Dependent Affordance Computation in Vision-Language Models

Lo studio dimostra che i modelli visione-linguaggio calcolano le affordance in modo fortemente dipendente dal contesto, mostrando una deriva significativa sia lessicale che semantica che suggerisce la necessità di un'ontologia dinamica e adattiva per la robotica.

Murad Farzulla2026-03-06💻 cs

Machine Learning for Complex Systems Dynamics: Detecting Bifurcations in Dynamical Systems with Deep Neural Networks

Questo studio propone le Equilibrium-Informed Neural Networks (EINN), un approccio basato sul deep learning che inverte il processo tradizionale di analisi delle biforcazioni utilizzando stati di equilibrio come input per inferire i parametri del sistema, consentendo così di rilevare in modo efficiente le soglie critiche e i punti di svolta in sistemi dinamici complessi.

Swadesh Pal, Roderick Melnik2026-03-06🔢 math

FedEMA-Distill: Exponential Moving Average Guided Knowledge Distillation for Robust Federated Learning

Il paper propone FedEMA-Distill, un metodo di apprendimento federato robusto ed efficiente che combina una media mobile esponenziale con la distillazione della conoscenza basata sui logit aggregati per mitigare l'eterogeneità dei dati, ridurre il carico di comunicazione e resistere ad attacchi avversari senza richiedere modifiche ai client.

Hamza Reguieg, Mohamed El Kamili, Essaid Sabir2026-03-06💻 cs

When Scaling Fails: Network and Fabric Effects on Distributed GPU Training Performance

Questo studio empirico dimostra che le prestazioni dell'addestramento distribuito su GPU su larga scala sono spesso dominate da fattori di rete e di fabric, come la topologia e la congestione, che causano un ritorno decrescente e comportamenti instabili non rilevati dagli strumenti di profilazione standard, fornendo al contempo principi diagnostici pratici per mitigare questi problemi.

Dinesh Gopalan, Ratul Ali2026-03-06💻 cs

Data-Driven Optimization of Multi-Generational Cellular Networks: A Performance Classification Framework for Strategic Infrastructure Management

Questo studio analizza un dataset di reti cellulari multigenerazionali per identificare modelli di utilizzo e lacune infrastrutturali, fornendo alle operatori mobili indicazioni strategiche per ottimizzare le risorse, aggiornare le tecnologie legacy e colmare il divario digitale.

Maryam Sabahat, M. Umar Khan2026-03-06💻 cs

Delta-Crosscoder: Robust Crosscoder Model Diffing in Narrow Fine-Tuning Regimes

Il paper introduce Delta-Crosscoder, un metodo innovativo che combina sparsità BatchTopK e una perdita basata sulle differenze per isolare con successo le direzioni latenti responsabili di comportamenti specifici nei modelli fine-tuned, superando le limitazioni degli approcci esistenti in scenari di modifica stretta e asimmetrica.

Aly Kassem, Thomas Jiralerspong, Negar Rostamzadeh + 1 more2026-03-06💻 cs

Thin Keys, Full Values: Reducing KV Cache via Low-Dimensional Attention Selection

Il paper propone di ridurre la dimensione delle chiavi (keys) nell'attenzione dei transformer, sfruttando l'asimmetria tra la selezione (a bassa dimensionalità) e il trasferimento di valori (ad alta dimensionalità), per ottenere un risparmio significativo della cache KV con una minima perdita di qualità del modello.

Hengshuai Yao, Guan Wang2026-03-06💻 cs

Agent Memory Below the Prompt: Persistent Q4 KV Cache for Multi-Agent LLM Inference on Edge Devices

Questo paper presenta un sistema per l'inferenza multi-agente LLM su dispositivi edge che risolve i vincoli di memoria persistendo le cache KV quantizzate a 4 bit su disco, permettendo il ripristino diretto dello stato di attenzione e riducendo il tempo di primo token fino a 136 volte rispetto al ricalcolo completo, con un impatto minimo sulla qualità del modello.

Yakov Pyotr Shkolnikov2026-03-06💻 cs

Flowers: A Warp Drive for Neural PDE Solvers

Il paper introduce Flowers, un'architettura neurale efficiente e scalabile per la risoluzione di equazioni differenziali alle derivate parziali (PDE) basata esclusivamente su operazioni di "warping" multi-head che, eliminando trasformate di Fourier e meccanismi di attenzione, supera le prestazioni dei modelli esistenti su una vasta gamma di benchmark fisici.

Till Muser, Alexandra Spitzer, Matti Lassas + 2 more2026-03-06💻 cs

Uncertainty-Calibrated Spatiotemporal Field Diffusion with Sparse Supervision

Il paper presenta SOLID, un framework di diffusione condizionato da maschere che apprende la dinamica spazio-temporale esclusivamente da osservazioni sparse senza richiedere dati densi, permettendo la ricostruzione di campi completi con mappe di incertezza ben calibrate.

Kevin Valencia, Xihaier Luo, Shinjae Yoo + 1 more2026-03-06💻 cs

Auction-Based RIS Allocation With DRL: Controlling the Cost-Performance Trade-Off

Questo studio propone un meccanismo di allocazione delle superfici intelligenti riconfigurabili (RIS) basato su aste ascendenti simultanee e agenti di apprendimento per rinforzo profondo (DRL) che ottimizzano il compromesso tra costi e prestazioni nelle reti wireless multi-cellula, permettendo un controllo flessibile dell'aggressività delle offerte.

Martin Mark Zan, Stefan Schwarz2026-03-06💻 cs

ZorBA: Zeroth-order Federated Fine-tuning of LLMs with Heterogeneous Block Activation

Il paper propone ZorBA, un framework di fine-tuning federato per grandi modelli linguistici che utilizza ottimizzazione di ordine zero e attivazione eterogenea dei blocchi per ridurre drasticamente l'uso di VRAM e l'overhead di comunicazione mantenendo un'alta efficienza di convergenza.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-06💻 cs

ASFL: An Adaptive Model Splitting and Resource Allocation Framework for Split Federated Learning

Il documento propone ASFL, un framework di apprendimento federato diviso adattivo che ottimizza la velocità di convergenza, il ritardo e il consumo energetico nei network wireless mediante un algoritmo di ottimizzazione online che gestisce dinamicamente la suddivisione del modello e l'allocazione delle risorse.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-06💻 cs

CogGen: Cognitive-Load-Informed Fully Unsupervised Deep Generative Modeling for Compressively Sampled MRI Reconstruction

Il paper presenta CogGen, un modello generativo profondo completamente non supervisionato che migliora la ricostruzione della risonanza magnetica campionata in modo compresso regolando il "carico cognitivo" attraverso una strategia di apprendimento curricolare che passa gradualmente dal fitting dei dati a bassa frequenza a quelli ad alta frequenza, superando così i limiti di convergenza e di sovrapposizione dei metodi tradizionali.

Qingyong Zhu, Yumin Tan, Xiang Gu + 1 more2026-03-06💻 cs

Explainable Regime Aware Investing

Il documento presenta un framework di investimento regime-aware spiegabile basato su un modello HMM di Wasserstein strettamente causale che, adattando dinamicamente la complessità dei regimi e preservandone l'identità, ottiene performance rischio-rendimento superiori e un minor drawdown rispetto ai benchmark tradizionali e a metodi non parametrici.

Amine Boukardagha2026-03-06💻 cs

AMV-L: Lifecycle-Managed Agent Memory for Tail-Latency Control in Long-Running LLM Systems

Il paper presenta AMV-L, un framework di gestione della memoria per agenti LLM a lungo termine che, sostituendo le tradizionali politiche basate sull'età con un ciclo di vita guidato dal valore e un set di candidati limitato, garantisce un controllo preciso della latenza di coda e migliora significativamente il throughput e la stabilità rispetto ai sistemi esistenti.

Emmanuel Bamidele2026-03-06💻 cs

SkillNet: Create, Evaluate, and Connect AI Skills

Il paper introduce SkillNet, un'infrastruttura aperta che crea, valuta e organizza competenze AI su larga scala attraverso un'ontologia unificata e un repository di oltre 200.000 competenze, migliorando significativamente le prestazioni degli agenti riducendo la necessità di reinventare soluzioni già esistenti.

Yuan Liang, Ruobin Zhong, Haoming Xu + 46 more2026-03-06✓ Author reviewed ⓘ💻 cs

An Explainable Ensemble Framework for Alzheimer's Disease Prediction Using Structured Clinical and Cognitive Data

Questo studio presenta un framework di ensemble spiegabile che, combinando tecniche di bilanciamento dei dati e algoritmi come XGBoost e Random Forest, raggiunge un'accurata e trasparente previsione dell'Alzheimer basata su dati clinici e cognitivi strutturati.

Nishan Mitra2026-03-06💻 cs

← Precedente Successivo →