cs.LG articoli | Gist.Science

SmartBench: Evaluating LLMs in Smart Homes with Anomalous Device States and Behavioral Contexts

Il paper introduce SmartBench, il primo dataset e benchmark per valutare le capacità dei grandi modelli linguistici (LLM) nel rilevare e gestire stati anomali e contesti comportamentali nelle case intelligenti, rivelando che i modelli attuali mostrano prestazioni insufficienti in questo compito critico.

Qingsong Zou, Zhi Yan, Zhiyao Xu, Kuofeng Gao, Jingyu Xiao, Yong Jiang2026-03-10🤖 cs.LG

HEARTS: Benchmarking LLM Reasoning on Health Time Series

Il paper introduce HEARTS, un benchmark unificato che valuta le capacità di ragionamento gerarchico dei modelli linguistici su serie temporali sanitarie, rivelando che le attuali LLM faticano a gestire la complessità temporale e le dipendenze a lungo termine rispetto ai modelli specializzati.

Sirui Li, Shuhan Xiao, Mihir Joshi, Ahmed Metwally, Daniel McDuff, Wei Wang, Yuzhe Yang2026-03-10🤖 cs.LG

RECAP: Local Hebbian Prototype Learning as a Self-Organizing Readout for Reservoir Dynamics

Il paper presenta RECAP, una strategia di apprendimento bio-ispirata che combina dinamiche di reservoir non addestrate con un meccanismo di lettura Hebbiano auto-organizzante per ottenere una classificazione di immagini robusta senza ricorrere alla retropropagazione dell'errore.

Heng Zhang2026-03-10🤖 cs.LG

Roots Beneath the Cut: Uncovering the Risk of Concept Revival in Pruning-Based Unlearning for Diffusion Models

Questo studio rivela che l'approccio di "unlearning" basato sulla potatura dei pesi nei modelli di diffusione è vulnerabile a un attacco di risveglio dei concetti cancellati, poiché le posizioni dei pesi rimossi fungono da segnale secondario che permette la loro completa ricostruzione senza dati aggiuntivi o riaddestramento.

Ci Zhang, Zhaojun Ding, Chence Yang, Jun Liu, Xiaoming Zhai, Shaoyi Huang, Beiwen Li, Xiaolong Ma, Jin Lu, Geng Yuan2026-03-10🤖 cs.LG

SR-TTT: Surprisal-Aware Residual Test-Time Training

Il paper introduce SR-TTT, un modello di linguaggio che risolve il problema della perdita di informazioni nei metodi Test-Time Training puri, integrando un meccanismo di memoria residua a gate basato sulla sorpresa per preservare in modo efficiente i token critici mantenendo un footprint di memoria costante.

Swamynathan V P2026-03-10🤖 cs.LG

Quantum Deep Learning: A Comprehensive Review

Questa recensione offre una definizione operativa e una tassonomia del quantum deep learning, analizzando paradigmi, architetture, sfide hardware e applicazioni pratiche per guidare il passaggio dalle dimostrazioni attuali a implementazioni scalabili e fault-tolerant.

Yanjun Ji, Zhao-Yun Chen, Marco Roth, David A. Kreplin, Christian Schiffer, Martin King, Oliver Anton, M. Sahnawaz Alam, Markus Krutzik, Dennis Willsch, Ludwig Mathey, Frank K. Wilhelm, Guo-Ping Guo2026-03-10⚛️ quant-ph

Trust Aware Federated Learning for Secure Bone Healing Stage Interpretation in e-Health

Questo articolo presenta un framework di apprendimento federato consapevole della fiducia che utilizza un meccanismo di valutazione e filtraggio adattivo per migliorare la stabilità e l'accuratezza dell'interpretazione delle fasi di guarigione ossea in ambienti e-Health distribuiti, mitigando efficacemente l'impatto di partecipanti inaffidabili o ostili.

Paul Shepherd, Tasos Dagiuklas, Bugra Alkan, Joaquim Bastos, Jonathan Rodriguez2026-03-10🤖 cs.LG

HURRI-GAN: A Novel Approach for Hurricane Bias-Correction Beyond Gauge Stations using Generative Adversarial Networks

Il paper presenta HURRI-GAN, un approccio innovativo basato sulle reti generative avversarie (GAN) che corregge i bias dei modelli fisici di simulazione degli uragani, consentendo previsioni di mareggiate e venti più rapide e accurate anche in aree oltre la portata delle stazioni di rilevamento tradizionali.

Noujoud Nadera, Hadi Majed, Stefanos Giaremis, Rola El Osta, Clint Dawson, Carola Kaiser, Hartmut Kaiser2026-03-10🤖 cs.LG

Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds

Il paper propone la Geodesic Gradient Descent (GGD), un ottimizzatore generico privo di learning rate che approssima la geometria della funzione obiettivo tramite sfere n-dimensionali per garantire che le traiettorie di aggiornamento rimangano sulla superficie, ottenendo risultati superiori rispetto ad Adam su diversi dataset.

Liwei Hu, Guangyao Li, Wenyong Wang, Xiaoming Zhang, Yu Xiang2026-03-10🤖 cs.LG

How the Graph Construction Technique Shapes Performance in IoT Botnet Detection

Questo studio dimostra che la scelta della tecnica di costruzione del grafo influenza significativamente le prestazioni dei modelli GNN per il rilevamento di botnet IoT, evidenziando che l'uso del grafo di Gabriel, combinato con un autoencoder variazionale per la riduzione dimensionale, raggiunge la massima accuratezza del 97,56% nel dataset N-BaIoT.

Hassan Wasswa, Hussein Abbass, Timothy Lynar2026-03-10🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

Il paper introduce PAG, un nuovo framework per la ricerca approssimata dei vicini più prossimi che integra tecniche di proiezione in un indice grafico per soddisfare simultaneamente le esigenze moderne di efficienza, velocità di indicizzazione, basso consumo di memoria e scalabilità, superando le prestazioni di HNSW.

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan Xiao2026-03-10🤖 cs.LG

EnsAug: Augmentation-Driven Ensembles for Human Motion Sequence Analysis

Il paper presenta EnsAug, un nuovo paradigma di addestramento che utilizza un ensemble di modelli specializzati, ciascuno allenato su una specifica trasformazione geometrica dei dati, per superare i limiti delle tecniche di aumento generiche e raggiungere prestazioni superiori nel riconoscimento di movimenti umani e della lingua dei segni.

Bikram De, Habib Irani, Vangelis Metsis2026-03-10🤖 cs.LG

HyperTokens: Controlling Token Dynamics for Continual Video-Language Understanding

Il paper introduce HyperTokens, un metodo basato su un generatore di token che produce prompt su richiesta e utilizza regolarizzatori ispirati al meta-apprendimento e supervisione multimodale ausiliaria per migliorare l'apprendimento continuo nel VideoQA riducendo il dimenticamento e i costi di memoria.

Toan Nguyen, Yang Liu, Celso De Melo, Flora D. Salim2026-03-10🤖 cs.LG

ERP-RiskBench: Leakage-Safe Ensemble Learning for Financial Risk

Il paper presenta ERP-RiskBench, un nuovo framework sperimentale sicuro dalle fughe di dati che utilizza un ensemble di apprendimento automatico per migliorare il rilevamento dei rischi finanziari nei sistemi ERP, offrendo un benchmark riproducibile e una valutazione rigorosa delle prestazioni.

Sanjay Mishra2026-03-10🤖 cs.LG

Unmixing microinfrared spectroscopic images of cross-sections of historical oil paintings

Questo articolo presenta un autoencoder CNN non supervisionato, dotato di una funzione di perdita basata sulla distanza angolare spettrale ponderata (WSAD), per l'analisi non distruttiva e l'identificazione automatica dei componenti nei campioni stratificati di dipinti storici, come dimostrato su una sezione trasversale del Polittico di Gand.

Shivam Pande, Nicolas Nadisic, Francisco Mederos-Henry, Aleksandra Pizurica2026-03-10🤖 cs.LG

GNN For Muon Particle Momentum estimation

Questo articolo dimostra che le Reti Neurali su Grafi (GNN) superano i modelli tradizionali come TabNet nella stima dell'impulso delle particelle muoniche per il trigger CMS, evidenziando come la scelta delle dimensioni delle caratteristiche dei nodi sia cruciale per l'efficienza del modello.

Vishak K Bhat, Eric A. F. Reinhardt, Sergei Gleyzer2026-03-10🤖 cs.LG

XAI and Few-shot-based Hybrid Classification Model for Plant Leaf Disease Prognosis

Questo lavoro presenta un modello ibrido di apprendimento few-shot integrato con l'intelligenza artificiale spiegabile (XAI) per diagnosticare con alta precisione e trasparenza le malattie delle foglie di mais, riso e grano anche in condizioni di dati annotati limitati.

Diana Susan Joseph, Pranav M Pawar, Raja Muthalagu, Mithun Mukharjee2026-03-10🤖 cs.LG

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

Il paper propone PRPO, un metodo di ottimizzazione parallela per risolvere i conflitti di addestramento nei modelli LVLM per l'analisi dei grafici, e MCDR-Bench, una nuova benchmark per la valutazione oggettiva delle capacità di ricerca approfondita, stabilendo un quadro unificato che supera le attuali limitazioni nell'intelligenza dei dati visivi.

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

Il paper propone una strategia plug-and-play basata su un passo di denoising inverso aggiuntivo e sul campionamento Monte-Carlo (ABMS) per ridurre gli errori di stima nei modelli generativi guidati da SDE, migliorando così la qualità e la coerenza della generazione condizionata in diversi scenari applicativi.

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

Questo lavoro presenta un nuovo framework di apprendimento non supervisionato basato su filtri convoluzionali e reti neurali che, pur in assenza di dataset di addestramento e in condizioni di forte rumore, permette una ricostruzione ad alta fedeltà delle immagini del fascio e una risoluzione senza precedenti della struttura dell'alone nei diagnostici di acceleratori di particelle.

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

← Precedente Successivo →