cs.LG articoli | Gist.Science

SR-TTT: Surprisal-Aware Residual Test-Time Training

Il paper introduce SR-TTT, un modello di linguaggio che risolve il problema della perdita di informazioni nei metodi Test-Time Training puri, integrando un meccanismo di memoria residua a gate basato sulla sorpresa per preservare in modo efficiente i token critici mantenendo un footprint di memoria costante.

Swamynathan V P2026-03-10🤖 cs.LG

Quantum Deep Learning: A Comprehensive Review

Questa recensione offre una definizione operativa e una tassonomia del quantum deep learning, analizzando paradigmi, architetture, sfide hardware e applicazioni pratiche per guidare il passaggio dalle dimostrazioni attuali a implementazioni scalabili e fault-tolerant.

Yanjun Ji, Zhao-Yun Chen, Marco Roth, David A. Kreplin, Christian Schiffer, Martin King, Oliver Anton, M. Sahnawaz Alam, Markus Krutzik, Dennis Willsch, Ludwig Mathey, Frank K. Wilhelm, Guo-Ping Guo2026-03-10⚛️ quant-ph

Trust Aware Federated Learning for Secure Bone Healing Stage Interpretation in e-Health

Questo articolo presenta un framework di apprendimento federato consapevole della fiducia che utilizza un meccanismo di valutazione e filtraggio adattivo per migliorare la stabilità e l'accuratezza dell'interpretazione delle fasi di guarigione ossea in ambienti e-Health distribuiti, mitigando efficacemente l'impatto di partecipanti inaffidabili o ostili.

Paul Shepherd, Tasos Dagiuklas, Bugra Alkan, Joaquim Bastos, Jonathan Rodriguez2026-03-10🤖 cs.LG

HURRI-GAN: A Novel Approach for Hurricane Bias-Correction Beyond Gauge Stations using Generative Adversarial Networks

Il paper presenta HURRI-GAN, un approccio innovativo basato sulle reti generative avversarie (GAN) che corregge i bias dei modelli fisici di simulazione degli uragani, consentendo previsioni di mareggiate e venti più rapide e accurate anche in aree oltre la portata delle stazioni di rilevamento tradizionali.

Noujoud Nadera, Hadi Majed, Stefanos Giaremis, Rola El Osta, Clint Dawson, Carola Kaiser, Hartmut Kaiser2026-03-10🤖 cs.LG

Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds

Il paper propone la Geodesic Gradient Descent (GGD), un ottimizzatore generico privo di learning rate che approssima la geometria della funzione obiettivo tramite sfere n-dimensionali per garantire che le traiettorie di aggiornamento rimangano sulla superficie, ottenendo risultati superiori rispetto ad Adam su diversi dataset.

Liwei Hu, Guangyao Li, Wenyong Wang, Xiaoming Zhang, Yu Xiang2026-03-10🤖 cs.LG

How the Graph Construction Technique Shapes Performance in IoT Botnet Detection

Questo studio dimostra che la scelta della tecnica di costruzione del grafo influenza significativamente le prestazioni dei modelli GNN per il rilevamento di botnet IoT, evidenziando che l'uso del grafo di Gabriel, combinato con un autoencoder variazionale per la riduzione dimensionale, raggiunge la massima accuratezza del 97,56% nel dataset N-BaIoT.

Hassan Wasswa, Hussein Abbass, Timothy Lynar2026-03-10🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

Il paper introduce PAG, un nuovo framework per la ricerca approssimata dei vicini più prossimi che integra tecniche di proiezione in un indice grafico per soddisfare simultaneamente le esigenze moderne di efficienza, velocità di indicizzazione, basso consumo di memoria e scalabilità, superando le prestazioni di HNSW.

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan Xiao2026-03-10🤖 cs.LG

EnsAug: Augmentation-Driven Ensembles for Human Motion Sequence Analysis

Il paper presenta EnsAug, un nuovo paradigma di addestramento che utilizza un ensemble di modelli specializzati, ciascuno allenato su una specifica trasformazione geometrica dei dati, per superare i limiti delle tecniche di aumento generiche e raggiungere prestazioni superiori nel riconoscimento di movimenti umani e della lingua dei segni.

Bikram De, Habib Irani, Vangelis Metsis2026-03-10🤖 cs.LG

HyperTokens: Controlling Token Dynamics for Continual Video-Language Understanding

Il paper introduce HyperTokens, un metodo basato su un generatore di token che produce prompt su richiesta e utilizza regolarizzatori ispirati al meta-apprendimento e supervisione multimodale ausiliaria per migliorare l'apprendimento continuo nel VideoQA riducendo il dimenticamento e i costi di memoria.

Toan Nguyen, Yang Liu, Celso De Melo, Flora D. Salim2026-03-10🤖 cs.LG

ERP-RiskBench: Leakage-Safe Ensemble Learning for Financial Risk

Il paper presenta ERP-RiskBench, un nuovo framework sperimentale sicuro dalle fughe di dati che utilizza un ensemble di apprendimento automatico per migliorare il rilevamento dei rischi finanziari nei sistemi ERP, offrendo un benchmark riproducibile e una valutazione rigorosa delle prestazioni.

Sanjay Mishra2026-03-10🤖 cs.LG

Unmixing microinfrared spectroscopic images of cross-sections of historical oil paintings

Questo articolo presenta un autoencoder CNN non supervisionato, dotato di una funzione di perdita basata sulla distanza angolare spettrale ponderata (WSAD), per l'analisi non distruttiva e l'identificazione automatica dei componenti nei campioni stratificati di dipinti storici, come dimostrato su una sezione trasversale del Polittico di Gand.

Shivam Pande, Nicolas Nadisic, Francisco Mederos-Henry, Aleksandra Pizurica2026-03-10🤖 cs.LG

GNN For Muon Particle Momentum estimation

Questo articolo dimostra che le Reti Neurali su Grafi (GNN) superano i modelli tradizionali come TabNet nella stima dell'impulso delle particelle muoniche per il trigger CMS, evidenziando come la scelta delle dimensioni delle caratteristiche dei nodi sia cruciale per l'efficienza del modello.

Vishak K Bhat, Eric A. F. Reinhardt, Sergei Gleyzer2026-03-10🤖 cs.LG

XAI and Few-shot-based Hybrid Classification Model for Plant Leaf Disease Prognosis

Questo lavoro presenta un modello ibrido di apprendimento few-shot integrato con l'intelligenza artificiale spiegabile (XAI) per diagnosticare con alta precisione e trasparenza le malattie delle foglie di mais, riso e grano anche in condizioni di dati annotati limitati.

Diana Susan Joseph, Pranav M Pawar, Raja Muthalagu, Mithun Mukharjee2026-03-10🤖 cs.LG

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

Il paper propone PRPO, un metodo di ottimizzazione parallela per risolvere i conflitti di addestramento nei modelli LVLM per l'analisi dei grafici, e MCDR-Bench, una nuova benchmark per la valutazione oggettiva delle capacità di ricerca approfondita, stabilendo un quadro unificato che supera le attuali limitazioni nell'intelligenza dei dati visivi.

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

Il paper propone una strategia plug-and-play basata su un passo di denoising inverso aggiuntivo e sul campionamento Monte-Carlo (ABMS) per ridurre gli errori di stima nei modelli generativi guidati da SDE, migliorando così la qualità e la coerenza della generazione condizionata in diversi scenari applicativi.

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

Questo lavoro presenta un nuovo framework di apprendimento non supervisionato basato su filtri convoluzionali e reti neurali che, pur in assenza di dataset di addestramento e in condizioni di forte rumore, permette una ricostruzione ad alta fedeltà delle immagini del fascio e una risoluzione senza precedenti della struttura dell'alone nei diagnostici di acceleratori di particelle.

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

Soft Equivariance Regularization for Invariant Self-Supervised Learning

Il paper propone la Soft Equivariance Regularization (SER), un metodo di regolarizzazione che migliora l'apprendimento auto-supervisionato decouplando l'invarianza e l'equivarianza su diversi livelli della rete, ottenendo così prestazioni superiori nella classificazione, nella robustezza e nel rilevamento di oggetti senza richiedere etichette di trasformazione o componenti aggiuntivi significativi.

Joohyung Lee, Changhun Kim, Hyunsu Kim, Kwanhyung Lee, Juho Lee2026-03-10🤖 cs.LG

On the Generalization Capacities of MLLMs for Spatial Intelligence

Il paper dimostra che i modelli MLLM basati solo su RGB falliscono nella generalizzazione spaziale tra diverse telecamere a causa dell'ambiguità tra proprietà fisiche e prospettiva, e propone un framework "Camera-Aware" che, integrando parametri intrinseci, augmentation dei dati e distillazione di priors geometrici, risolve tale problema garantendo un'intelligenza spaziale robusta e generalizzabile.

Gongjie Zhang, Wenhao Li, Quanhao Qian, Jiuniu Wang, Deli Zhao, Shijian Lu, Ran Xu2026-03-10🤖 cs.LG

Uncertainty-Aware Solar Flare Regression

Questo studio dimostra che l'applicazione della regressione quantilica conformalizzata ai modelli di deep learning per la previsione dei brillamenti solari migliora significativamente l'affidabilità delle previsioni spaziali fornendo intervalli di confidenza con copertura valida e lunghezze ottimali.

Jinsu Hong, Chetraj Pandey, Berkay Aydin2026-03-10🔭 astro-ph

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

Il paper presenta ATLAS, un framework di reinforcement finetuning che permette ai piccoli modelli linguistici di operare efficacemente in vasti ecosistemi di strumenti, trasformando il controllo del contesto e l'esecuzione in decisioni apprese e utilizzando una ricompensa basata su rubriche per superare i limiti delle risorse e avvicinarsi alle prestazioni dei modelli frontier.

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

← Precedente Successivo →