cs.LG articoli | Gist.Science

QKAN-LSTM: Quantum-inspired Kolmogorov-Arnold Long Short-term Memory

Il paper propone il QKAN-LSTM, un modello di memoria a lungo termine ispirato alla meccanica quantistica che integra moduli di attivazione DARUAN per migliorare l'espressività non lineare e ridurre i parametri, dimostrando prestazioni superiori su dati sequenziali reali e estendendo il framework alla rete HQKAN per l'apprendimento gerarchico.

Yu-Chao Hsu, Jiun-Cheng Jiang, Chun-Hua Lin + 5 more2026-03-02⚛️ quant-ph

Sharp Monocular View Synthesis in Less Than a Second

Il paper presenta SHARP, un metodo che genera in meno di un secondo una rappresentazione 3D metrica fotorealistica da una singola immagine, consentendo la sintesi di nuove viste con prestazioni superiori allo stato dell'arte e una generalizzazione zero-shot.

Lars Mescheder, Wei Dong, Shiwei Li + 10 more2026-03-02🤖 cs.LG

On the Effectiveness of Membership Inference in Targeted Data Extraction from Large Language Models

Questo studio integra diverse tecniche di inferenza dell'appartenenza nel processo di estrazione dei dati dai grandi modelli linguistici per valutarne sistematicamente l'efficacia pratica e confrontarne le prestazioni con i benchmark tradizionali.

Ali Al Sahili, Ali Chehab, Razane Tajeddine2026-03-02💬 cs.CL

Smoothing DiLoCo with Primal Averaging for Faster Training of LLMs

Il paper propone GPA (Generalized Primal Averaging), un ottimizzatore che estende il metodo di Nesterov per unificare e migliorare l'addestramento di LLM rispetto a DiLoCo e AdamW, riducendo il consumo di memoria e accelerando la convergenza grazie a una media esponenziale degli iterati.

Aaron Defazio, Konstantin Mishchenko, Parameswaran Raman + 2 more2026-03-02📊 stat

Trust Region Masking for Long-Horizon LLM Reinforcement Learning

Il documento propone il Trust Region Masking (TRM), un metodo che maschera intere sequenze violando i limiti di regione di fiducia per risolvere le discrepanze off-policy nei modelli linguistici su lunghi orizzonti temporali, permettendo così per la prima volta garanzie di miglioramento monotono non vacue.

Yingru Li, Jiacai Liu, Jiawei Xu + 4 more2026-03-02📊 stat

Reinforcement-Learned Unequal Error Protection for Quantized Semantic Embeddings

Questo articolo presenta un nuovo framework di apprendimento per rinforzo che utilizza una codifica di ripetizione adattiva per garantire una protezione dagli errori diseguale a livello di dimensione nelle embedding semantiche quantizzate, migliorando significativamente la fedeltà semantica e la preservazione delle entità in scenari a banda limitata rispetto alle tecniche di protezione uniforme tradizionali.

Moirangthem Tiken Singh, Adnan Arif2026-03-02🤖 cs.LG

CSyMR: Benchmarking Compositional Music Information Retrieval in Symbolic Music Reasoning

Il paper introduce CSyMR-Bench, un benchmark per il recupero compositivo di informazioni musicali su spartiti simbolici basato su scenari reali, e propone un framework di ragionamento potenziato da strumenti che integra operatori di analisi simbolica deterministica con modelli linguistici, dimostrando guadagni significativi di accuratezza rispetto agli approcci basati esclusivamente su LLM.

Boyang Wang, Yash Vishe, Xin Xu + 4 more2026-03-02⚡ eess

Learning to Optimize by Differentiable Programming

Questo tutorial illustra come l'uso della programmazione differenziabile, supportata da framework moderni come PyTorch e JAX, permetta di apprendere e adattare algoritmi di ottimizzazione del primo ordine basati sulla dualità di Fenchel-Rockafellar, migliorando significativamente convergenza e qualità delle soluzioni in problemi su larga scala.

Liping Tao, Xindi Tong, Chee Wei Tan2026-03-02🤖 cs.LG

GreenServ: Energy-Efficient Context-Aware Dynamic Routing for Multi-Model LLM Inference

Il paper presenta GreenServ, un framework di routing dinamico e consapevole del contesto che ottimizza il compromesso tra accuratezza ed efficienza energetica nell'inferenza di LLM multi-modello, utilizzando un approccio a bandito multi-braccio per instradare le query al modello più adatto e dimostrando, rispetto a strategie statiche o casuali, un aumento dell'accuratezza e una significativa riduzione del consumo energetico.

Thomas Ziller, Shashikant Ilager, Alessandro Tundo + 3 more2026-03-02🤖 cs.LG

GenAI-Net: A Generative AI Framework for Automated Biomolecular Network Design

Il paper introduce GenAI-Net, un framework di intelligenza artificiale generativa che automatizza la progettazione di reti biomolecolari trasformando specifiche comportamentali in circuiti implementabili, superando le limitazioni dei metodi manuali tradizionali.

Maurice Filo, Nicolò Rossi, Zhou Fang + 1 more2026-03-02🧬 q-bio

DUET: Distilled LLM Unlearning from an Efficiently Contextualized Teacher

Il paper propone DUET, un metodo innovativo di distillazione che combina i vantaggi dell'unlearning basato su tuning e su contesto per rimuovere conoscenze indesiderate dai modelli linguistici preservando le prestazioni generali con un'efficienza dei dati superiore rispetto alle tecniche esistenti.

Yisheng Zhong, Zhengbang Yang, Zhuangdi Zhu2026-03-02🤖 cs.AI

Convex Loss Functions for Support Vector Machines (SVMs) and Neural Networks

Il paper propone e valida sperimentalmente una nuova funzione di perdita convessa per le SVM e le reti neurali, dimostrando che l'integrazione delle correlazioni dei pattern migliora le prestazioni di generalizzazione rispetto alle funzioni di perdita standard.

Filippo Portera2026-03-02🤖 cs.LG

Federated-inspired Single-cell Batch Integration in Latent Space

Il paper introduce scBatchProx, un metodo di ottimizzazione post-hoc ispirato all'apprendimento federato che corregge gli effetti del lotto nello spazio latente delle rappresentazioni cellulari senza richiedere dati grezzi centralizzati, migliorando significativamente la qualità dell'embedding e la conservazione dei segnali biologici.

Quang-Huy Nguyen, Zongliang Yue, Hao Chen + 2 more2026-03-02🤖 cs.LG

Quant VideoGen: Auto-Regressive Long Video Generation via 2-Bit KV-Cache Quantization

Il paper presenta Quant VideoGen (QVG), un framework senza addestramento che utilizza la quantizzazione a 2 bit della cache KV tramite smoothing semantico e quantizzazione progressiva dei residui per ridurre fino a 7 volte l'uso di memoria nelle generazioni video autoregressive, migliorando al contempo la coerenza a lungo termine e mantenendo un basso overhead di latenza.

Haocheng Xi, Shuo Yang, Yilong Zhao + 13 more2026-03-02🤖 cs.LG

Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control

Il lavoro presenta EAGLE, un framework iterativo di distillazione generalista-specialista che genera una politica unificata e robusta per il controllo del corpo intero di diversi robot umanoidi eterogenei, superando le limitazioni legate alle variazioni dinamiche e topologiche senza necessità di sintonizzare ricompense specifiche per ogni robot.

Quanquan Peng, Yunfeng Lin, Yufei Xue + 2 more2026-03-02🤖 cs.AI

Erase at the Core: Representation Unlearning for Machine Unlearning

Il paper introduce "Erase at the Core" (EC), un framework agnostico al modello che risolve il problema della "dimenticanza superficiale" applicando l'apprendimento contrastivo e supervisionato a tutti i livelli della rete per garantire la cancellazione effettiva delle informazioni sia a livello di logit che di rappresentazioni interne.

Jaewon Lee, Yongwoo Kim, Donghyun Kim2026-03-02🤖 cs.LG

Robust Online Learning

Questo studio formula l'apprendimento di classificatori robusti in presenza di input perturbati e dati scelti avversarialmente come un problema di apprendimento online, introducendo una nuova dimensione che caratterizza i limiti di errore e rimpianto sia nei contesti realistici che agnostici, estendendosi anche a casi multiclasse e a scenari con perturbazioni incerte.

Sajad Ashkezari2026-03-02📊 stat

Unified Biomolecular Trajectory Generation via Pretrained Variational Bridge

Il documento presenta il Pretrained Variational Bridge (PVB), un modello generativo che unifica l'addestramento su dati strutturali e di traiettoria per produrre simulazioni di dinamica molecolare efficienti e fedeli, superando i limiti computazionali delle tradizionali simulazioni MD.

Ziyang Yu, Wenbing Huang, Yang Liu2026-03-02🤖 cs.LG

Biases in the Blind Spot: Detecting What LLMs Fail to Mention

Questo lavoro presenta una pipeline automatizzata e in black-box per rilevare i "bias non verbalizzati" nei modelli linguistici, identificando nuove distorsioni specifiche del compito (come la padronanza linguistica o la formalità) senza richiedere categorie predefinite, pur validando al contempo i pregiudizi noti.

Iván Arcuschin, David Chanin, AdriÃ Garriga-Alonso + 1 more2026-03-02🤖 cs.AI

Flow-Enabled Generalization to Human Demonstrations in Few-Shot Imitation Learning

Il paper propone SFCrP, un metodo di apprendimento per imitazione che combina un modello di previsione del flusso di scena con una politica condizionata per generalizzare efficacemente compiti complessi da poche dimostrazioni robotiche, integrando dati video umani per superare i limiti delle rappresentazioni basate sul flusso tradizionali.

Runze Tang, Penny Sweetser2026-03-02🤖 cs.LG

← Precedente Successivo →