cs.LG articoli | Gist.Science

An operator splitting analysis of Wasserstein--Fisher--Rao gradient flows

Questo studio analizza l'impatto dell'ordine di splitting degli operatori nei flussi gradiente di Wasserstein-Fisher-Rao, dimostrando che una scelta appropriata della dimensione del passo e della sequenza operativa può garantire una convergenza alla distribuzione target più rapida rispetto al flusso WFR esatto, fornendo inoltre nuove formule variazionali e il primo limite di decadimento preciso per tali flussi.

Francesca Romana Crucinio, Sahani Pathiraja2026-03-02📊 stat

MEDIC: a network for monitoring data quality in collider experiments

Questo lavoro presenta MEDIC, una rete neurale basata su un approccio di simulazione che utilizza l'apprendimento automatico per automatizzare il monitoraggio della qualità dei dati e identificare le anomalie nei rivelatori degli esperimenti di fisica delle particelle.

Juvenal Bassa, Arghya Chattopadhyay, Sudhir Malik + 1 more2026-03-02⚛️ hep-ex

Heterogeneous Multi-Agent Reinforcement Learning with Attention for Cooperative and Scalable Feature Transformation

Il paper propone un nuovo framework di apprendimento per rinforzo multi-agente eterogeneo che utilizza meccanismi di attenzione e un critico condiviso per abilitare una trasformazione delle caratteristiche collaborativa, scalabile e stabile per i dati strutturati.

Tao Zhe, Huazhen Fang, Kunpeng Liu + 3 more2026-03-02🤖 cs.AI

VCWorld: A Biological World Model for Virtual Cell Simulation

Il paper presenta VCWorld, un simulatore di "mondo biologico" interpretabile e basato su conoscenza strutturata che supera i limiti dei modelli esistenti per prevedere le risposte cellulari alle perturbazioni e generare ipotesi meccanicistiche coerenti con le evidenze scientifiche.

Zhijian Wei, Runze Ma, Zichen Wang + 3 more2026-03-02🧬 q-bio

Automating the Refinement of Reinforcement Learning Specifications

Il paper presenta AutoSpec, un framework che automatizza il raffinamento di specifiche logiche per l'apprendimento per rinforzo, migliorando l'efficacia degli agenti attraverso una strategia guidata dall'esplorazione che mantiene la correttezza formale della specifica originale.

Tanmay Ambadkar, Đorđe Žikelić, Abhinav Verma2026-03-02🤖 cs.AI

Log Probability Tracking of LLM APIs

Questo lavoro introduce un metodo di monitoraggio continuo e a basso costo per le API degli LLM basato sull'analisi statistica delle log-probabilità di singoli token, capace di rilevare anche minime modifiche al modello con una sensibilità superiore e un costo 1.000 volte inferiore rispetto alle tecniche esistenti, supportato dal nuovo benchmark TinyChange.

Timothée Chauvin, Erwan Le Merrer, François Taïani + 1 more2026-03-02🤖 cs.LG

QKAN-LSTM: Quantum-inspired Kolmogorov-Arnold Long Short-term Memory

Il paper propone il QKAN-LSTM, un modello di memoria a lungo termine ispirato alla meccanica quantistica che integra moduli di attivazione DARUAN per migliorare l'espressività non lineare e ridurre i parametri, dimostrando prestazioni superiori su dati sequenziali reali e estendendo il framework alla rete HQKAN per l'apprendimento gerarchico.

Yu-Chao Hsu, Jiun-Cheng Jiang, Chun-Hua Lin + 5 more2026-03-02⚛️ quant-ph

Sharp Monocular View Synthesis in Less Than a Second

Il paper presenta SHARP, un metodo che genera in meno di un secondo una rappresentazione 3D metrica fotorealistica da una singola immagine, consentendo la sintesi di nuove viste con prestazioni superiori allo stato dell'arte e una generalizzazione zero-shot.

Lars Mescheder, Wei Dong, Shiwei Li + 10 more2026-03-02🤖 cs.LG

On the Effectiveness of Membership Inference in Targeted Data Extraction from Large Language Models

Questo studio integra diverse tecniche di inferenza dell'appartenenza nel processo di estrazione dei dati dai grandi modelli linguistici per valutarne sistematicamente l'efficacia pratica e confrontarne le prestazioni con i benchmark tradizionali.

Ali Al Sahili, Ali Chehab, Razane Tajeddine2026-03-02💬 cs.CL

Smoothing DiLoCo with Primal Averaging for Faster Training of LLMs

Il paper propone GPA (Generalized Primal Averaging), un ottimizzatore che estende il metodo di Nesterov per unificare e migliorare l'addestramento di LLM rispetto a DiLoCo e AdamW, riducendo il consumo di memoria e accelerando la convergenza grazie a una media esponenziale degli iterati.

Aaron Defazio, Konstantin Mishchenko, Parameswaran Raman + 2 more2026-03-02📊 stat

Trust Region Masking for Long-Horizon LLM Reinforcement Learning

Il documento propone il Trust Region Masking (TRM), un metodo che maschera intere sequenze violando i limiti di regione di fiducia per risolvere le discrepanze off-policy nei modelli linguistici su lunghi orizzonti temporali, permettendo così per la prima volta garanzie di miglioramento monotono non vacue.

Yingru Li, Jiacai Liu, Jiawei Xu + 4 more2026-03-02📊 stat

Reinforcement-Learned Unequal Error Protection for Quantized Semantic Embeddings

Questo articolo presenta un nuovo framework di apprendimento per rinforzo che utilizza una codifica di ripetizione adattiva per garantire una protezione dagli errori diseguale a livello di dimensione nelle embedding semantiche quantizzate, migliorando significativamente la fedeltà semantica e la preservazione delle entità in scenari a banda limitata rispetto alle tecniche di protezione uniforme tradizionali.

Moirangthem Tiken Singh, Adnan Arif2026-03-02🤖 cs.LG

CSyMR: Benchmarking Compositional Music Information Retrieval in Symbolic Music Reasoning

Il paper introduce CSyMR-Bench, un benchmark per il recupero compositivo di informazioni musicali su spartiti simbolici basato su scenari reali, e propone un framework di ragionamento potenziato da strumenti che integra operatori di analisi simbolica deterministica con modelli linguistici, dimostrando guadagni significativi di accuratezza rispetto agli approcci basati esclusivamente su LLM.

Boyang Wang, Yash Vishe, Xin Xu + 4 more2026-03-02⚡ eess

Learning to Optimize by Differentiable Programming

Questo tutorial illustra come l'uso della programmazione differenziabile, supportata da framework moderni come PyTorch e JAX, permetta di apprendere e adattare algoritmi di ottimizzazione del primo ordine basati sulla dualità di Fenchel-Rockafellar, migliorando significativamente convergenza e qualità delle soluzioni in problemi su larga scala.

Liping Tao, Xindi Tong, Chee Wei Tan2026-03-02🤖 cs.LG

GreenServ: Energy-Efficient Context-Aware Dynamic Routing for Multi-Model LLM Inference

Il paper presenta GreenServ, un framework di routing dinamico e consapevole del contesto che ottimizza il compromesso tra accuratezza ed efficienza energetica nell'inferenza di LLM multi-modello, utilizzando un approccio a bandito multi-braccio per instradare le query al modello più adatto e dimostrando, rispetto a strategie statiche o casuali, un aumento dell'accuratezza e una significativa riduzione del consumo energetico.

Thomas Ziller, Shashikant Ilager, Alessandro Tundo + 3 more2026-03-02🤖 cs.LG

GenAI-Net: A Generative AI Framework for Automated Biomolecular Network Design

Il paper introduce GenAI-Net, un framework di intelligenza artificiale generativa che automatizza la progettazione di reti biomolecolari trasformando specifiche comportamentali in circuiti implementabili, superando le limitazioni dei metodi manuali tradizionali.

Maurice Filo, Nicolò Rossi, Zhou Fang + 1 more2026-03-02🧬 q-bio

DUET: Distilled LLM Unlearning from an Efficiently Contextualized Teacher

Il paper propone DUET, un metodo innovativo di distillazione che combina i vantaggi dell'unlearning basato su tuning e su contesto per rimuovere conoscenze indesiderate dai modelli linguistici preservando le prestazioni generali con un'efficienza dei dati superiore rispetto alle tecniche esistenti.

Yisheng Zhong, Zhengbang Yang, Zhuangdi Zhu2026-03-02🤖 cs.AI

Convex Loss Functions for Support Vector Machines (SVMs) and Neural Networks

Il paper propone e valida sperimentalmente una nuova funzione di perdita convessa per le SVM e le reti neurali, dimostrando che l'integrazione delle correlazioni dei pattern migliora le prestazioni di generalizzazione rispetto alle funzioni di perdita standard.

Filippo Portera2026-03-02🤖 cs.LG

Federated-inspired Single-cell Batch Integration in Latent Space

Il paper introduce scBatchProx, un metodo di ottimizzazione post-hoc ispirato all'apprendimento federato che corregge gli effetti del lotto nello spazio latente delle rappresentazioni cellulari senza richiedere dati grezzi centralizzati, migliorando significativamente la qualità dell'embedding e la conservazione dei segnali biologici.

Quang-Huy Nguyen, Zongliang Yue, Hao Chen + 2 more2026-03-02🤖 cs.LG

Quant VideoGen: Auto-Regressive Long Video Generation via 2-Bit KV-Cache Quantization

Il paper presenta Quant VideoGen (QVG), un framework senza addestramento che utilizza la quantizzazione a 2 bit della cache KV tramite smoothing semantico e quantizzazione progressiva dei residui per ridurre fino a 7 volte l'uso di memoria nelle generazioni video autoregressive, migliorando al contempo la coerenza a lungo termine e mantenendo un basso overhead di latenza.

Haocheng Xi, Shuo Yang, Yilong Zhao + 13 more2026-03-02🤖 cs.LG

← Precedente Successivo →