cs.LG articoli | Gist.Science

Frozen Policy Iteration: Computationally Efficient RL under Linear $Q^π$ Realizability for Deterministic Dynamics

Il paper propone "Frozen Policy Iteration", un algoritmo di apprendimento per rinforzo online computazionalmente efficiente che, sotto l'assunzione di realizzabilità lineare delle funzioni Q per dinamiche deterministiche, raggiunge un limite di rimpianto ottimale evitando la necessità di un simulatore attraverso l'uso strategico di dati ad alta confidenza e il congelamento delle policy per gli stati già esplorati.

Yijing Ke, Zihan Zhang, Ruosong Wang2026-03-03📊 stat

MARS: Harmonizing Multimodal Convergence via Adaptive Rank Search

Il paper presenta MARS, un metodo che armonizza il fine-tuning dei modelli multimodali (MLLM) mediante una ricerca adattiva dei rank LoRA basata su leggi di scala duali per bilanciare le dinamiche di training e massimizzare le prestazioni senza ricorrere a metodi euristici manuali.

Minkyoung Cho, Insu Jang, Shuowei Jin + 5 more2026-03-03🤖 cs.LG

MO-MIX: Multi-Objective Multi-Agent Cooperative Decision-Making With Deep Reinforcement Learning

Il paper propone MO-MIX, un metodo basato sull'apprendimento per rinforzo profondo che utilizza il framework CTDE e una rete di mixing parallela per risolvere problemi di decisione cooperativa multi-agente multi-obiettivo, generando un insieme di soluzioni Pareto ottimali con prestazioni superiori e costi computazionali ridotti rispetto ai metodi esistenti.

Tianmeng Hu, Biao Luo, Chunhua Yang + 1 more2026-03-03🤖 cs.LG

Data-driven Synthesis of Magnetic Resonance Spectroscopy Data using a Variational Autoencoder

Questo studio propone un framework basato su un autoencoder variazionale per sintetizzare dati di spettroscopia a risonanza magnetica in vivo, dimostrando che l'arricchimento dei dataset con dati sintetici migliora la qualità del segnale in applicazioni specifiche come la spettroscopia GABA-edited, pur evidenziando limitazioni nella rappresentazione del rumore stocastico e nella quantificazione assoluta dei metaboliti.

Dennis M. J. van de Sande, Julian P. Merkofer, Sina Amirrajab + 4 more2026-03-03🤖 cs.LG

To Use or not to Use Muon: How Simplicity Bias in Optimizers Matters

Questo studio avverte che, sebbene l'ottimizzatore Muon offra una velocità di addestramento superiore rispetto ad Adam, la rimozione del "pregiudizio di semplicità" naturalmente preservato da metodi come SGD può portare a modelli più inclini a memorizzare caratteristiche spurie e meno capaci di cogliere strutture sottostanti comuni.

Sara Dragutinović, Rajesh Ranganath2026-03-03🤖 cs.LG

ResGene-T: A Tensor-Based Residual Network Approach for Genomic Prediction

Il paper presenta ResGene-T, un modello di deep learning basato su tensori che supera le limitazioni delle rappresentazioni 2D e raggiunge prestazioni superiori rispetto a sette metodi esistenti nella previsione genomica per diverse specie coltivate.

Kuldeep Pathak, Kapil Ahuja, Eric de Sturler2026-03-03🤖 cs.LG

Bi-cLSTM: Residual-Corrected Bidirectional LSTM for Aero-Engine RUL Estimation

Il documento propone il modello Bi-cLSTM, una rete LSTM bidirezionale con correzione residua e un'architettura di pre-elaborazione adattiva, che dimostra prestazioni superiori nella stima della vita utile residua dei motori aeronautici rispetto ai metodi esistenti, specialmente in condizioni operative variabili.

Rafi Hassan Chowdhury, Nabil Daiyan, Faria Ahmed + 2 more2026-03-03🤖 cs.LG

SpectroFusion-ViT: A Lightweight Transformer for Speech Emotion Recognition Using Harmonic Mel-Chroma Fusion

Il paper presenta SpectroFusion-ViT, un framework leggero basato su EfficientViT-b0 che fonde le caratteristiche armoniche e Mel-Chroma per il riconoscimento delle emozioni nel parlato in lingua bengalese, ottenendo prestazioni superiori rispetto allo stato dell'arte con un'efficienza computazionale ottimizzata.

Faria Ahmed, Rafi Hassan Chowdhury, Fatema Tuz Zohora Moon + 1 more2026-03-03🤖 cs.LG

General Proximal Flow Networks

Questo articolo introduce le General Proximal Flow Networks (GPFN), un quadro unificato per la generazione iterativa che generalizza le Bayesian Flow Networks sostituendo l'aggiornamento bayesiano fisso con operatori di prossimità basati su funzioni di divergenza o distanza arbitrarie, come la distanza di Wasserstein, migliorando così la qualità della generazione adattandosi alla geometria dei dati.

Alexander Strunk, Roland Assam2026-03-03🤖 cs.LG

Identifying and Characterising Response in Clinical Trials: Development and Validation of a Machine Learning Approach in Colorectal Cancer

Questo studio presenta e convalida un nuovo approccio basato sull'apprendimento automatico che combina la modellazione parzialmente condizionata e il metodo Virtual Twins per identificare e caratterizzare dinamicamente la risposta ai trattamenti nei pazienti con cancro colorettale metastatico, ottenendo risultati coerenti con la letteratura e superiori ai metodi statici esistenti.

Adam Marcus, Paul Agapow2026-03-03🤖 cs.LG

Initialization-Aware Score-Based Diffusion Sampling

Questo lavoro propone una strategia di campionamento teoricamente fondata per i modelli generativi basati su score che, analizzando la convergenza KL dei diffusori a varianza esplosiva, impara un'inizializzazione del processo inverso per ridurre significativamente il numero di passaggi di campionamento necessari mantenendo o migliorando la qualità generativa.

Tiziano Fassina, Gabriel Cardoso, Sylvan Le Corff + 1 more2026-03-03📊 stat

Interpretable Cross-Network Attention for Resting-State fMRI Representation Learning

Il paper presenta BrainInterNet, un framework auto-supervisionato interpretabile basato su attenzione incrociata che, analizzando dati rs-fMRI multi-coorte, quantifica le interazioni tra reti cerebrali per caratterizzare la riorganizzazione funzionale nell'Alzheimer e supportare la classificazione della malattia.

Karanpartap Singh, Adam Turnbull, Mohammad Abbasi + 3 more2026-03-03🤖 cs.LG

Identifying the Geographic Foci of US Local News

Questo studio propone un modello innovativo basato su LLM e caratteristiche spaziali-sematiche per identificare con alta precisione i foci geografici negli articoli di notizie locali statunitensi, permettendo di analizzare le pressioni economiche sul giornalismo locale e lo spostamento verso narrazioni nazionali.

Gangani Ariyarathne, Isuru Ariyarathne, Greatness Emmanuel-King + 2 more2026-03-03🤖 cs.LG

Neural Latent Arbitrary Lagrangian-Eulerian Grids for Fluid-Solid Interaction

Il paper presenta Fisale, un framework basato sull'apprendimento profondo che risolve complessi problemi di interazione fluido-solido bidirezionali modellando esplicitamente l'interfaccia di accoppiamento e utilizzando griglie latenti ALE multiscale per gestire dinamiche non lineari in scenari 2D e 3D.

Shilong Tao, Zhe Feng, Shaohan Chen + 3 more2026-03-03🤖 cs.LG

Efficient Conformal Volumetry for Template-Based Segmentation

Il paper introduce ConVOLT, un framework di previsione conforme che migliora l'efficienza della quantificazione dell'incertezza volumetrica nella segmentazione basata su template sfruttando le proprietà del campo di deformazione per generare intervalli più stretti rispetto ai metodi tradizionali nello spazio di output.

Matt Y. Cheung, Ashok Veeraraghavan, Guha Balakrishnan2026-03-03🧬 q-bio

Lookahead identification in adversarial bandits: accuracy and memory bounds

Questo lavoro introduce l'identificazione con anticipazione nei banditi avversari, dimostrando che è possibile identificare un braccio quasi ottimale per finestre future con un errore limitato e analizzando i compromessi tra accuratezza e risorse di memoria necessarie.

Nataly Brukhim, Nicolò Cesa-Bianchi, Carlo Ciliberto2026-03-03🤖 cs.LG

Curation Leaks: Membership Inference Attacks against Data Curation for Machine Learning

Questo lavoro dimostra che i processi di curazione dei dati per il machine learning, anche quando utilizzati per selezionare dati pubblici basandosi su dati privati senza addestramento diretto, sono vulnerabili ad attacchi di inferenza dell'appartenenza che rivelano informazioni sensibili, ma che tali rischi possono essere mitigati applicando garanzie di privacy differenziale.

Dariush Wahdany, Matthew Jagielski, Adam Dziedzic + 1 more2026-03-03🤖 cs.LG

Wave-Attractor-Tree: A Hierarchical Binary Tree Reduction Architecture for Efficient Sequence Modeling

Il paper presenta Wave-Attractor-Tree, un'architettura di riduzione gerarchica basata su un albero binario che sostituisce l'attenzione self-attention con un'operazione di fusione ricorsiva a unità lineari gating, ottenendo complessità lineare e superando i Transformer standard nella modellazione di dipendenze strutturali a lungo raggio.

Igor Berezkin2026-03-03🤖 cs.LG

A short tour of operator learning theory: Convergence rates, statistical limits, and open questions

Questo articolo esamina le recenti intersezioni tra apprendimento di operatori, teoria statistica e approssimazione, analizzando i limiti di convergenza, le barriere statistiche fondamentali e le questioni aperte attraverso una prospettiva minimax.

Simone Brugiapaglia, Nicola Rares Franco, Nicholas H. Nelsen2026-03-03📊 stat

Constitutional Black-Box Monitoring for Scheming in LLM Agents

Questo studio dimostra che monitori basati su LLM, ottimizzati su dati sintetici generati da specifiche comportamentali naturali, riescono a generalizzare l'individuazione di schemi di inganno in ambienti realistici, sebbene le prestazioni raggiungano rapidamente un plateau oltre il quale un'ulteriore ottimizzazione porta solo a un sovradattamento.

Simon Storf, Rich Barton-Cooper, James Peters-Gill + 1 more2026-03-03💬 cs.CL

← Precedente Successivo →

cs.LG

Frozen Policy Iteration: Computationally Efficient RL under Linear QπQ^πQπ Realizability for Deterministic Dynamics