cs.LG articoli | Gist.Science

Polynomial Mixing for Efficient Self-supervised Speech Encoders

Questo lavoro propone il Polynomial Mixer (PoM), un nuovo meccanismo di mixing dei token con complessità lineare che sostituisce l'attenzione self-attention nei modelli speech-to-text auto-supervisionati, offrendo un miglior compromesso tra efficienza computazionale e prestazioni nel riconoscimento vocale.

Eva Feillet, Ryan Whetten, David Picard + 1 more2026-03-03💬 cs.CL

Reward-Modulated Local Learning in Spiking Encoders: Controlled Benchmarks with STDP and Hybrid Rate Readouts

Questo studio empirico valuta l'apprendimento locale biologicamente motivato per il riconoscimento di cifre scritte a mano, confrontando un proxy competitivo ispirato all'STDP con un benchmark ibrido basato su tassi, dimostrando che la normalizzazione e la modellazione della ricompensa sono fattori determinanti per le prestazioni, sebbene i modelli locali raggiungano ancora accuracies inferiori rispetto ai baselines classici.

Debjyoti Chakraborty2026-03-03🤖 cs.LG

IU: Imperceptible Universal Backdoor Attack

Il paper presenta IU, un nuovo attacco backdoor universale impercettibile che utilizza le reti neurali convoluzionali su grafi per generare perturbazioni specifiche per classe, ottenendo un alto tasso di successo con un'infezione minima e mantenendo l'efficacia contro le difese esistenti.

Hsin Lin, Yan-Lun Chen, Ren-Hung Hwang + 1 more2026-03-03🤖 cs.LG

Frozen Policy Iteration: Computationally Efficient RL under Linear $Q^π$ Realizability for Deterministic Dynamics

Il paper propone "Frozen Policy Iteration", un algoritmo di apprendimento per rinforzo online computazionalmente efficiente che, sotto l'assunzione di realizzabilità lineare delle funzioni Q per dinamiche deterministiche, raggiunge un limite di rimpianto ottimale evitando la necessità di un simulatore attraverso l'uso strategico di dati ad alta confidenza e il congelamento delle policy per gli stati già esplorati.

Yijing Ke, Zihan Zhang, Ruosong Wang2026-03-03📊 stat

MARS: Harmonizing Multimodal Convergence via Adaptive Rank Search

Il paper presenta MARS, un metodo che armonizza il fine-tuning dei modelli multimodali (MLLM) mediante una ricerca adattiva dei rank LoRA basata su leggi di scala duali per bilanciare le dinamiche di training e massimizzare le prestazioni senza ricorrere a metodi euristici manuali.

Minkyoung Cho, Insu Jang, Shuowei Jin + 5 more2026-03-03🤖 cs.LG

MO-MIX: Multi-Objective Multi-Agent Cooperative Decision-Making With Deep Reinforcement Learning

Il paper propone MO-MIX, un metodo basato sull'apprendimento per rinforzo profondo che utilizza il framework CTDE e una rete di mixing parallela per risolvere problemi di decisione cooperativa multi-agente multi-obiettivo, generando un insieme di soluzioni Pareto ottimali con prestazioni superiori e costi computazionali ridotti rispetto ai metodi esistenti.

Tianmeng Hu, Biao Luo, Chunhua Yang + 1 more2026-03-03🤖 cs.LG

Data-driven Synthesis of Magnetic Resonance Spectroscopy Data using a Variational Autoencoder

Questo studio propone un framework basato su un autoencoder variazionale per sintetizzare dati di spettroscopia a risonanza magnetica in vivo, dimostrando che l'arricchimento dei dataset con dati sintetici migliora la qualità del segnale in applicazioni specifiche come la spettroscopia GABA-edited, pur evidenziando limitazioni nella rappresentazione del rumore stocastico e nella quantificazione assoluta dei metaboliti.

Dennis M. J. van de Sande, Julian P. Merkofer, Sina Amirrajab + 4 more2026-03-03🤖 cs.LG

To Use or not to Use Muon: How Simplicity Bias in Optimizers Matters

Questo studio avverte che, sebbene l'ottimizzatore Muon offra una velocità di addestramento superiore rispetto ad Adam, la rimozione del "pregiudizio di semplicità" naturalmente preservato da metodi come SGD può portare a modelli più inclini a memorizzare caratteristiche spurie e meno capaci di cogliere strutture sottostanti comuni.

Sara Dragutinović, Rajesh Ranganath2026-03-03🤖 cs.LG

ResGene-T: A Tensor-Based Residual Network Approach for Genomic Prediction

Il paper presenta ResGene-T, un modello di deep learning basato su tensori che supera le limitazioni delle rappresentazioni 2D e raggiunge prestazioni superiori rispetto a sette metodi esistenti nella previsione genomica per diverse specie coltivate.

Kuldeep Pathak, Kapil Ahuja, Eric de Sturler2026-03-03🤖 cs.LG

Bi-cLSTM: Residual-Corrected Bidirectional LSTM for Aero-Engine RUL Estimation

Il documento propone il modello Bi-cLSTM, una rete LSTM bidirezionale con correzione residua e un'architettura di pre-elaborazione adattiva, che dimostra prestazioni superiori nella stima della vita utile residua dei motori aeronautici rispetto ai metodi esistenti, specialmente in condizioni operative variabili.

Rafi Hassan Chowdhury, Nabil Daiyan, Faria Ahmed + 2 more2026-03-03🤖 cs.LG

SpectroFusion-ViT: A Lightweight Transformer for Speech Emotion Recognition Using Harmonic Mel-Chroma Fusion

Il paper presenta SpectroFusion-ViT, un framework leggero basato su EfficientViT-b0 che fonde le caratteristiche armoniche e Mel-Chroma per il riconoscimento delle emozioni nel parlato in lingua bengalese, ottenendo prestazioni superiori rispetto allo stato dell'arte con un'efficienza computazionale ottimizzata.

Faria Ahmed, Rafi Hassan Chowdhury, Fatema Tuz Zohora Moon + 1 more2026-03-03🤖 cs.LG

General Proximal Flow Networks

Questo articolo introduce le General Proximal Flow Networks (GPFN), un quadro unificato per la generazione iterativa che generalizza le Bayesian Flow Networks sostituendo l'aggiornamento bayesiano fisso con operatori di prossimità basati su funzioni di divergenza o distanza arbitrarie, come la distanza di Wasserstein, migliorando così la qualità della generazione adattandosi alla geometria dei dati.

Alexander Strunk, Roland Assam2026-03-03🤖 cs.LG

Identifying and Characterising Response in Clinical Trials: Development and Validation of a Machine Learning Approach in Colorectal Cancer

Questo studio presenta e convalida un nuovo approccio basato sull'apprendimento automatico che combina la modellazione parzialmente condizionata e il metodo Virtual Twins per identificare e caratterizzare dinamicamente la risposta ai trattamenti nei pazienti con cancro colorettale metastatico, ottenendo risultati coerenti con la letteratura e superiori ai metodi statici esistenti.

Adam Marcus, Paul Agapow2026-03-03🤖 cs.LG

Initialization-Aware Score-Based Diffusion Sampling

Questo lavoro propone una strategia di campionamento teoricamente fondata per i modelli generativi basati su score che, analizzando la convergenza KL dei diffusori a varianza esplosiva, impara un'inizializzazione del processo inverso per ridurre significativamente il numero di passaggi di campionamento necessari mantenendo o migliorando la qualità generativa.

Tiziano Fassina, Gabriel Cardoso, Sylvan Le Corff + 1 more2026-03-03📊 stat

Interpretable Cross-Network Attention for Resting-State fMRI Representation Learning

Il paper presenta BrainInterNet, un framework auto-supervisionato interpretabile basato su attenzione incrociata che, analizzando dati rs-fMRI multi-coorte, quantifica le interazioni tra reti cerebrali per caratterizzare la riorganizzazione funzionale nell'Alzheimer e supportare la classificazione della malattia.

Karanpartap Singh, Adam Turnbull, Mohammad Abbasi + 3 more2026-03-03🤖 cs.LG

Identifying the Geographic Foci of US Local News

Questo studio propone un modello innovativo basato su LLM e caratteristiche spaziali-sematiche per identificare con alta precisione i foci geografici negli articoli di notizie locali statunitensi, permettendo di analizzare le pressioni economiche sul giornalismo locale e lo spostamento verso narrazioni nazionali.

Gangani Ariyarathne, Isuru Ariyarathne, Greatness Emmanuel-King + 2 more2026-03-03🤖 cs.LG

Neural Latent Arbitrary Lagrangian-Eulerian Grids for Fluid-Solid Interaction

Il paper presenta Fisale, un framework basato sull'apprendimento profondo che risolve complessi problemi di interazione fluido-solido bidirezionali modellando esplicitamente l'interfaccia di accoppiamento e utilizzando griglie latenti ALE multiscale per gestire dinamiche non lineari in scenari 2D e 3D.

Shilong Tao, Zhe Feng, Shaohan Chen + 3 more2026-03-03🤖 cs.LG

Efficient Conformal Volumetry for Template-Based Segmentation

Il paper introduce ConVOLT, un framework di previsione conforme che migliora l'efficienza della quantificazione dell'incertezza volumetrica nella segmentazione basata su template sfruttando le proprietà del campo di deformazione per generare intervalli più stretti rispetto ai metodi tradizionali nello spazio di output.

Matt Y. Cheung, Ashok Veeraraghavan, Guha Balakrishnan2026-03-03🧬 q-bio

Lookahead identification in adversarial bandits: accuracy and memory bounds

Questo lavoro introduce l'identificazione con anticipazione nei banditi avversari, dimostrando che è possibile identificare un braccio quasi ottimale per finestre future con un errore limitato e analizzando i compromessi tra accuratezza e risorse di memoria necessarie.

Nataly Brukhim, Nicolò Cesa-Bianchi, Carlo Ciliberto2026-03-03🤖 cs.LG

Curation Leaks: Membership Inference Attacks against Data Curation for Machine Learning

Questo lavoro dimostra che i processi di curazione dei dati per il machine learning, anche quando utilizzati per selezionare dati pubblici basandosi su dati privati senza addestramento diretto, sono vulnerabili ad attacchi di inferenza dell'appartenenza che rivelano informazioni sensibili, ma che tali rischi possono essere mitigati applicando garanzie di privacy differenziale.

Dariush Wahdany, Matthew Jagielski, Adam Dziedzic + 1 more2026-03-03🤖 cs.LG

← Precedente Successivo →

cs.LG