cs.LG articoli | Gist.Science

Inference-Time Toxicity Mitigation in Protein Language Models

Questo studio dimostra che la Logit Diff Amplification (LDA) funge da meccanismo di controllo a tempo di inferenza efficace per i modelli linguistici proteici, riducendo la generazione di proteine tossiche indotte dall'adattamento di dominio senza compromettere la qualità biologica o la plausibilità strutturale delle sequenze generate.

Manuel Fernández Burda, Santiago Aranguri, Iván Arcuschin Moreno + 1 more2026-03-05🤖 cs.AI

Fermi-Dirac thermal measurements: A framework for quantum hypothesis testing and semidefinite optimization

Il paper propone un nuovo quadro per il test di ipotesi quantistiche e l'ottimizzazione semidefinita basato su misurazioni termiche di Fermi-Dirac, interpretando gli autovalori degli operatori di misura come modi fermionici indipendenti per sviluppare modelli di apprendimento automatico quantistico e algoritmi di ottimizzazione ibridi.

Nana Liu, Mark M. Wilde2026-03-05⚛️ quant-ph

FedCova: Robust Federated Covariance Learning Against Noisy Labels

Il paper propone FedCova, un framework di apprendimento federato robusto che elimina la dipendenza da dati esterni o dispositivi puliti, migliorando la resilienza intrinseca del modello contro le etichette rumorose attraverso un nuovo approccio basato sull'analisi delle covarianze delle caratteristiche per l'encoding, la classificazione e la correzione delle etichette.

Xiangyu Zhong, Xiaojun Yuan, Ying-Jun Angela Zhang2026-03-05🤖 cs.LG

Tuning Just Enough: Lightweight Backdoor Attacks on Multi-Encoder Diffusion Models

Questo lavoro introduce MELT, un attacco backdoor leggero per modelli di diffusione multi-encoder come Stable Diffusion 3, che dimostra come sia possibile comprometterne l'integrità addestrando meno dello 0,2% dei parametri degli encoder testuali congelati.

Ziyuan Chen, Yujin Jeong, Tobias Braun + 1 more2026-03-05🤖 cs.LG

Reducing hyperparameter sensitivity in measurement-feedback based Ising machines

Questo articolo analizza la discrepanza tra le dinamiche temporali continue teoriche e le implementazioni sperimentali discrete nelle macchine di Ising basate su feedback di misura, proponendo e verificando sperimentalmente un metodo per ridurre la sensibilità alla scelta degli iperparametri in tali architetture.

Toon Sevenants, Guy Van der Sande, Guy Verschaffelt2026-03-05🔬 physics.app-ph

When to restart? Exploring escalating restarts on convergence

Il paper propone SGD-ER, una strategia che adatta dinamicamente il tasso di apprendimento aumentando i riavvii stocastici al rilevamento di stagnazione, migliorando significativamente l'accuratezza di test su diversi dataset e architetture rispetto ai metodi di scheduling tradizionali.

Ayush K. Varshney, Šarūnas Girdzijauskas, Konstantinos Vandikas + 1 more2026-03-05🤖 cs.LG

FastWave: Optimized Diffusion Model for Audio Super-Resolution

Il paper presenta FastWave, un modello di diffusione ottimizzato per la super-risoluzione audio che, con soli 1,3 milioni di parametri e una complessità computazionale ridotta, supera le prestazioni di NU-Wave 2 offrendo un addestramento e un'inferenza significativamente più veloci rispetto alle soluzioni state-of-the-art.

Nikita Kuznetsov, Maksim Kaledin2026-03-05🤖 cs.LG

BeamPERL: Parameter-Efficient RL with Verifiable Rewards Specializes Compact LLMs for Structured Beam Mechanics Reasoning

Lo studio BeamPERL dimostra che, sebbene il rinforzo con ricompense verificabili migliori le prestazioni di modelli linguistici compatti nella meccanica delle travi, induce un adattamento anisotropo basato su template procedurali piuttosto che su una vera comprensione fisica, evidenziando la necessità di affiancare tali ricompense a scaffolding strutturato per garantire un ragionamento scientifico robusto.

Tarjei Paule Hage, Markus J. Buehler2026-03-05🔬 cond-mat.mtrl-sci

Data-Aware Random Feature Kernel for Transformers

Il paper introduce DARKFormer, un modello Transformer che supera i limiti di complessità quadratico degli attention mechanism tradizionali adottando un kernel a caratteri casuali allineato ai dati, il quale permette un campionamento per importanza efficiente e riduce il gap prestazionale rispetto all'attention softmax esatta, specialmente nei contesti di finetuning su rappresentazioni anisotrope.

Amirhossein Farzam, Hossein Mobahi, Nolan Andrew Miller + 1 more2026-03-05🤖 cs.AI

Two-Stage Photovoltaic Forecasting: Separating Weather Prediction from Plant-Characteristics

Questo articolo propone un approccio di previsione fotovoltaica in due stadi che separa la previsione meteorologica dalle caratteristiche dell'impianto, dimostrando come l'uso di modelli numerici introduca errori significativi rispetto alle osservazioni satellitari e come gli errori di previsione seguano distribuzioni generalizzate iperboliche o di Student.

Philipp Danner, Hermann de Meer2026-03-05🤖 cs.LG

Exploiting Subgradient Sparsity in Max-Plus Neural Networks

Questo lavoro propone un algoritmo di sottogradienti sparsi che sfrutta la struttura algebrica delle reti neurali Max-Plus per ottimizzare in modo efficiente la perdita del peggior campione, trasformando la sparsità naturale dei sottogradienti in un vantaggio computazionale senza compromettere le garanzie teoriche.

Ikhlas Enaieh, Olivier Fercoq2026-03-05🤖 cs.LG

InstMeter: An Instruction-Level Method to Predict Energy and Latency of DL Model Inference on MCUs

Il paper presenta InstMeter, un metodo a livello di istruzione che sfrutta i cicli di clock per prevedere con elevata precisione e linearità l'energia e la latenza dell'inferenza di modelli di deep learning su microcontrollori, riducendo significativamente gli errori di previsione e la quantità di dati necessari rispetto agli approcci esistenti.

Hao Liu, Qing Wang, Marco Zuniga2026-03-05🤖 cs.LG

Unbiased Dynamic Pruning for Efficient Group-Based Policy Optimization

Il paper propone DPPO, un framework che accelera l'ottimizzazione delle politiche di gruppo (GRPO) tramite una potatura dinamica non distorta e un imballaggio denso dei prompt, garantendo un addestramento più veloce senza compromettere la convergenza teorica o la precisione.

Haodong Zhu, Yangyang Ren, Yanjing Li + 6 more2026-03-05🤖 cs.AI

A Multi-Agent Framework for Interpreting Multivariate Physiological Time Series

Il paper presenta Vivaldi, un sistema multi-agente per l'interpretazione di serie temporali fisiologiche, che rivela come l'orchestrazione agente migliori significativamente la qualità delle spiegazioni e la rilevanza clinica nei modelli non "pensanti" e medicalmente affinati, ma possa degradare la qualità delle spiegazioni nei modelli "pensanti" pur aumentando la precisione diagnostica, sottolineando così che il valore dell'AI agenziale risiede nell'esternalizzazione selettiva del calcolo piuttosto che nella complessità massima del ragionamento.

Davide Gabrielli, Paola Velardi, Stefano Faralli + 1 more2026-03-05🤖 cs.LG

Learning Hip Exoskeleton Control Policy via Predictive Neuromusculoskeletal Simulation

Questo studio presenta un framework di apprendimento basato su simulazioni neuromuscoloscheletriche fisiche che addestra una politica di controllo per un esoscheletro dell'anca esclusivamente in ambiente simulato, dimostrandone il trasferimento efficace su hardware reale con riduzioni misurabili dell'attivazione muscolare e del lavoro articolare senza necessità di dati di movimento o sintonizzazioni aggiuntive.

Ilseung Park, Changseob Song, Inseung Kang2026-03-05🤖 cs.LG

CodeTaste: Can LLMs Generate Human-Level Code Refactorings?

Il paper presenta CodeTaste, un benchmark che valuta la capacità degli agenti LLM di eseguire refactoring di codice, rivelando un divario significativo tra le loro soluzioni e le scelte umane che può essere ridotto attraverso una strategia di "proposta-implementazione".

Alex Thillen, Niels Mündler, Veselin Raychev + 1 more2026-03-05🤖 cs.AI

Architectural Proprioception in State Space Models: Thermodynamic Training Induces Anticipatory Halt Detection

Questo studio dimostra che l'addestramento termodinamico induce nei modelli a spazio di stato (SSM) una "propriocezione architettonica" unica, caratterizzata da una forte correlazione anticipatoria tra l'entropia dello stato ricorrente e la fiducia nell'arresto, un fenomeno assente nei Transformer che rivela come gli SSM siano architetture nativamente capaci di auto-consapevolezza computazionale per l'ottimizzazione delle risorse.

Jay Noon2026-03-05🤖 cs.AI

REDNET-ML: A Multi-Sensor Machine Learning Pipeline for Harmful Algal Bloom Risk Detection Along the Omani Coast

Il progetto REDNET-ML sviluppa una pipeline di machine learning riproducibile che fonde dati satellitari multi-sensore e modelli di object detection per generare stime probabilistiche calibrate del rischio di fioriture algali dannose lungo la costa omanita, supportando così la gestione operativa delle infrastrutture costiere e degli approvvigionamenti idrici.

Ameer Alhashemi2026-03-05🤖 cs.LG

Noise-aware Client Selection for carbon-efficient Federated Learning via Gradient Norm Thresholding

Questo articolo propone un approccio modulare per il Federated Learning a basso impatto di carbonio che, integrando una filtrazione dei dati rumorosi tramite una soglia sulla norma del gradiente, migliora sia le prestazioni del modello che la sostenibilità, superando i limiti delle strategie di selezione attuali che tendono a includere client con dati di bassa qualità.

Patrick Wilhelm, Inese Yilmaz, Odej Kao2026-03-05🤖 cs.AI

Stable and Steerable Sparse Autoencoders with Weight Regularization

Questo studio dimostra che l'aggiunta di regolarizzazione dei pesi (in particolare L2) agli autoencoder sparsi migliora significativamente la stabilità e la riproducibilità delle caratteristiche apprese, aumentando la coerenza tra diversi semi casuali e raddoppiando il successo del controllo direzionale (steering) senza compromettere la qualità delle interpretazioni automatizzate.

Piotr Jedryszek, Oliver M. Crook2026-03-05🤖 cs.LG

← Precedente Successivo →