FedCova: Robust Federated Covariance Learning Against Noisy Labels

Il paper propone FedCova, un framework di apprendimento federato robusto che elimina la dipendenza da dati esterni o dispositivi puliti, migliorando la resilienza intrinseca del modello contro le etichette rumorose attraverso un nuovo approccio basato sull'analisi delle covarianze delle caratteristiche per l'encoding, la classificazione e la correzione delle etichette.

Xiangyu Zhong, Xiaojun Yuan, Ying-Jun Angela Zhang2026-03-05🤖 cs.LG

BeamPERL: Parameter-Efficient RL with Verifiable Rewards Specializes Compact LLMs for Structured Beam Mechanics Reasoning

Lo studio BeamPERL dimostra che, sebbene il rinforzo con ricompense verificabili migliori le prestazioni di modelli linguistici compatti nella meccanica delle travi, induce un adattamento anisotropo basato su template procedurali piuttosto che su una vera comprensione fisica, evidenziando la necessità di affiancare tali ricompense a scaffolding strutturato per garantire un ragionamento scientifico robusto.

Tarjei Paule Hage, Markus J. Buehler2026-03-05🔬 cond-mat.mtrl-sci

Data-Aware Random Feature Kernel for Transformers

Il paper introduce DARKFormer, un modello Transformer che supera i limiti di complessità quadratico degli attention mechanism tradizionali adottando un kernel a caratteri casuali allineato ai dati, il quale permette un campionamento per importanza efficiente e riduce il gap prestazionale rispetto all'attention softmax esatta, specialmente nei contesti di finetuning su rappresentazioni anisotrope.

Amirhossein Farzam, Hossein Mobahi, Nolan Andrew Miller + 1 more2026-03-05🤖 cs.AI

Two-Stage Photovoltaic Forecasting: Separating Weather Prediction from Plant-Characteristics

Questo articolo propone un approccio di previsione fotovoltaica in due stadi che separa la previsione meteorologica dalle caratteristiche dell'impianto, dimostrando come l'uso di modelli numerici introduca errori significativi rispetto alle osservazioni satellitari e come gli errori di previsione seguano distribuzioni generalizzate iperboliche o di Student.

Philipp Danner, Hermann de Meer2026-03-05🤖 cs.LG

A Multi-Agent Framework for Interpreting Multivariate Physiological Time Series

Il paper presenta Vivaldi, un sistema multi-agente per l'interpretazione di serie temporali fisiologiche, che rivela come l'orchestrazione agente migliori significativamente la qualità delle spiegazioni e la rilevanza clinica nei modelli non "pensanti" e medicalmente affinati, ma possa degradare la qualità delle spiegazioni nei modelli "pensanti" pur aumentando la precisione diagnostica, sottolineando così che il valore dell'AI agenziale risiede nell'esternalizzazione selettiva del calcolo piuttosto che nella complessità massima del ragionamento.

Davide Gabrielli, Paola Velardi, Stefano Faralli + 1 more2026-03-05🤖 cs.LG

Learning Hip Exoskeleton Control Policy via Predictive Neuromusculoskeletal Simulation

Questo studio presenta un framework di apprendimento basato su simulazioni neuromuscoloscheletriche fisiche che addestra una politica di controllo per un esoscheletro dell'anca esclusivamente in ambiente simulato, dimostrandone il trasferimento efficace su hardware reale con riduzioni misurabili dell'attivazione muscolare e del lavoro articolare senza necessità di dati di movimento o sintonizzazioni aggiuntive.

Ilseung Park, Changseob Song, Inseung Kang2026-03-05🤖 cs.LG

Architectural Proprioception in State Space Models: Thermodynamic Training Induces Anticipatory Halt Detection

Questo studio dimostra che l'addestramento termodinamico induce nei modelli a spazio di stato (SSM) una "propriocezione architettonica" unica, caratterizzata da una forte correlazione anticipatoria tra l'entropia dello stato ricorrente e la fiducia nell'arresto, un fenomeno assente nei Transformer che rivela come gli SSM siano architetture nativamente capaci di auto-consapevolezza computazionale per l'ottimizzazione delle risorse.

Jay Noon2026-03-05🤖 cs.AI

REDNET-ML: A Multi-Sensor Machine Learning Pipeline for Harmful Algal Bloom Risk Detection Along the Omani Coast

Il progetto REDNET-ML sviluppa una pipeline di machine learning riproducibile che fonde dati satellitari multi-sensore e modelli di object detection per generare stime probabilistiche calibrate del rischio di fioriture algali dannose lungo la costa omanita, supportando così la gestione operativa delle infrastrutture costiere e degli approvvigionamenti idrici.

Ameer Alhashemi2026-03-05🤖 cs.LG

Noise-aware Client Selection for carbon-efficient Federated Learning via Gradient Norm Thresholding

Questo articolo propone un approccio modulare per il Federated Learning a basso impatto di carbonio che, integrando una filtrazione dei dati rumorosi tramite una soglia sulla norma del gradiente, migliora sia le prestazioni del modello che la sostenibilità, superando i limiti delle strategie di selezione attuali che tendono a includere client con dati di bassa qualità.

Patrick Wilhelm, Inese Yilmaz, Odej Kao2026-03-05🤖 cs.AI

Stable and Steerable Sparse Autoencoders with Weight Regularization

Questo studio dimostra che l'aggiunta di regolarizzazione dei pesi (in particolare L2) agli autoencoder sparsi migliora significativamente la stabilità e la riproducibilità delle caratteristiche apprese, aumentando la coerenza tra diversi semi casuali e raddoppiando il successo del controllo direzionale (steering) senza compromettere la qualità delle interpretazioni automatizzate.

Piotr Jedryszek, Oliver M. Crook2026-03-05🤖 cs.LG