Prognostics for Autonomous Deep-Space Habitat Health Management under Multiple Unknown Failure Modes

Questo articolo propone un framework di prognostica non supervisionato che, utilizzando dati di guasto non etichettati, identifica simultaneamente modalità di guasto latenti e seleziona sensori informativi per migliorare la previsione della vita utile residua negli habitat spaziali profondi autonomi.

Benjamin Peters, Ayush Mohanty, Xiaolei Fang, Stephen K. Robinson, Nagi GebraeelWed, 11 Ma🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Questo articolo propone una critica consequenzialista alle pratiche di valutazione della classificazione binaria, sostenendo l'adozione di regole di scoring adeguate come il punteggio Brier attraverso un nuovo framework decisionale e il pacchetto Python `briertools`, che colmano il divario tra teoria e pratica dominata da metriche a soglia fissa.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning

Questo lavoro propone due nuovi algoritmi di apprendimento per rinforzo privi di modello, Q-EarlySettled-LowCost e FedQ-EarlySettled-LowCost, che per la prima volta raggiungono simultaneamente un rimpianto quasi ottimale, costi di avvio lineari rispetto agli stati e alle azioni e costi di commutazione o comunicazione logaritmici, sia per agenti singoli che in contesti federati.

Haochen Zhang, Zhong Zheng, Lingzhou XueWed, 11 Ma🤖 cs.LG

Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery

Questo articolo stabilisce le prime garanzie di convergenza globale per un variante dell'algoritmo IRLS con regolarizzazione dinamica, dimostrando che esso converge linearmente al sottospazio sottostante da qualsiasi inizializzazione nel contesto del recupero robusto dei sottospazi e dell'estimazione affine, estendendo inoltre i risultati teorici all'addestramento di reti neurali a bassa dimensionalità.

Gilad Lerman, Kang Li, Tyler Maunu, Teng ZhangWed, 11 Ma🤖 cs.LG

Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values

Questo lavoro studia i processi decisionali di Markov robusti non rettangolari con ricompensa media, dimostrando che le politiche ottimali possono essere caratterizzate tramite minimax senza richiedere rectangularità, e proponendo un nuovo quadro di valori transitori che combina politiche stazionarie ottimali con test sequenziali per garantire prestazioni finite nel tempo.

Shengbo Wang, Nian SiWed, 11 Ma🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

Questo lavoro presenta un framework basato su reti neurali informate dalla fisica (PINN) che permette una stima robusta dei parametri biofisici e la ricostruzione degli stati nascosti in modelli neuronali multiscala, superando le limitazioni dei metodi tradizionali grazie alla sua efficacia anche con osservazioni parziali, rumorose e inizializzazioni non informative.

Changliang Wei, Yangyang Wang, Xueyu ZhuWed, 11 Ma🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Questo lavoro introduce il modello VI 2D SSM, un'architettura di spazio degli stati bidimensionale che garantisce l'equivarianza rispetto alle permutazioni nelle serie temporali multivariate, eliminando le dipendenze sequenziali artificiali tra le variabili e ottenendo prestazioni all'avanguardia grazie a una struttura teoricamente fondata su dinamiche locali e interazioni globali aggregate.

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

Questo lavoro presenta un'analisi esaustiva di nove famiglie di limiti per la previsione selettiva e introduce il "Transfer-Informed Betting" (TIB), un metodo innovativo che combina sequenze di scommesse basate su martingale con il trasferimento di conoscenza tra domini per ottenere garanzie di rischio più strette in scenari con dati scarsi, dimostrando superiorità empirica su diversi benchmark rispetto ai metodi conformali e alle tecniche esistenti.

Abhinaba BasuWed, 11 Ma🤖 cs.AI