Estimation of heterogeneous principal effects under principal ignorability

Questo articolo propone un quadro metodologico per stimare e costruire intervalli di confidenza per effetti causali principali eterogenei in presenza di variabili intermedie binarie, sviluppando stimatori con diverse proprietà di robustezza (doppia e intermedia) sotto l'ipotesi di ignorabilità principale e validandoli empiricamente tramite un trial randomizzato.

Rui Zhang, Charles R. Doss, Jared D. HulingWed, 11 Ma📊 stat

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

Il documento presenta un approccio assiomatico ai processi decisionali di Markov robusti su spazi di Borel con distribuzioni di disturbo sconosciute, dimostrando che l'uso di insiemi di ambiguità basati su distanze empiriche garantisce la convergenza verso il valore ottimo vero e fornisce limiti di prestazione fuori campione con alta probabilità per dimensioni campionarie finite, superando le carenze dei processi decisionali empirici standard.

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

Questo lavoro verifica che gli osservatori persistenti in substrati di ipergrafi causali soddisfano il Teorema del Buono Regolatore di Conant-Ashby, dimostrando che la discesa del gradiente naturale è l'unica regola di apprendimento ammissibile e derivando una formula chiusa per il parametro di regime di Vanchurin, sebbene tale risultato dipenda fortemente dal modello di convergenza scelto.

Max ZhuravlevWed, 11 Ma🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

Il paper propone un quadro unificato di campionamento generativo basato sulla reversibilità temporale e sulla minimizzazione della discrepanza MMD tra traiettorie forward e backward, che permette di campionare distribuzioni complesse su spazi continui, discreti o misti senza richiedere gradienti del target o rilassamenti continui, utilizzando solo valutazioni energetiche.

Lei Li, Zhen Wang, Lishuo ZhangWed, 11 Ma🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Questo lavoro stabilisce nuovi limiti di generalizzazione trasduttiva basati sul trasporto ottimo e sulle distanze di Wasserstein, dimostrando che sono efficientemente calcolabili e correlati all'errore empirico nella classificazione di nodi su grafi, rivelando inoltre come l'aggregazione delle GNN influenzi la generalizzazione attraverso un compromesso tra concentrazione intra-classe e separazione inter-classe.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo KimWed, 11 Ma🤖 cs.LG

Robust Regularized Policy Iteration under Transition Uncertainty

Il paper propone Robust Regularized Policy Iteration (RRPI), un nuovo algoritmo per l'apprendimento per rinforzo offline che affronta l'incertezza di transizione formulando l'ottimizzazione come un problema robusto con regolarizzazione KL, garantendo teoricamente la convergenza e ottenendo prestazioni superiori rispetto agli stati dell'arte su benchmark come D4RL.

Hongqiang Lin, Zhenghui Fu, Weihao Tang, Pengfei Wang, Yiding Sun, Qixian Huang, Dongxu ZhangWed, 11 Ma🤖 cs.AI

What Do We Care About in Bandits with Noncompliance? BRACE: Bandits with Recommendations, Abstention, and Certified Effects

Il paper introduce BRACE, un algoritmo per i banditi con non conformità che gestisce il trade-off tra il benessere delle raccomandazioni e l'apprendimento dei trattamenti, fornendo intervalli strutturali certificati e identificando politiche ottimali sia per scenari di controllo diretto che mediato, anche in presenza di identificazione debole o eterogeneità.

Nicolás Della PennaWed, 11 Ma🤖 cs.LG

Upper Generalization Bounds for Neural Oscillators

Questo studio deriva nuovi limiti superiori di generalizzazione PAC per gli oscillatori neurali basati su equazioni differenziali ordinarie del secondo ordine, dimostrando teoricamente e validando numericamente che la regolarizzazione dei Lipschitz delle reti MLP mitiga la complessità parametrica e migliora le prestazioni nell'approssimazione di sistemi strutturali non lineari.

Zifeng Huang, Konstantin M. Zuev, Yong Xia, Michael BeerWed, 11 Ma🤖 cs.LG

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

Questo articolo presenta un nuovo framework gerarchico multi-task e multi-fidelity per la modellazione surrogata basata su processi gaussiani, che integra informazioni tra compiti correlati e livelli di fedeltà variabili per migliorare l'accuratezza predittiva e la quantificazione dell'incertezza in contesti manifatturieri con dati eterogenei.

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui ShaoWed, 11 Ma🤖 cs.LG