A Semiparametric Nonlinear Mixed Effects Model with Penalized Splines Using Automatic Differentiation

Questo articolo presenta un nuovo metodo di stima per modelli ad effetti misti non lineari che utilizza penalized splines e differenziazione automatica tramite Template Model Builder per migliorare le prestazioni inferenziali e ridurre il carico computazionale, come dimostrato sia in simulazioni che in uno studio di caso sulla crescita infantile.

Matteo D'Alessandro, Magne Thoresen, Øystein SørensenFri, 13 Ma📊 stat

Including historical control data in simultaneous inference for pre-clinical multi-arm studies

Il paper propone un approccio bayesiano dinamico che integra dati storici di controllo per ridurre il numero di animali nei gruppi di controllo negli studi tossicologici pre-clinici a bracci multipli, mantenendo il controllo del tasso di errore familiare e proteggendo contro le derive dei dati.

Max Menssen, Carsten Kneuer, Gyamfi Akyianu, Christian Röver, Tim Friede, Frank SchaarschmidtFri, 13 Ma📊 stat

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

Questo studio propone un algoritmo di apprendimento sociale basato sull'energia libera per i banditi sociali, che permette a un agente di valutare e sfruttare le competenze di altri agenti non esperti o diversificati senza conoscere le loro ricompense, migliorando le prestazioni individuali e garantendo una convergenza teorica ottimale.

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili AhmadabadiFri, 13 Ma📊 stat

A Further Efficient Algorithm with Best-of-Both-Worlds Guarantees for mm-Set Semi-Bandit Problem

Questo articolo dimostra che la politica Follow-the-Perturbed-Leader (FTPL) con distribuzioni di Fréchet e Pareto, combinata con un'estensione efficiente del campionamento geometrico condizionato, raggiunge ottimalità di rimpianto e complessità computazionale ridotta per il problema dei semi-bracci a mm-insiemi sia in ambienti avversariali che stocastici.

Botao Chen, Jongyeong Lee, Chansoo Kim, Junya HondaFri, 13 Ma📊 stat

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Il paper propone EnTransformer, un framework di previsione generativa basato su Transformer che integra l'engression per apprendere distribuzioni condizionali multivariate senza assunzioni parametriche, ottenendo previsioni probabilistiche ben calibrate e superiori rispetto ai modelli esistenti su diversi benchmark.

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit ChakrabortyFri, 13 Ma📊 stat

On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

Questo studio analizza i compromessi tra curvatura del rischio, geometria del rumore e precondizionamento nel metodo PSGD multipass, sviluppando una nuova analisi di stabilità algoritmica media per derivare limiti di rischio in eccesso dipendenti dalla dimensione effettiva e dimostrando come un precondizionatore inadeguato possa portare a una dipendenza subottimale da tale dimensione.

Simon Vary, Tyler Farghly, Ilja Kuzborskij, Patrick RebeschiniFri, 13 Ma📊 stat

Low-Rank and Sparse Drift Estimation for High-Dimensional Lévy-Driven Ornstein--Uhlenbeck Processes

Questo lavoro propone e analizza un metodo di stima convesso basato sulla decomposizione in componenti a basso rango e sparse per la matrice di deriva di processi di Ornstein-Uhlenbeck ad alta dimensione guidati da rumore di Lévy, dimostrando che tale approccio migliora la dipendenza dalla dimensione rispetto agli stimatori puramente sparsi attraverso una disuguaglianza oracolo non asintotica.

Marina PalaistiFri, 13 Ma📊 stat

A Quantitative Characterization of Forgetting in Post-Training

Questo lavoro fornisce una caratterizzazione quantitativa dell'oblio nel post-addestramento continuo dei modelli generativi, dimostrando teoricamente come la direzione della divergenza (KL diretta o inversa), la sovrapposizione geometrica delle distribuzioni e le strategie di replay determinino se si verifica la perdita di massa o lo spostamento dei componenti delle conoscenze precedenti.

Krishnakumar Balasubramanian, Shiva Prasad KasiviswanathanFri, 13 Ma📊 stat