Synthetic Monitoring Environments for Reinforcement Learning

Die Arbeit stellt „Synthetic Monitoring Environments" (SMEs) als eine unendliche Suite konfigurierbarer, kontinuierlicher Steuerungsaufgaben mit bekannten optimalen Strategien vor, die es ermöglichen, Reinforcement-Learning-Algorithmen durch präzise, white-box-Diagnosen und exakte Regret-Berechnungen systematisch zu analysieren und von empirischem Benchmarking zu einer rigorosen wissenschaftlichen Evaluation zu überführen.

Leonard Pleiss, Carolin Schmidt, Maximilian SchifferMon, 09 Ma🤖 cs.LG

Bounds on Representation-Induced Confounding Bias for Treatment Effect Estimation

Diese Arbeit stellt ein representationsagnostisches Refutationsframework vor, das theoretische Bedingungen für die Nicht-Identifizierbarkeit des kausalen Behandlungseffekts bei dimensionsreduzierten Repräsentationen herleitet und ein neuronales Verfahren zur Schätzung von Obergrenzen für den daraus resultierenden Verzerrungseffekt entwickelt.

Valentyn Melnychuk, Dennis Frauen, Stefan FeuerriegelFri, 13 Ma📊 stat

Weighted Random Dot Product Graphs

Diese Arbeit stellt ein nichtparametrisches gewichtetes Random Dot Product Graph-Modell (WRDPG) vor, das durch die Zuordnung latenter Positionen zu Knoten die Verteilung von Kantengewichten über deren Momente beschreibt, um so zwischen Verteilungen mit gleichem Mittelwert zu unterscheiden, und liefert konsistente Schätzer sowie einen generativen Rahmen für die Simulation solcher Netzwerke.

Bernardo Marenco, Paola Bermolen, Marcelo Fiori, Federico Larroca, Gonzalo MateosFri, 13 Ma📊 stat

Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering

Diese Arbeit stellt eine einheitliche bayesianische Theorie vor, die In-Context-Learning und Aktivierungssteuerung als Mechanismen beschreibt, die das Verhalten von Sprachmodellen durch die Veränderung latenter Konzeptglaubenswerte steuern, wobei ersteres als Evidenzakkumulation und letzteres als Prior-Anpassung interpretiert wird.

Eric Bigelow, Daniel Wurgaft, YingQiao Wang, Noah Goodman, Tomer Ullman, Hidenori Tanaka, Ekdeep Singh LubanaFri, 13 Ma📊 stat

Approximate Bayesian inference for cumulative probit regression models

Die Autoren stellen drei skalierbare Algorithmen auf Basis von Variational Bayes und Expectation Propagation vor, um die posterior-Verteilung in kumulativen Probit-Modellen für ordinale Daten effizient und präzise zu approximieren, und demonstrieren deren Überlegenheit gegenüber herkömmlichen MCMC-Methoden sowohl in der Rechengeschwindigkeit als auch in der Genauigkeit, unter anderem anhand einer Fallstudie zur Analyse krimineller Netzwerke.

Emanuele AlivertiFri, 13 Ma📊 stat