Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Dit artikel presenteert een sublineaire Bayesiaanse regret-begrenzing voor het GP-PSRL-algoritme in continue besturingsproblemen met onbegrensde toestanden, waarbij wordt aangetoond dat bezochte toestanden met hoge waarschijnlijkheid binnen een bijna constante straal blijven en een strakke afhankelijkheid van de maximale informatiewinst wordt bereikt.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan PetersTue, 10 Ma🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Deze paper introduceert een nieuwe methode voor het genereren van plausibele tegenfeitelijke verklaringen voor tijdreeksclassificatie door middel van gradiëntgebaseerde optimalisatie en soft-DTW-alignment, wat resulteert in verklaringen die niet alleen geldig zijn maar ook een realistische temporele structuur behouden die beter aansluit bij de doelklasse dan bestaande methoden.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}baTue, 10 Ma🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Deze paper toont aan dat de kwaliteit van compacte toestandsrepresentaties in versterkend leren, die zijn gebaseerd op Laplaciaan-eigenvectoren, direct wordt beïnvloed door de algebraïsche connectiviteit van de overgangsgrafiek, en levert een volledige foutanalyse voor zowel de benadering als de schatting van deze eigenschappen.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo PapiniTue, 10 Ma🤖 cs.LG

Losing dimensions: Geometric memorization in generative diffusion

Dit artikel introduceert een geometrisch theorie voor generatieve diffusiemodellen, waarin wordt aangetoond dat memorisatie van trainingsdata niet abrupt maar geleidelijk verloopt via een 'gladde instorting' waarbij het model zich geleidelijk concentreert op een paar voorbeelden naarmate de data schaars wordt.

Beatrice Achilli, Enrico Ventura, Gianluigi Silvestri, Bao Pham, Gabriel Raya, Dmitry Krotov, Carlo Lucibello, Luca AmbrogioniThu, 12 Ma📊 stat