Synthetic Monitoring Environments for Reinforcement Learning

Este artigo apresenta as Synthetic Monitoring Environments (SMEs), uma suite infinita de tarefas de controle contínuo com políticas ótimas conhecidas e métricas de desempenho exatas, projetada para permitir diagnósticos precisos e análises científicas rigorosas do comportamento de agentes de Aprendizado por Reforço, superando as limitações de benchmarks atuais.

Leonard Pleiss, Carolin Schmidt, Maximilian SchifferMon, 09 Ma🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

Este artigo propõe o modelo BAEN-SVM, que utiliza uma nova função de perda elástica assimétrica limitada para criar uma máquina de vetores de suporte robusta a ruídos, geometricamente bem definida e com garantia de consistência, resolvendo o problema de otimização não convexo por meio de um algoritmo eficiente e demonstrando superioridade em experimentos com dados ruidosos.

Haiyan Du, Hu YangMon, 09 Ma🤖 cs.LG

Certified and accurate computation of function space norms of deep neural networks

Este artigo apresenta uma estrutura para o cálculo certificado e preciso de normas em espaços de funções (como Lebesgue e Sobolev) de redes neurais profundas, combinando aritmética intervalar, refinamento adaptativo e quadratura para fornecer limites determinísticos e garantidos de erros em normas de funções, superando as limitações das avaliações pontuais tradicionais.

Johannes Gründler, Moritz Maibaum, Philipp PetersenMon, 09 Ma🤖 cs.LG

Finance-Informed Neural Network: Learning the Geometry of Option Pricing

O artigo propõe a Rede Neural Informada por Finanças (FINN), um modelo que aprende a precificação e cobertura de opções através de um objetivo de replicação auto-supervisionado baseado em princípios econômicos, garantindo consistência teórica, superando limitações de modelos paramétricos tradicionais e permitindo a construção de preços coerentes mesmo para ativos sem mercado de opções listado.

Amine M. Aboussalah, Xuanze Li, Cheng Chi, Raj PatelFri, 13 Ma💰 q-fin

Weighted Random Dot Product Graphs

Este artigo propõe um modelo não paramétrico de Grafos de Produto Escalar Aleatório Ponderado (WRDPG) que estende a modelagem tradicional para redes com pesos heterogêneos, permitindo discriminar distribuições de pesos com médias idênticas mas momentos superiores distintos, além de estabelecer garantias estatísticas para a estimação de posições latentes e fornecer um framework para geração de grafos ponderados.

Bernardo Marenco, Paola Bermolen, Marcelo Fiori, Federico Larroca, Gonzalo MateosFri, 13 Ma📊 stat

Busemann Functions in the Wasserstein Space: Existence, Closed-Forms, and Applications to Slicing

Este trabalho investiga a existência e o cálculo de funções de Busemann no espaço de Wasserstein, estabelecendo expressões de forma fechada para distribuições unidimensionais e medidas gaussianas, o que permite definir novos esquemas de projeção e distâncias Sliced-Wasserstein aplicáveis a misturas gaussianas e conjuntos de dados rotulados.

Clément Bonet, Elsa Cazelles, Lucas Drumetz, Nicolas CourtyFri, 13 Ma📊 stat

Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering

Este artigo propõe uma unificação bayesiana do aprendizado em contexto e do direcionamento de ativação em modelos de linguagem, demonstrando que ambos atuam alterando crenças sobre conceitos latentes — o primeiro acumulando evidências e o segundo modificando priores — permitindo prever e explicar fenômenos comportamentais complexos como curvas de aprendizado sigmóides e transições bruscas de comportamento.

Eric Bigelow, Daniel Wurgaft, YingQiao Wang, Noah Goodman, Tomer Ullman, Hidenori Tanaka, Ekdeep Singh LubanaFri, 13 Ma📊 stat

Approximate Bayesian inference for cumulative probit regression models

Este artigo propõe três algoritmos escaláveis baseados em Inferência Variacional e Propagação de Expectativa para aproximar a distribuição posterior em modelos de regressão probit cumulativa, superando as limitações computacionais dos métodos tradicionais de Monte Carlo via Cadeias de Markov em grandes conjuntos de dados e demonstrando sua eficácia em um estudo de caso sobre redes criminosas.

Emanuele AlivertiFri, 13 Ma📊 stat