stat.ML artigos | Gist.Science

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Este trabalho apresenta os estimadores ReinMax-Rao e ReinMax-CV, que incorporam técnicas de Rao-Blackwellização e variáveis de controle ao método ReinMax para reduzir a variância na estimação de gradientes de variáveis latentes discretas, demonstrando desempenho superior no treinamento de autoencoders variacionais.

Daniel Wang, Thang D. BuiTue, 10 Ma🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Este artigo estabelece limites de arrependimento sublineares para o algoritmo de Reinforcement Learning com Amostragem Posterior baseada em Processos Gaussianos (GP-PSRL) em espaços de estado ilimitados, demonstrando que os estados visitados permanecem confinados e obtendo um limite de arrependimento bayesiano de ordem $\widetilde{\mathcal{O}}(H^{3/2}\sqrt{\gamma_{T/H} T})$ que resolve as limitações teóricas anteriores.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan PetersTue, 10 Ma🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Este artigo apresenta um novo método baseado em otimização por gradiente que gera explicações contrafactuais plausíveis para problemas de classificação de séries temporais, integrando o alinhamento soft-DTW com k-vizinhos mais próximos para garantir que as explicações geradas mantenham uma estrutura temporal realista e alinhada à distribuição da classe-alvo.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}baTue, 10 Ma🤖 cs.LG

Unifying On- and Off-Policy Variance Reduction Methods

Este artigo unifica os métodos de redução de variância para experimentação online e avaliação off-policy, demonstrando a equivalência matemática entre o estimador de diferenças de médias e o estimador de pontuação de propensão inversa com variáveis de controle, bem como entre métodos de ajuste por regressão e a estimativa duplamente robusta.

Olivier JeunenTue, 10 Ma🤖 cs.LG

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

Este artigo propõe um novo algoritmo de otimização baseado no Cálculo Fracionário, especificamente utilizando o Integral de Weyl Fracionário Ponderado, que substitui os atualizações de gradiente instantâneas por uma memória histórica dinâmica para mitigar o sobreajuste e melhorar significativamente o desempenho em conjuntos de dados desbalanceados, como detecção de fraude financeira e diagnósticos médicos.

Gustavo A. DorregoTue, 10 Ma🤖 cs.LG

Efficient Credal Prediction through Decalibration

Este artigo propõe um método eficiente de "decalibração" para gerar conjuntos credais (intervalos de probabilidade) que representam incerteza epistêmica em modelos complexos, como TabPFN e CLIP, superando as limitações computacionais de abordagens anteriores baseadas em ensembles.

Paul Hofman, Timo Löhr, Maximilian Muschalik, Yusuf Sale, Eyke HüllermeierTue, 10 Ma🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Este trabalho supera a barreira de viés no aprendizado por reforço multi-objetivo com escalarização côncava, propondo um algoritmo de Gradiente de Política Natural com estimador de Monte Carlo de múltiplos níveis que atinge a complexidade de amostra ótima $\widetilde{\mathcal{O}}(\epsilon^{-2})$ , eliminando o viés intrínseco que limitava métodos anteriores a $\widetilde{\mathcal{O}}(\epsilon^{-4})$ .

Swetha Ganesh, Vaneet AggarwalTue, 10 Ma🤖 cs.LG

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

O artigo propõe a Regressão Adversarial Generativa (GAR), um quadro de aprendizado que alinha geradores a objetivos de risco downstream por meio de uma formulação minimax, produzindo cenários de risco condicional que superam métodos tradicionais na preservação de métricas de risco como VaR e ES em dados do S&P 500.

Saeed Asadi, Jonathan Yu-Meng LiTue, 10 Ma🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Este trabalho estabelece limites teóricos para o erro de aproximação de funções de valor em aprendizado por reforço, demonstrando como a qualidade da representação baseada em autovetores do Laplaciano escala com a conectividade algébrica do grafo de transições do MDP, mesmo quando essa estrutura é estimada a partir de trajetórias amostrais e sob políticas não uniformes.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo PapiniTue, 10 Ma🤖 cs.LG

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

O artigo propõe o Momentum SVGD-EM, um método acelerado que incorpora a aceleração de Nesterov tanto nas atualizações de parâmetros quanto no espaço de medidas de probabilidade para otimizar a estimativa de máxima verossimilhança marginal (MMLE) e acelerar a convergência em diversos cenários de baixa e alta dimensionalidade.

Adam Rozzio, Rafael Athanasiades, O. Deniz AkyildizTue, 10 Ma🤖 cs.LG

Structural Causal Bottleneck Models

O artigo apresenta os Modelos de Gargalo Causal Estrutural (SCBMs), uma nova classe de modelos causais que assume que os efeitos entre variáveis de alta dimensão dependem apenas de estatísticas resumidas de baixa dimensão, oferecendo uma estrutura flexível para redução de dimensionalidade específica de tarefas e estimável com algoritmos simples, com benefícios demonstrados na transferência de aprendizado com poucos dados.

Simon Bing, Jonas Wahl, Jakob RungeTue, 10 Ma🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Este artigo propõe um método de ramificação e limite disjuntivo combinado com novas relaxações convexas para resolver problemas de completamento de matrizes de baixo posto com garantia de otimalidade, superando significativamente os métodos heurísticos existentes em termos de precisão e certificação de soluções.

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean PauphiletThu, 12 Ma📊 stat

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Este artigo propõe um framework de agregação baseado em transporte ótimo para modelos de mistura de especialistas (MoE) distribuídos, permitindo a combinação eficiente de modelos locais em um estimador global com apenas uma etapa de comunicação, preservando a estrutura do MoE e garantindo desempenho comparável ao treinamento centralizado.

Faïcel Chamroukhi, Nhat Thien PhamThu, 12 Ma📊 stat

Learning Robust Treatment Rules for Censored Data

Este artigo propõe dois critérios robustos e um algoritmo de diferença de convexos para aprender regras de tratamento ótimas com base em dados de sobrevivência censurados, visando maximizar o tempo de sobrevivência truncado e probabilidades de sobrevivência bufferizadas, com validação teórica e empírica superior aos métodos existentes.

Yifan Cui, Junyi Liu, Tao Shen, Zhengling Qi, Xi ChenThu, 12 Ma📊 stat

Exploratory Optimal Stopping: A Singular Control Formulation

Este artigo formula problemas de parada ótima contínua sob uma perspectiva de aprendizado por reforço exploratório, introduzindo uma versão regularizada via entropia residual que transforma o problema em um controle estocástico singular, permitindo a identificação de estratégias ótimas e o desenvolvimento de algoritmos escaláveis de aprendizado por reforço.

Jodi Dianetti, Giorgio Ferrari, Renyuan XuThu, 12 Ma💰 q-fin

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

O artigo apresenta o EarthquakeNPP, um novo benchmark que corrige falhas anteriores e demonstra que, atualmente, nenhum dos cinco modelos de Processos Pontuais Neurais testados supera o modelo ETAS clássico para previsão de terremotos na Califórnia.

Samuel Stockman, Daniel Lawson, Maximilian WernerThu, 12 Ma🔬 physics

Losing dimensions: Geometric memorization in generative diffusion

O artigo propõe uma teoria de memorização geométrica que demonstra como os modelos de difusão, ao enfrentar escassez de dados, passam por um colapso suave de suas dimensões latentes, condensando gradualmente a geração de novas variações em uma replicação quase pontual de exemplos de treinamento, um fenômeno distinto entre a generalização e a cópia exata.

Beatrice Achilli, Enrico Ventura, Gianluigi Silvestri, Bao Pham, Gabriel Raya, Dmitry Krotov, Carlo Lucibello, Luca AmbrogioniThu, 12 Ma📊 stat

Conditional Local Importance by Quantile Expectations

O artigo propõe o método agnóstico ao modelo CLIQUE, uma nova técnica de importância local de variáveis que supera as limitações de métodos existentes ao capturar relações dependentes localmente, lidar nativamente com problemas de classificação multiclasse e reduzir vieses em regiões onde as variáveis não afetam a resposta.

Kelvyn K. Bladen, Adele Cutler, D. Richard Cutler, Kevin R. MoonThu, 12 Ma📊 stat

Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications

Este artigo propõe uma nova família de modelos estatísticos para comparações pareadas que dispensa a suposição de transitividade estocástica, utilizando uma matriz antissimétrica de baixa dimensão para capturar dinâmicas complexas e alcançar desempenho preditivo superior e otimização minimax, mesmo em cenários com dados esparsos.

Sze Ming Lee, Yunxiao ChenThu, 12 Ma📊 stat

An Algorithm to perform Covariance-Adjusted Support Vector Classification in Non-Euclidean Spaces

Este artigo propõe um algoritmo de Máquinas de Vetores de Suporte (SVM) ajustado à covariância para espaços não euclidianos, que utiliza a decomposição de Cholesky para superar as limitações das condições KKT tradicionais e demonstrar superioridade em precisão e métricas de desempenho em comparação com métodos convencionais.

Satyajeet Sahoo, Jhareswar MaitiThu, 12 Ma📊 stat

← Anterior Próximo →