stat.ML artigos | Gist.Science

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

Este artigo estabelece garantias de amostragem finita para um método de aprendizado de representação de estado orientado a custos que, ao prever custos multietapa sem modelar observações ou ações, permite encontrar controladores e representações latentes quase ótimos para problemas de controle Linear Quadrático Gaussiano (LQG) de horizonte finito.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit SraTue, 10 Ma🤖 cs.LG

Nuisance Function Tuning and Sample Splitting for Optimally Estimating a Doubly Robust Functional

Este artigo demonstra que, ao combinar estrategicamente o particionamento da amostra com o ajuste de parâmetros de suavização (sub ou super-suavização) para as funções de incômodo, é possível que estimadores de plug-in e de correção de viés de primeira ordem atinjam taxas de convergência minimax ótimas para funcionais duplamente robustos em todas as classes de suavidade de Hölder, superando limitações da literatura existente.

Sean McGrath, Rajarshi MukherjeeTue, 10 Ma🔢 math

A Robust Multi-Item Auction Design with Statistical Learning

Este artigo propõe um novo método de aprendizado estatístico para leilões de múltiplos itens que utiliza intervalos de credibilidade para reduzir custos de implementação, mantendo a justiça e a compatibilidade de incentivos com alta probabilidade enquanto maximiza a receita.

Jiale Han, Xiaowu DaiTue, 10 Ma💻 cs

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

O artigo apresenta o OTAD, um modelo de defesa adversarial robusto que combina treinamento de redes neurais com regularização baseada em transporte ótimo e interpolação via problema de integração convexa para garantir continuidade de Lipschitz local, superando modelos existentes em diversos conjuntos de dados.

Kuo Gai, Sicong Wang, Shihua ZhangTue, 10 Ma🤖 cs.LG

Mini-batch Estimation for Deep Cox Models: Statistical Foundations and Practical Guidance

Este artigo estabelece as fundações estatísticas do estimador de máxima verossimilhança parcial em mini-lotes (mb-MPLE) para redes neurais de Cox, demonstrando sua consistência e eficiência assintótica, enquanto oferece orientações práticas para o ajuste de hiperparâmetros e a convergência do gradiente descendente estocástico em aplicações de larga escala.

Lang Zeng, Weijing Tang, Zhao Ren, Ying DingTue, 10 Ma🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Este artigo propõe um método de Amostragem de Importância Annealed (AIS) combinado com reparametrização eficiente para otimizar o aprendizado variacional de Modelos de Variáveis Latentes de Processo Gaussiano (GPLVMs), superando as limitações de abordagens anteriores em espaços de alta dimensão e alcançando melhores limites variacionais e convergência em diversos conjuntos de dados.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John PaisleyTue, 10 Ma🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

Este artigo apresenta o BNEM, um amostrador baseado em Boltzmann que utiliza a técnica de correspondência de energia com ruído (NEM) combinada com um método de bootstrap para gerar amostras independentes e identicamente distribuídas a partir de funções de energia, alcançando desempenho superior e maior robustez em comparação com trabalhos anteriores.

RuiKang OuYang, Bo Qiang, José Miguel Hernández-LobatoTue, 10 Ma🤖 cs.LG

Adaptive Transfer Clustering: A Unified Framework

Os autores propõem o Agrupamento de Transferência Adaptativa (ATC), uma estrutura unificada que automatiza o aproveitamento de dados auxiliares para melhorar o agrupamento em modelos estatísticos diversos, equilibrando automaticamente similaridades e discrepâncias entre conjuntos de dados.

Yuqi Gu, Zhongyuan Lyu, Kaizheng WangTue, 10 Ma🤖 cs.LG

The Exploration of Error Bounds in Classification with Noisy Labels

Este artigo estabelece limites teóricos para o risco excessivo em problemas de classificação com rótulos ruidosos no contexto de aprendizado profundo, decompondo-os em erros estatísticos e de aproximação e refinando-os sob a hipótese de variedades de baixa dimensão para mitigar a maldição da dimensionalidade.

Haixia Liu, Boxiao Li, Can Yang, Yang WangTue, 10 Ma🤖 cs.LG

Active Advantage-Aligned Online Reinforcement Learning with Offline Data

O artigo apresenta o A3RL, um método que integra aprendizado por reforço online e offline através de uma estratégia de amostragem ativa consciente da confiança para priorizar dados alinhados às necessidades da política, superando desafios como esquecimento catastrófico e ineficiência de amostragem.

Xuefeng Liu, Hung T. C. Le, Siyu Chen, Rick Stevens, Zhuoran Yang, Matthew R. Walter, Yuxin ChenTue, 10 Ma🤖 cs.LG

Adaptive Replication Strategies in Trust-Region-Based Bayesian Optimization of Stochastic Functions

Este artigo apresenta um método de otimização Bayesiana baseado em regiões de confiança que utiliza replicação adaptativa e funções de aquisição modificadas para lidar eficazmente com funções estocásticas de alta variância, demonstrando ganhos significativos em precisão e eficiência computacional em comparação com métodos de base.

Mickael Binois (ACUMES), Jeffrey Larson (ANL)Tue, 10 Ma🔢 math

Reinforcement Learning for Individual Optimal Policy from Heterogeneous Data

Este artigo propõe um framework de otimização de políticas offline individualizado para processos de decisão de Markov heterogêneos, introduzindo o algoritmo P4L que utiliza variáveis latentes individuais para garantir uma taxa rápida de arrependimento médio e superar métodos tradicionais ao lidar com dados heterogêneos.

Rui Miao, Babak Shahbaba, Annie QuTue, 10 Ma🤖 cs.LG

Online Decision-Focused Learning

Este artigo propõe os primeiros algoritmos online com garantias teóricas de arrependimento para o Aprendizado Focado em Decisão (DFL) em ambientes dinâmicos, superando desafios como a ausência de gradientes e a não convexidade através de regularização e técnicas de perturbação.

Aymeric Capitaine, Maxime Haddouche, Eric Moulines, Michael I. Jordan, Etienne Boursier, Alain DurmusTue, 10 Ma🤖 cs.LG

Synthetic data for ratemaking: imputation-based methods vs adversarial networks and autoencoders

Este artigo compara métodos de imputação baseados em MICE com redes adversariais e autoencoders para a geração de dados sintéticos em tarifação atuarial, demonstrando que o MICE oferece alta fidelidade estatística e menor complexidade de implementação.

Yevhen Havrylenko, Meelis Käärik, Artur TuttarTue, 10 Ma🤖 cs.LG

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

Este artigo propõe a classe de métodos F²SA- $p$ , que utiliza diferenças finitas de ordem $p$ para aproximar o hipergradiente em otimização bilevel estocástica, alcançando uma complexidade quase ótima de $\tilde{\mathcal{O}}(p \epsilon^{-4-p/2})$ para problemas com suavidade de ordem superior.

Lesi Chen, Junru Li, El Mahdi Chayti, Jingzhao ZhangTue, 10 Ma🤖 cs.LG

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

Este artigo apresenta um método que combina aprendizado profundo e Condutâncias de Entrada Dinâmicas (DICs) para reconstruir rapidamente populações degeneradas de modelos neuronais baseados em condutância a partir de tempos de disparo, permitindo a inferência eficiente de parâmetros biofísicos e a exploração da variabilidade de condutâncias que garantem a computação neuronal confiável.

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur FyonTue, 10 Ma🤖 cs.LG

Empirical PAC-Bayes bounds for Markov chains

Este artigo apresenta a primeira versão totalmente empírica de um limite PAC-Bayes para cadeias de Markov, demonstrando que é possível estimar empiricamente o "pseudo-gap espectral" em espaços de estado finitos, eliminando assim a dependência de constantes teóricas desconhecidas na prática.

Vahe Karagulyan, Pierre AlquierTue, 10 Ma🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

Este artigo apresenta os GDR-learners, uma nova família de modelos generativos que estimam distribuições de resultados potenciais com propriedades de ortogonalidade de Neyman, oferecendo eficiência quase-oráculo e robustez dupla, superando métodos existentes em experimentos sintéticos.

Valentyn Melnychuk, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Este trabalho apresenta a Regularização Adaptativa à Sobreposição (OAR), uma nova abordagem que melhora a estimativa do Efeito Médio de Tratamento Condicional (CATE) em regiões de baixa sobreposição ao regularizar os modelos-alvo proporcionalmente aos pesos de sobreposição, sendo compatível com qualquer meta-aprendiz existente e oferecendo versões viesadas para inferência robusta.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Este artigo apresenta o DRQ-learner, um novo meta-aprendizado que prevê resultados individuais em processos de decisão de Markov com dados observacionais, oferecendo garantias teóricas robustas como dupla robustez, ortogonalidade de Neyman e eficiência quasi-órcula, enquanto supera os métodos existentes em experimentos numéricos.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

← Anterior Próximo →