stat.ML artigos | Gist.Science

Invariance-Based Dynamic Regret Minimization

O artigo propõe o algoritmo ISD-linUCB para banditos lineares não estacionários, que melhora o desempenho ao decompor o modelo de recompensa em componentes estacionários e não estacionários, permitindo o aproveitamento de dados históricos para identificar invariâncias e reduzir a dimensionalidade do problema.

Margherita Lazzaretto, Jonas Peters, Niklas Pfister2026-03-05🤖 cs.LG

Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs

Este artigo propõe uma metodologia hierárquica que combina inferência bayesiana, modelos de fechamento baseados em aprendizado de máquina e estratégias de otimização bilevel com surrogados (como FNOs e PINNs) para resolver simultaneamente problemas inversos de parâmetros e aprender dinâmicas desconhecidas em sistemas governados por EDOs e EDPs.

Pengyu Zhang, Arnaud Vadeboncoeur, Alex Glyn-Davies + 1 more2026-03-05🤖 cs.LG

Fixed-Budget Constrained Best Arm Identification in Grouped Bandits

Este artigo investiga a identificação do melhor braço sob restrição de orçamento fixo em banditos agrupados, propondo o algoritmo FCSR que garante a viabilidade de todas as atributos e demonstra desempenho ótimo e superior a baselines naturais.

Raunak Mukherjee, Sharayu Moharir2026-03-05🤖 cs.LG

Exploiting Subgradient Sparsity in Max-Plus Neural Networks

Este trabalho propõe um algoritmo de subgradiente esparsificado que explora a estrutura algébrica natural das redes neurais Max-Plus para otimizar a minimização da perda da pior amostra, superando as ineficiências da retropropagação padrão e permitindo atualizações de parâmetros mais eficientes com garantias teóricas.

Ikhlas Enaieh, Olivier Fercoq2026-03-05🤖 cs.LG

Stable and Steerable Sparse Autoencoders with Weight Regularization

Este artigo demonstra que a aplicação de regularização de pesos (especialmente L2) em Autoencoders Esparsos (SAEs) melhora significativamente a estabilidade e a consistência das características aprendidas entre diferentes sementes aleatórias, aumentando a taxa de sucesso no direcionamento de modelos de linguagem e alinhando melhor as explicações interpretáveis com a capacidade de controle funcional.

Piotr Jedryszek, Oliver M. Crook2026-03-05🤖 cs.LG

Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

Este artigo apresenta uma perspectiva baseada na verossimilhança para a agregação de densidades em ensembles, demonstrando que a média generalizada normalizada com ordem $r \in [0,1]$ é a única que garante melhorias sistemáticas sobre distribuições individuais, o que justifica teoricamente o uso prático das poolings linear e geométrica.

Raphaël Razafindralambo, Rémy Sun, Frédéric Precioso + 2 more2026-03-05🤖 cs.LG

Semi-Supervised Generative Learning via Latent Space Distribution Matching

Este artigo apresenta o LSDM, um novo framework de aprendizado generativo semi-supervisionado que combina a aprendizagem de um espaço latente a partir de dados pareados e não pareados com a correspondência de distribuições usando a distância de Wasserstein, oferecendo limites de erro teóricos e insights sobre modelos de difusão latente enquanto melhora a qualidade da geração em tarefas como super-resolução de imagens.

Kwong Yu Chong, Long Feng2026-03-05🤖 cs.LG

PTOPOFL: Privacy-Preserving Personalised Federated Learning via Persistent Homology

O artigo apresenta o PTOPOFL, um framework de aprendizado federado personalizado que utiliza descritores topológicos derivados da homologia persistente para substituir o compartilhamento de gradientes, garantindo simultaneamente privacidade contra ataques de reconstrução e melhor desempenho em cenários de dados não-IID através de uma agregação guiada por topologia.

Kelly L Vomo-Donfack, Adryel Hoszu, Grégory Ginot + 1 more2026-03-05🤖 cs.LG

From Reachability to Learnability: Geometric Design Principles for Quantum Neural Networks

Este artigo redefine o design de Redes Neurais Quânticas ao priorizar a geometria controlável das representações ocultas em vez da alcançabilidade de estados, introduzindo o critério de quase Seletividade Local Completa (aCLS) que demonstra a necessidade de dependência conjunta entre dados e pesos para permitir deformações geométricas adaptativas e eficientes.

Vishal S. Ngairangbam, Michael Spannowsky2026-03-03⚛️ quant-ph

Denoising Diffusion Probabilistic Models

Este artigo apresenta resultados de alta qualidade na síntese de imagens utilizando Modelos Probabilísticos de Difusão com Desembarulhamento, alcançando desempenho de ponta no conjunto de dados CIFAR10 e qualidade comparável ao ProgressiveGAN no LSUN, graças a uma nova conexão teórica entre esses modelos e a correspondência de pontuação com dinâmica de Langevin.

Jonathan Ho, Ajay Jain, Pieter Abbeel2020-06-19🤖 cs.LG

Scaling Laws for Neural Language Models

O artigo estabelece leis empíricas de escala que demonstram como o desempenho de modelos de linguagem segue uma relação de lei de potência com o tamanho do modelo, do conjunto de dados e do poder computacional, revelando que o uso mais eficiente de recursos envolve treinar modelos muito grandes em conjuntos de dados menores e interromper o treinamento antes da convergência.

Jared Kaplan, Sam McCandlish, Tom Henighan + 7 more2020-01-23🤖 cs.LG

Generative Adversarial Networks

Este artigo propõe um novo framework para estimar modelos generativos por meio de um processo adversarial que treina simultaneamente um modelo gerador e um discriminador em um jogo minimax, permitindo o treinamento eficiente via retropropagação sem a necessidade de cadeias de Markov ou redes de inferência aproximada.

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza + 5 more2014-06-10📊 stat.ML

Auto-Encoding Variational Bayes

Este artigo apresenta o algoritmo Auto-Encoding Variational Bayes (VAE), que combina reparametrização e redes neurais para permitir inferência e aprendizado escaláveis e eficientes em modelos probabilísticos direcionados com variáveis latentes contínuas e grandes conjuntos de dados.

Diederik P Kingma, Max Welling2013-12-20📊 stat.ML

← Anterior