stat.ML artigos | Gist.Science

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

Este artigo analisa uma aproximação por difusão em tempo contínuo do gradiente de política para bandits estocásticos, provando que um aprendizado com taxa $\eta = O(\Delta^2/\log(n))$ resulta em arrependimento logarítmico, enquanto demonstra que taxas maiores levam a arrependimento linear em certos cenários.

Tor LattimoreThu, 12 Ma📊 stat

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Este artigo propõe um método de programação quadrática sequencial estocástica com região de confiança e pontos interiores (TR-IP-SSQP) para resolver problemas de otimização com função objetivo estocástica e restrições não lineares determinísticas, estabelecendo sua convergência quase certa e validando seu desempenho prático em testes numéricos.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad LavaeiThu, 12 Ma🔢 math

Bayesian Hierarchical Models and the Maximum Entropy Principle

Este artigo demonstra que, quando a prior condicional em modelos hierárquicos bayesianos é uma distribuição canônica de máxima entropia, a prior marginal resultante também possui uma propriedade de máxima entropia, porém sujeita a uma restrição diferente sobre a distribuição marginal de uma função das quantidades desconhecidas, esclarecendo assim a informação assumida nesses modelos.

Brendon J. BrewerThu, 12 Ma📊 stat

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

O artigo propõe o MultiwayPAM, um novo método de agrupamento tensorial que analisa os escores do paradigma "LLM como Juiz" para mitigar custos computacionais e vieses, permitindo identificar simultaneamente a estrutura de clusters e os representantes centrais (medoides) de perguntas, respondentes e avaliadores.

Chihiro Watanabe, Jingyu SunThu, 12 Ma📊 stat

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Este artigo investiga o problema de identificação do melhor braço em bandits lineares não estacionários, estabelecendo um limite inferior dependente do conjunto de braços e propondo o algoritmo $\textsf{Adjacent-BAI}$ , que atinge a complexidade ótima ao explorar a estrutura geométrica do conjunto de braços.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam FazelThu, 12 Ma📊 stat

Designing Service Systems from Textual Evidence

Este artigo apresenta o algoritmo PP-LUCB, que otimiza a seleção de configurações de sistemas de serviço baseando-se em evidências textuais ao combinar avaliações de modelos de linguagem com auditorias humanas seletivas para corrigir vieses sistemáticos e reduzir significativamente os custos de verificação.

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-LeviThu, 12 Ma🤖 cs.LG

Adaptive Active Learning for Regression via Reinforcement Learning

O artigo propõe o Weighted improved Greedy Sampling (WiGS), um método de aprendizado ativo para regressão que utiliza aprendizado por reforço para adaptar dinamicamente o equilíbrio entre exploração e investigação, superando os métodos existentes em precisão e eficiência de rotulagem, especialmente em domínios com densidade de dados irregular.

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormickThu, 12 Ma📊 stat

GGMPs: Generalized Gaussian Mixture Processes

O artigo apresenta os Processos de Mistura Gaussiana Generalizada (GGMPs), um método baseado em Processos Gaussianos que permite a estimativa de densidades condicionais multimodais e heterocedásticas através de uma combinação de ajuste local de misturas, alinhamento de componentes e treinamento por GP, oferecendo uma solução escalável e com forma fechada para cenários complexos não gaussianos.

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. NoackThu, 12 Ma🤖 cs.LG

Brenier Isotonic Regression

Este artigo propõe a "regressão isotônica de Brenier", uma extensão da regressão isotônica para múltiplas saídas que utiliza o transporte ótimo de Kantorovich para garantir a monotonicidade cíclica, demonstrando desempenho superior em tarefas como calibração de probabilidades.

Han Bao, Amirreza Eshraghi, Yutong WangThu, 12 Ma📊 stat

Dual Space Preconditioning for Gradient Descent in the Overparameterized Regime

Este trabalho demonstra que o Gradiente Descente Pré-condicionado no Espaço Dual, ao treinar modelos lineares superparametrizados, converge para uma solução que interpola os dados e, no caso de pré-condicionadores isotrópicos, minimiza a distância de Frobenius em relação à inicialização, comportando-se de forma análoga ao Gradiente Descente padrão.

Reza Ghane, Danil Akhtiamov, Babak HassibiThu, 12 Ma📊 stat

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Este artigo compara a estimativa de incerteza via Monte Carlo Dropout e a Predição Conformal em redes neurais convolucionais treinadas no Fashion-MNIST, demonstrando que, embora o H-CNN VGG16 tenha maior precisão, o GoogLeNet oferece melhor calibração e a Predição Conformal garante conjuntos de previsão estatisticamente válidos, reforçando a necessidade de avaliar modelos além da simples acurácia para aplicações de alto risco.

Sanne Ruijs, Alina Kosiakova, Farrukh JavedThu, 12 Ma📊 stat

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

O artigo apresenta o ReTabSyn, um pipeline de síntese de dados tabulares baseado em aprendizado por reforço que prioriza a distribuição condicional para superar limitações em cenários com poucos dados e desequilíbrio de classes, resultando em melhor utilidade para modelos downstream e permitindo a aplicação de restrições específicas de especialistas.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang ChengThu, 12 Ma📊 stat

Kernel Tests of Equivalence

Este artigo propõe novos testes estatísticos baseados em kernels, utilizando a Discrepância de Stein e a Discrepância de Máxima Média, para avaliar a equivalência entre distribuições e superar as limitações dos testes de ajuste de qualidade tradicionais que não conseguem confirmar a ausência de diferenças significativas.

Xing Liu, Axel GandyThu, 12 Ma📊 stat

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Este artigo apresenta um framework de previsão seletiva para a recuperação de estruturas moleculares a partir de espectros de massa, demonstrando que medidas de incerteza de baixo custo computacional e a aplicação de limites de risco sem distribuição permitem que os modelos abstenham-se de previsões inseguras, garantindo assim uma taxa de erro controlada em aplicações de alto risco.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem WaegemanThu, 12 Ma📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Este artigo apresenta uma abordagem unificada de Otimização Bayesiana baseada em Processos Gaussianos, que acelera a busca por pontos estacionários em superfícies de energia potencial através de um ciclo de seis etapas adaptável, técnicas avançadas de amostragem e regularização, e uma implementação prática em Rust que demonstra a eficiência e a escalabilidade do método.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)Thu, 12 Ma📊 stat

Expert-Aided Causal Discovery of Ancestral Graphs

O artigo apresenta o Ancestral GFlowNet (AGFN), um algoritmo de aprendizado por reforço que realiza inferência distribucional sobre grafos ancestrais e integra conhecimento prévio e feedback incerto de especialistas para refinar a descoberta causal, superando métodos existentes em precisão estrutural.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena RibeiroMon, 09 Ma🤖 cs.LG

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Este trabalho oferece uma revisão abrangente e uma especificação formal detalhada das Redes de Codificação Preditiva (PCNs), situando-as no contexto dos métodos modernos de aprendizado de máquina e destacando seu potencial como uma estrutura versátil e biologicamente plausível para futuras inovações em IA.

Björn van Zwol, Ro Jefferson, Egon L. van den BroekMon, 09 Ma🤖 cs.AI

Theoretical Foundations of Conformal Prediction

Este livro apresenta uma compilação pedagógica e unificada das fundações teóricas e das provas dos principais resultados da previsão conformal e de técnicas de inferência livre de distribuição, visando preencher a lacuna entre artigos de pesquisa dispersos e facilitar o entendimento dos argumentos técnicos que garantem quantificação de incerteza em sistemas de aprendizado de máquina sem suposições sobre a distribuição dos dados.

Anastasios N. Angelopoulos, Rina Foygel Barber, Stephen BatesMon, 09 Ma🔢 math

L0-Regularized Quadratic Surface Support Vector Machines

Este artigo propõe variantes esparsas de Máquinas de Vetores de Suporte com Superfície Quadrática (QSVM) que utilizam uma restrição de cardinalidade ( $\ell_0$ ) para mitigar o sobreajuste e melhorar a interpretabilidade, desenvolvendo um algoritmo de decomposição de penalidade eficiente com garantias de convergência e demonstrando eficácia em benchmarks públicos e aplicações de crédito.

Ahmad Mousavi, Ramin Zandvakili, Zheming GaoMon, 09 Ma🤖 cs.LG

Entropic Mirror Descent for Linear Systems: Polyak's Stepsize and Implicit Bias

Este artigo apresenta uma variante do passo de Polyak para o método de descida do espelho entrópico na resolução de sistemas lineares, superando desafios de convergência devido à natureza ilimitada do domínio, aprimorando os limites de viés implícito e estabelecendo garantias de convergência para funções convexas suaves.

Yura Malitsky, Alexander PoschMon, 09 Ma🤖 cs.LG

← Anterior Próximo →