A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Este artigo propõe um método de programação quadrática sequencial estocástica com região de confiança e pontos interiores (TR-IP-SSQP) para resolver problemas de otimização com função objetivo estocástica e restrições não lineares determinísticas, estabelecendo sua convergência quase certa e validando seu desempenho prático em testes numéricos.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad LavaeiThu, 12 Ma🔢 math

Bayesian Hierarchical Models and the Maximum Entropy Principle

Este artigo demonstra que, quando a prior condicional em modelos hierárquicos bayesianos é uma distribuição canônica de máxima entropia, a prior marginal resultante também possui uma propriedade de máxima entropia, porém sujeita a uma restrição diferente sobre a distribuição marginal de uma função das quantidades desconhecidas, esclarecendo assim a informação assumida nesses modelos.

Brendon J. BrewerThu, 12 Ma📊 stat

Adaptive Active Learning for Regression via Reinforcement Learning

O artigo propõe o Weighted improved Greedy Sampling (WiGS), um método de aprendizado ativo para regressão que utiliza aprendizado por reforço para adaptar dinamicamente o equilíbrio entre exploração e investigação, superando os métodos existentes em precisão e eficiência de rotulagem, especialmente em domínios com densidade de dados irregular.

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormickThu, 12 Ma📊 stat

GGMPs: Generalized Gaussian Mixture Processes

O artigo apresenta os Processos de Mistura Gaussiana Generalizada (GGMPs), um método baseado em Processos Gaussianos que permite a estimativa de densidades condicionais multimodais e heterocedásticas através de uma combinação de ajuste local de misturas, alinhamento de componentes e treinamento por GP, oferecendo uma solução escalável e com forma fechada para cenários complexos não gaussianos.

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. NoackThu, 12 Ma🤖 cs.LG

Dual Space Preconditioning for Gradient Descent in the Overparameterized Regime

Este trabalho demonstra que o Gradiente Descente Pré-condicionado no Espaço Dual, ao treinar modelos lineares superparametrizados, converge para uma solução que interpola os dados e, no caso de pré-condicionadores isotrópicos, minimiza a distância de Frobenius em relação à inicialização, comportando-se de forma análoga ao Gradiente Descente padrão.

Reza Ghane, Danil Akhtiamov, Babak HassibiThu, 12 Ma📊 stat

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Este artigo compara a estimativa de incerteza via Monte Carlo Dropout e a Predição Conformal em redes neurais convolucionais treinadas no Fashion-MNIST, demonstrando que, embora o H-CNN VGG16 tenha maior precisão, o GoogLeNet oferece melhor calibração e a Predição Conformal garante conjuntos de previsão estatisticamente válidos, reforçando a necessidade de avaliar modelos além da simples acurácia para aplicações de alto risco.

Sanne Ruijs, Alina Kosiakova, Farrukh JavedThu, 12 Ma📊 stat

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

O artigo apresenta o ReTabSyn, um pipeline de síntese de dados tabulares baseado em aprendizado por reforço que prioriza a distribuição condicional para superar limitações em cenários com poucos dados e desequilíbrio de classes, resultando em melhor utilidade para modelos downstream e permitindo a aplicação de restrições específicas de especialistas.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang ChengThu, 12 Ma📊 stat

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Este artigo apresenta um framework de previsão seletiva para a recuperação de estruturas moleculares a partir de espectros de massa, demonstrando que medidas de incerteza de baixo custo computacional e a aplicação de limites de risco sem distribuição permitem que os modelos abstenham-se de previsões inseguras, garantindo assim uma taxa de erro controlada em aplicações de alto risco.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem WaegemanThu, 12 Ma📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Este artigo apresenta uma abordagem unificada de Otimização Bayesiana baseada em Processos Gaussianos, que acelera a busca por pontos estacionários em superfícies de energia potencial através de um ciclo de seis etapas adaptável, técnicas avançadas de amostragem e regularização, e uma implementação prática em Rust que demonstra a eficiência e a escalabilidade do método.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)Thu, 12 Ma📊 stat

Expert-Aided Causal Discovery of Ancestral Graphs

O artigo apresenta o Ancestral GFlowNet (AGFN), um algoritmo de aprendizado por reforço que realiza inferência distribucional sobre grafos ancestrais e integra conhecimento prévio e feedback incerto de especialistas para refinar a descoberta causal, superando métodos existentes em precisão estrutural.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena RibeiroMon, 09 Ma🤖 cs.LG

Theoretical Foundations of Conformal Prediction

Este livro apresenta uma compilação pedagógica e unificada das fundações teóricas e das provas dos principais resultados da previsão conformal e de técnicas de inferência livre de distribuição, visando preencher a lacuna entre artigos de pesquisa dispersos e facilitar o entendimento dos argumentos técnicos que garantem quantificação de incerteza em sistemas de aprendizado de máquina sem suposições sobre a distribuição dos dados.

Anastasios N. Angelopoulos, Rina Foygel Barber, Stephen BatesMon, 09 Ma🔢 math

L0-Regularized Quadratic Surface Support Vector Machines

Este artigo propõe variantes esparsas de Máquinas de Vetores de Suporte com Superfície Quadrática (QSVM) que utilizam uma restrição de cardinalidade (0\ell_0) para mitigar o sobreajuste e melhorar a interpretabilidade, desenvolvendo um algoritmo de decomposição de penalidade eficiente com garantias de convergência e demonstrando eficácia em benchmarks públicos e aplicações de crédito.

Ahmad Mousavi, Ramin Zandvakili, Zheming GaoMon, 09 Ma🤖 cs.LG