stat.ML artigos | Gist.Science

On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

Este artigo estabelece uma análise de estabilidade algorítmica média para o SGD pré-condicionado multipass, demonstrando que a escolha inadequada do pré-condicionador pode levar a uma dependência subótima na dimensão efetiva, prejudicando tanto a otimização quanto a generalização.

Simon Vary, Tyler Farghly, Ilja Kuzborskij, Patrick RebeschiniFri, 13 Ma📊 stat

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

O artigo apresenta o BTZSC, um novo benchmark abrangente para classificação de texto zero-shot que, ao avaliar 38 modelos em 22 conjuntos de dados, revela que os rerankers modernos estabelecem um novo estado da arte, superando os modelos baseados em NLI e oferecendo um desempenho competitivo em comparação com embeddings e LLMs instruídos.

Ilias AarabFri, 13 Ma💬 cs.CL

Chemical Reaction Networks Learn Better than Spiking Neural Networks

Este artigo demonstra matematicamente e experimentalmente que redes de reações químicas sem camadas ocultas podem aprender tarefas de classificação com maior eficiência e precisão do que redes de neurônios pulsantes que exigem camadas ocultas, oferecendo uma explicação teórica para o potencial aprendizado mais eficiente em redes bioquímicas celulares.

Sophie Jaffard, Ivo F. SbalzariniFri, 13 Ma📊 stat

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

Este artigo propõe uma nova abordagem para o desenho ótimo de experimentos bayesianos em lote, baseada em fluxos de gradiente de Wasserstein e uma formulação probabilística que permite explorar paisagens de otimização complexas e obter lotes de alta utilidade através de algoritmos de partículas escaláveis.

Louis SharrockFri, 13 Ma📊 stat

A Quantitative Characterization of Forgetting in Post-Training

Este artigo estabelece uma caracterização quantitativa do esquecimento no pós-treinamento contínuo de modelos generativos, demonstrando teoricamente como a direção da divergência de KL (forward vs. reverse), a sobreposição geométrica das distribuições e o uso de replay determinam se ocorre colapso de massa ou deriva de componentes, fornecendo condições explícitas para mitigar esses efeitos em métodos recentes.

Krishnakumar Balasubramanian, Shiva Prasad KasiviswanathanFri, 13 Ma📊 stat

Riemannian Laplace Approximation with the Fisher Metric

Este artigo corrige as limitações de viés e estreitamento excessivo da aproximação de Laplace Riemanniana baseada na métrica de Fisher, propondo duas variantes alternativas que garantem exatidão no limite de dados infinitos e demonstram melhorias práticas em diversos experimentos.

Hanlin Yu, Marcelo Hartmann, Bernardo Williams + 2 more2026-03-12🤖 cs.LG

Logarithmic Regret for Online KL-Regularized Reinforcement Learning

Este artigo propõe um algoritmo de bandito contextual online baseado em otimismo para RL regularizado por KL, demonstrando que a paisagem de otimização benigna induzida pela regularização permite alcançar limites de arrependimento logarítmico tanto em contextos de bandito quanto em aprendizado por reforço completo, superando as limitações de trabalhos teóricos anteriores.

Heyang Zhao, Chenlu Ye, Wei Xiong + 2 more2026-03-12📊 stat

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

Este artigo demonstra que choques geopolíticos e geoeconômicos afetam o risco soberano por canais distintos, formando um padrão de "tesoura" onde os efeitos diretos e os do ciclo financeiro global se movem em direções opostas, implicando que a liquidez pode mitigar apenas a componente mediada pelo ciclo financeiro e não o prêmio de risco geopolítico persistente.

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

Este artigo apresenta uma abordagem baseada em bandit contextual, utilizando amostragem de Thompson, para otimizar a sequência personalizada de exercícios em sistemas de recomendação educacional, demonstrando que tal método maximiza o ganho de habilidades dos alunos em plataformas de tutoria online em larga escala.

Lukas De Kerpel, Arthur Thuy, Dries F. Benoit2026-03-12📊 stat

SSRCA: a novel machine learning pipeline to perform sensitivity analysis for agent-based models

Este artigo apresenta o SSRCA, uma nova metodologia baseada em aprendizado de máquina que facilita a análise de sensibilidade em modelos baseados em agentes (ABMs) biológicos, permitindo identificar parâmetros sensíveis e padrões de saída comuns, como demonstrado no crescimento de esferoides tumorais.

Edward H. Rohr, John T. Nardini2026-03-11🧬 q-bio

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

Os autores propõem uma extensão do modelo semi-paramétrico BART que permite covariáveis compartilhadas entre os componentes linear e não paramétrico, resolvendo problemas de não identificabilidade e viés para capturar interações complexas, com validação em simulações e dados de avaliação educacional internacional.

Estevão B. Prado, Andrew C. Parnell, Keefe Murphy + 3 more2026-03-10🤖 cs.LG

Convergence and complexity of block majorization-minimization for constrained block-Riemannian optimization

Este artigo estabelece a convergência assintótica e a complexidade de $\widetilde{O}(\epsilon^{-2})$ para uma família de algoritmos de majorização-minimização em blocos (BMM) aplicados a otimização não convexa com restrições em variedades Riemannianas, demonstrando sua eficácia superior em comparação com métodos euclidianos padrão.

Yuchen Li, Laura Balzano, Deanna Needell + 1 more2026-03-10📊 stat

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Este artigo propõe dois algoritmos de primeira ordem sem derivadas (zeroth-order), o ZO-PDAPG e o ZO-RMPDPG, que garantem complexidade iterativa para encontrar pontos estacionários em problemas minimax não convexos com restrições lineares acopladas, estabelecendo novos padrões de desempenho, especialmente no cenário estocástico sem restrições acopladas.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

Towards a Fairer Non-negative Matrix Factorization

Este artigo propõe uma abordagem de fatoração de matriz não negativa (NMF) com uma formulação min-max para mitigar viés em tarefas de aprendizado de máquina, apresentando algoritmos de otimização e evidenciando, por meio de experimentos, que o aumento da equidade pode ocorrer às custas de um maior erro para alguns indivíduos, ressaltando a necessidade de adaptar a escolha do método ao contexto específico da aplicação.

Lara Kassab, Erin George, Deanna Needell + 3 more2026-03-06💻 cs

An Experimental Study on Fairness-aware Machine Learning for Credit Scoring Problems

Este artigo apresenta um estudo experimental abrangente que demonstra que modelos de aprendizado de máquina conscientes de justiça alcançam um melhor equilíbrio entre precisão preditiva e equidade em comparação com modelos de classificação tradicionais no contexto de pontuação de crédito.

Huyen Giang Thi Thu, Thang Viet Doan, Ha-Bang Ban + 1 more2026-03-06💻 cs

Curse of Dimensionality in Neural Network Optimization

Este artigo demonstra que a otimização de redes neurais rasas sofre da maldição da dimensionalidade, onde a taxa de decaimento do risco populacional durante o treinamento por fluxo de gradiente é limitada pela suavidade da função alvo e pela dimensão do espaço, resultando em convergência lenta que piora conforme a dimensionalidade aumenta.

Sanghoon Na, Haizhao Yang2026-03-06🔢 math

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Este trabalho estende o método de fluxo de entropia para derivar limites de generalização para uma ampla classe de algoritmos de aprendizado governados por processos de Markov, estabelecendo uma conexão unificada entre o erro de generalização e as propriedades ergódicas desses processos por meio de novas fórmulas exatas e aproximações de tempo contínuo.

Benjamin Dupuis, Maxime Haddouche, George Deligiannidis + 1 more2026-03-06💻 cs

Double Momentum and Error Feedback for Clipping with Fast Rates and Differential Privacy

O artigo propõe e analisa o algoritmo Clip21-SGD2M, que combina clipping, momentum de heavy-ball e feedback de erro para alcançar simultaneamente garantias ótimas de convergência e privacidade diferencial em cenários de aprendizado federado com dados heterogêneos.

Rustem Islamov, Samuel Horvath, Aurelien Lucchi + 2 more2026-03-06🔢 math

Variational Formulation of Particle Flow

Este artigo apresenta uma formulação variacional do fluxo de partículas log-homotópico, demonstrando que ele segue um gradiente de Fisher-Rao no espaço de densidades e derivando versões aproximadas por distribuições Gaussianas e misturas Gaussianas que, sob certas condições, se reduzem ao fluxo de partículas exato de Daum e Huang.

Yinzhuang Yi, Jorge Cortés, Nikolay Atanasov2026-03-06💻 cs

Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference

Este artigo apresenta o CausalPitfalls, um benchmark abrangente que avalia a capacidade de modelos de linguagem de grande escala (LLMs) de superar armadilhas estatísticas comuns na inferência causal, revelando limitações significativas em sua confiabilidade para aplicações do mundo real.

Jin Du, Li Chen, Xun Xian + 6 more2026-03-06💻 cs

← Anterior Próximo →