stat.ML artigos | Gist.Science

SPPCSO: Adaptive Penalized Estimation Method for High-Dimensional Correlated Data

O artigo propõe o método SPPCSO, uma técnica de estimação penalizada adaptativa que integra regressão por componentes principais e regularização $L_1$ para superar a instabilidade em dados de alta dimensão e correlacionados, garantindo seleção de variáveis consistente e estimativas robustas mesmo em ambientes de alto ruído.

Ying Hu, Hu YangMon, 09 Ma🤖 cs.LG

Synthetic Monitoring Environments for Reinforcement Learning

Este artigo apresenta as Synthetic Monitoring Environments (SMEs), uma suite infinita de tarefas de controle contínuo com políticas ótimas conhecidas e métricas de desempenho exatas, projetada para permitir diagnósticos precisos e análises científicas rigorosas do comportamento de agentes de Aprendizado por Reforço, superando as limitações de benchmarks atuais.

Leonard Pleiss, Carolin Schmidt, Maximilian SchifferMon, 09 Ma🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

Este artigo propõe o modelo BAEN-SVM, que utiliza uma nova função de perda elástica assimétrica limitada para criar uma máquina de vetores de suporte robusta a ruídos, geometricamente bem definida e com garantia de consistência, resolvendo o problema de otimização não convexo por meio de um algoritmo eficiente e demonstrando superioridade em experimentos com dados ruidosos.

Haiyan Du, Hu YangMon, 09 Ma🤖 cs.LG

Certified and accurate computation of function space norms of deep neural networks

Este artigo apresenta uma estrutura para o cálculo certificado e preciso de normas em espaços de funções (como Lebesgue e Sobolev) de redes neurais profundas, combinando aritmética intervalar, refinamento adaptativo e quadratura para fornecer limites determinísticos e garantidos de erros em normas de funções, superando as limitações das avaliações pontuais tradicionais.

Johannes Gründler, Moritz Maibaum, Philipp PetersenMon, 09 Ma🤖 cs.LG

Bayesian Additive Distribution Regression

O artigo apresenta o DistBART, uma abordagem bayesiana não paramétrica para regressão de distribuições que utiliza ensembles de árvores de decisão para modelar funcionais lineares e não lineares, oferecendo tanto garantias teóricas de concentração quanto escalabilidade computacional através de aproximações por características aleatórias.

Antonio R. Linero, Soumyabrata Bose, Jared MurrayMon, 09 Ma📊 stat

Semantics-Aware Caching for Concept Learning

Este artigo apresenta uma abordagem de cache semântico que reduz o tempo de execução de aprendizado de conceitos em uma ordem de grandeza ao otimizar a recuperação de instâncias para tanto reasoners simbólicos quanto neuro-simbólicos.

Louis Mozart Kamdem Teyou, Caglar Demir, Axel-Cyrille Ngonga NgomoMon, 09 Ma🤖 cs.LG

Bounds on Representation-Induced Confounding Bias for Treatment Effect Estimation

Este artigo propõe um novo quadro de refutação agnóstico à representação que estabelece limites teóricos e utiliza uma rede neural para estimar os vieses de confusão induzidos pela redução de dimensionalidade em métodos de estimação do efeito causal médio condicional (CATE).

Valentyn Melnychuk, Dennis Frauen, Stefan FeuerriegelFri, 13 Ma📊 stat

Onflow: a model free, online portfolio allocation algorithm robust to transaction fees

O artigo apresenta o Onflow, um algoritmo de alocação de portfólio baseado em aprendizado por reforço e fluxos de gradiente que otimiza retornos logarítmicos considerando custos de transação, demonstrando ser robusto a riscos de modelo e superior a métodos existentes em cenários de altas taxas.

Gabriel Turinici, Pierre BrugiereFri, 13 Ma💰 q-fin

Geometry of Singular Foliations and Learning Manifolds in ReLU Networks via the Data Information Matrix

Este artigo propõe o uso da Matriz de Informação de Dados (DIM) em redes neurais ReLU treinadas para revelar uma estrutura geométrica de foliação singular no espaço de dados, demonstrando que essa estrutura permite identificar correlações nos dados e medir distâncias entre conjuntos para transferência de conhecimento.

Eliot Tron, Rita FioresiFri, 13 Ma📊 stat

Are Bayesian networks typically faithful?

Este artigo demonstra que as redes bayesianas que satisfazem o princípio da fidelidade constituem um conjunto aberto e denso (ou seja, são "típicas") em diversas classes paramétricas e não paramétricas, incluindo modelos com variáveis latentes, o que garante a consistência de algoritmos de descoberta causal baseados em restrições.

Philip Boeken, Patrick Forré, Joris M. MooijFri, 13 Ma📊 stat

Quantifying Aleatoric Uncertainty of the Treatment Effect: A Novel Orthogonal Learner

Este artigo propõe o AU-learner, um novo estimador ortogonal que utiliza identificação parcial para obter limites precisos sobre a distribuição condicional do efeito do tratamento (CDTE), permitindo assim quantificar a incerteza aleatória dos efeitos terapêuticos em dados observacionais.

Valentyn Melnychuk, Stefan Feuerriegel, Mihaela van der SchaarFri, 13 Ma📊 stat

Finance-Informed Neural Network: Learning the Geometry of Option Pricing

O artigo propõe a Rede Neural Informada por Finanças (FINN), um modelo que aprende a precificação e cobertura de opções através de um objetivo de replicação auto-supervisionado baseado em princípios econômicos, garantindo consistência teórica, superando limitações de modelos paramétricos tradicionais e permitindo a construção de preços coerentes mesmo para ativos sem mercado de opções listado.

Amine M. Aboussalah, Xuanze Li, Cheng Chi, Raj PatelFri, 13 Ma💰 q-fin

Adaptive Prior Selection in Gaussian Process Bandits with Thompson Sampling

Este trabalho propõe dois algoritmos, PE-GP-TS e HP-GP-TS, baseados em amostragem de Thompson para Gaussian Processes, que realizam a seleção conjunta de priores e a minimização de arrependimento em problemas de otimização de caixa preta, oferecendo garantias teóricas e validação experimental superior em comparação com métodos existentes.

Jack Sandberg, Morteza Haghir ChehreghaniFri, 13 Ma📊 stat

Weighted Random Dot Product Graphs

Este artigo propõe um modelo não paramétrico de Grafos de Produto Escalar Aleatório Ponderado (WRDPG) que estende a modelagem tradicional para redes com pesos heterogêneos, permitindo discriminar distribuições de pesos com médias idênticas mas momentos superiores distintos, além de estabelecer garantias estatísticas para a estimação de posições latentes e fornecer um framework para geração de grafos ponderados.

Bernardo Marenco, Paola Bermolen, Marcelo Fiori, Federico Larroca, Gonzalo MateosFri, 13 Ma📊 stat

Distribution estimation via Flow Matching with Lipschitz guarantees

Este artigo estabelece garantias teóricas para a estimativa de distribuição via Flow Matching, derivando uma taxa de convergência na distância de Wasserstein 1 que supera resultados anteriores em cenários de alta dimensão, sem exigir log-concavidade e controlando a dependência da constante de Lipschitz.

Lea KunkelFri, 13 Ma📊 stat

Busemann Functions in the Wasserstein Space: Existence, Closed-Forms, and Applications to Slicing

Este trabalho investiga a existência e o cálculo de funções de Busemann no espaço de Wasserstein, estabelecendo expressões de forma fechada para distribuições unidimensionais e medidas gaussianas, o que permite definir novos esquemas de projeção e distâncias Sliced-Wasserstein aplicáveis a misturas gaussianas e conjuntos de dados rotulados.

Clément Bonet, Elsa Cazelles, Lucas Drumetz, Nicolas CourtyFri, 13 Ma📊 stat

Refereed Learning

Este artigo introduz o conceito de "aprendizado supervisionado" (refereed learning), onde um aprendiz avalia modelos opacos utilizando dois provadores concorrentes (apenas um honesto), demonstrando que é possível identificar o modelo superior com precisão extrema e custo de consulta drasticamente reduzido em comparação com métodos tradicionais.

Ran Canetti, Ephraim Linder, Connor WagamanFri, 13 Ma📊 stat

Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering

Este artigo propõe uma unificação bayesiana do aprendizado em contexto e do direcionamento de ativação em modelos de linguagem, demonstrando que ambos atuam alterando crenças sobre conceitos latentes — o primeiro acumulando evidências e o segundo modificando priores — permitindo prever e explicar fenômenos comportamentais complexos como curvas de aprendizado sigmóides e transições bruscas de comportamento.

Eric Bigelow, Daniel Wurgaft, YingQiao Wang, Noah Goodman, Tomer Ullman, Hidenori Tanaka, Ekdeep Singh LubanaFri, 13 Ma📊 stat

Approximate Bayesian inference for cumulative probit regression models

Este artigo propõe três algoritmos escaláveis baseados em Inferência Variacional e Propagação de Expectativa para aproximar a distribuição posterior em modelos de regressão probit cumulativa, superando as limitações computacionais dos métodos tradicionais de Monte Carlo via Cadeias de Markov em grandes conjuntos de dados e demonstrando sua eficácia em um estudo de caso sobre redes criminosas.

Emanuele AlivertiFri, 13 Ma📊 stat

Entropic Confinement and Mode Connectivity in Overparameterized Neural Networks

Este artigo resolve o paradoxo entre a conectividade de baixa perda e o confinamento da otimização em redes neurais sobreparametrizadas, demonstrando que barreiras entrópicas induzidas por variações de curvatura geram forças efetivas que mantêm a dinâmica de aprendizado localizada nos mínimos, mesmo em regiões onde a função de perda é plana.

Luca Di Carlo, Chase Goddard, David J. SchwabFri, 13 Ma📊 stat

← Anterior Próximo →