stat.ML artigos | Gist.Science

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

Este artigo propõe um método de fusão de imagens com poucos exemplos que introduz o conceito de "priors incompletos" e um algoritmo de computação de granularidade de pixel (GBPC) para permitir que redes neurais leves aprendam regras de fusão adaptativas sem a necessidade de imagens fundidas reais supervisionadas.

Minjie Deng, Yan Wei, An Wu, Yuncan Ouyang, Hao Zhai, Qianyao PengThu, 12 Ma⚡ eess

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Este artigo propõe dois novos algoritmos baseados em dados para estimar políticas ótimas de precificação e controle de estoque em ambientes offline com demanda censurada e dependente, superando desafios como a perda da propriedade de Markov e a não estacionariedade através de aproximações de MDPs de alta ordem e análise de sobrevivência.

Korel Gundem, Zhengling QiThu, 12 Ma📊 stat

Panda: A pretrained forecast model for chaotic dynamics

O artigo apresenta o Panda, um modelo pré-treinado de previsão para sistemas caóticos que, ao ser treinado exclusivamente em dados sintéticos de equações diferenciais ordinárias, demonstra capacidades emergentes de previsão zero-shot em sistemas não vistos, incluindo equações diferenciais parciais e séries temporais do mundo real, preservando tanto a precisão de curto prazo quanto medidas distribucionais.

Jeffrey Lai, Anthony Bao, William GilpinThu, 12 Ma🌀 nlin

Two-sample comparison through additive tree models for density ratios

Este artigo propõe modelos de árvores aditivas com uma nova função de perda chamada "balancing loss" para estimar a razão de densidades entre duas amostras, permitindo inferência bayesiana com quantificação de incerteza e demonstrando eficiência computacional e aplicabilidade em dados de microbioma.

Naoki Awaya, Yuliang Xu, Li MaThu, 12 Ma📊 stat

Tensor Train Completion from Fiberwise Observations Along a Single Mode

Este trabalho propõe um método rápido e determinístico para completar tensores com base na decomposição Tensor Train, utilizando apenas álgebra linear padrão para recuperar dados a partir de observações completas ou ausentes de fibras ao longo de um único modo, uma configuração comum em aplicações como séries temporais.

Shakir Showkat Sofi, Lieven De LathauwerThu, 12 Ma⚡ eess

Absolute indices for determining compactness, separability and number of clusters

Este artigo apresenta novos índices absolutos de validação de clusters que definem funções de compactação e margens de separabilidade para determinar o número verdadeiro de clusters, demonstrando sua eficácia em comparação com índices relativos tradicionais em diversos conjuntos de dados sintéticos e reais.

Adil M. Bagirov, Ramiz M. Aliguliyev, Nargiz Sultanova, Sona TaheriThu, 12 Ma📊 stat

Maximum Risk Minimization with Random Forests

Este trabalho introduz variantes de florestas aleatórias baseadas no princípio de Minimização do Risco Máximo (MaxRM) para melhorar a generalização fora da distribuição, oferecendo algoritmos computacionalmente eficientes, garantias de consistência estatística e novos limites teóricos para distribuições de teste não vistas.

Francesco Freni, Anya Fries, Linus Kühne, Markus Reichstein, Jonas PetersThu, 12 Ma📊 stat

The Bayesian Geometry of Transformer Attention

O artigo "The Bayesian Geometry of Transformer Attention" demonstra que, em ambientes controlados chamados "túneis de vento bayesianos", os transformadores realizam inferência bayesiana com alta precisão através de um mecanismo geométrico específico envolvendo o alinhamento progressivo de chaves e consultas e uma variedade de valores de baixa dimensão, estabelecendo uma separação arquitetônica clara em relação a MLPs e oferecendo uma base para conectar sistemas pequenos verificáveis a fenômenos de raciocínio em grandes modelos de linguagem.

Naman Agarwal, Siddhartha R. Dalal, Vishal MisraThu, 12 Ma📊 stat

Gradient Dynamics of Attention: How Cross-Entropy Sculpts Bayesian Manifolds

Este artigo estabelece que o treinamento por entropia cruzada em transformadores induz uma dinâmica de roteamento baseada em vantagens e atualizações de valores ponderadas por responsabilidade, que atuam como um procedimento EM de duas escalas temporais para esculpir geometrias bayesianas de baixa dimensão que sustentam o raciocínio probabilístico em contexto.

Naman Agarwal, Siddhartha R. Dalal, Vishal MisraThu, 12 Ma📊 stat

Sampling via Stochastic Interpolants by Langevin-based Velocity and Initialization Estimation in Flow ODEs

Este artigo propõe um método inovador para amostragem de distribuições de Boltzmann não normalizadas, utilizando uma sequência de amostradores de Langevin para simular eficientemente um fluxo de equação diferencial ordinária (ODE) derivado de interpolantes estocásticos lineares, oferecendo garantias teóricas de convergência e demonstrando eficácia em distribuições multimodais e tarefas de inferência bayesiana.

Chenguang Duan, Yuling Jiao, Gabriele Steidl, Christian Wald, Jerry Zhijian Yang, Ruizhe ZhangThu, 12 Ma📊 stat

Transfer learning for functional linear regression via control variates

Este artigo propõe e analisa teoricamente estimadores de regressão linear funcional baseados em variáveis de controle para aprendizado por transferência, demonstrando sua equivalência fundamental com o método de offset, sua eficácia em cenários de privacidade de dados e sua capacidade de lidar com erros de suavização decorrentes da observação discreta de preditores funcionais.

Yuping Yang, Zhiyang ZhouThu, 12 Ma📊 stat

Error Analysis of Bayesian Inverse Problems with Generative Priors

Este artigo apresenta uma análise teórica que estabelece limites quantitativos de erro para problemas inversos bayesianos utilizando priores generativos treinados, demonstrando que o erro no posterior herda a taxa de convergência do prior na distância de Wasserstein, com validação através de experimentos numéricos e um problema inverso de EDP elíptica.

Bamdad Hosseini, Ziqi HuangThu, 12 Ma📊 stat

Time series forecasting with Hahn Kolmogorov-Arnold networks

O artigo apresenta o HaKAN, um modelo inovador para previsão de séries temporais multivariadas que utiliza redes Kolmogorov-Arnold com funções de ativação baseadas em polinômios de Hahn para oferecer uma alternativa leve, interpretável e de alto desempenho, superando métodos recentes como Transformers e MLPs.

Md Zahidul Hasan, A. Ben Hamza, Nizar BouguilaThu, 12 Ma📊 stat

Singular Bayesian Neural Networks

O artigo propõe redes neurais bayesianas singularizadas que, ao parametrizar os pesos como produtos de matrizes de baixo posto, reduzem drasticamente o número de parâmetros e melhoram a calibração e a detecção de dados fora da distribuição, mantendo um desempenho competitivo com ensembles profundos.

Mame Diarra Toure, David A. StephensThu, 12 Ma📊 stat

Emergence of Distortions in High-Dimensional Guided Diffusion Models

Este artigo formaliza a perda de diversidade em modelos de difusão guiados por classificação (CFG) como uma distorção generativa, demonstrando através de análise de física estatística que esse fenômeno surge em um regime de alta dimensão e propondo um novo cronograma de orientação com janela de orientação negativa para mitigar a redução de variância sem comprometer a separabilidade das classes.

Enrico Ventura, Beatrice Achilli, Luca Ambrogioni, Carlo LucibelloThu, 12 Ma📊 stat

Universality of General Spiked Tensor Models

Este artigo estabelece um princípio de universalidade para modelos de tensores espigados assimétricos, demonstrando que, sob condições de momento finito, o comportamento espectral e os limites estatísticos do estimador de máxima verossimilhança selecionado são robustos e idênticos aos do caso gaussiano, mesmo na presença de ruído não gaussiano.

Yanjin Xiang, Zhihua ZhangThu, 12 Ma📊 stat

Online LLM watermark detection via e-processes

Este artigo apresenta um quadro unificado para a detecção de marcas d'água em modelos de linguagem grandes (LLMs) online, baseado em processos-e, que oferece garantias válidas a qualquer momento e melhora o poder de detecção através de métodos adaptativos empiricamente validados.

Weijie Su, Ruodu Wang, Zinan ZhaoThu, 12 Ma📊 stat

Rethinking Adam for Time Series Forecasting: A Simple Heuristic to Improve Optimization under Distribution Shifts

Este artigo apresenta o TS_Adam, uma variante leve do otimizador Adam que remove a correção de viés de segunda ordem para melhorar a adaptabilidade e o desempenho em tarefas de previsão de séries temporais não estacionárias, sem exigir hiperparâmetros adicionais.

Yuze Dong, Jinsong WuThu, 12 Ma🤖 cs.LG

Stability and Robustness via Regularization: Bandit Inference via Regularized Stochastic Mirror Descent

Este artigo estabelece uma teoria unificada de estabilidade para inferência estatística em dados de bandit baseada no Descenso Espelhado Estocástico, demonstrando que algoritmos regularizados como o Regularized-EXP3 garantem simultaneamente intervalos de confiança válidos, ótimo arrependimento e robustez a corrupções.

Budhaditya Halder, Ishan Sengupta, Koustav Chowdhury, Koulik KhamaruThu, 12 Ma📊 stat

SDSR: A Spectral Divide-and-Conquer Approach for Species Tree Reconstruction

O artigo apresenta o SDSR, um método escalável de dividir-e-conquistar baseado em teoria espectral de grafos para reconstrução de árvores filogenéticas, que oferece ganhos significativos de velocidade sem comprometer a precisão ao lidar com grandes conjuntos de dados e discordância genética.

Ortal Reshef (Hebrew University of Jerusalem), Ofer Glassman (Weizmann Institute of Science), Or Zuk (Hebrew University of Jerusalem), Yariv Aizenbud (Tel Aviv University), Boaz Nadler (Weizmann Institute of Science), Ariel Jaffe (Hebrew University of Jerusalem)Thu, 12 Ma🧬 q-bio

← Anterior Próximo →