cs.LG artigos | Gist.Science

Empirical Asset Pricing via Ensemble Gaussian Process Regression

Este artigo apresenta um método de aprendizado de ensemble baseado em Regressão por Processos Gaussianos que, ao reduzir a complexidade computacional e incorporar a incerteza preditiva na alocação de ativos, supera modelos existentes e o índice S&P 500 em termos de retorno econômico e estatístico em uma análise empírica de ações dos EUA entre 1962 e 2016.

Damir Filipovic, Puneet Pasricha2026-03-10🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

Este artigo estabelece garantias de amostragem finita para um método de aprendizado de representação de estado orientado a custos que, ao prever custos multietapa sem modelar observações ou ações, permite encontrar controladores e representações latentes quase ótimos para problemas de controle Linear Quadrático Gaussiano (LQG) de horizonte finito.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

On the Impact of Sampling on Deep Sequential State Estimation

Este artigo propõe o IW-DKF, uma extensão do Filtro de Kalman Profundo que aplica amostragem por importância para obter objetivos de Monte Carlo mais rigorosos, resultando em melhorias significativas na estimativa de verossimilhança, na inferência de estados latentes e na aprendizagem de parâmetros em modelos não lineares complexos.

Helena Calatrava, Ricardo Augusto Borsoi, Tales Imbiriba + 1 more2026-03-10🤖 cs.LG

Remaining-data-free Machine Unlearning by Suppressing Sample Contribution

O artigo apresenta o MU-Mis, um método inovador de desaprendizagem de máquina que elimina a influência de dados específicos suprimindo sua contribuição no modelo pré-treinado sem degradar o desempenho nos dados restantes, tornando desnecessário o acesso a esses dados para um desempenho comparável às melhores abordagens existentes.

Xinwen Cheng, Zhehao Huang, Wenxin Zhou, Zhengbao He, Ruikai Yang, Yingwen Wu, Xiaolin Huang2026-03-10🤖 cs.LG

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Este artigo apresenta uma revisão abrangente da Avaliação Adaptativa Computadorizada (CAT) sob uma perspectiva de aprendizado de máquina, explorando como técnicas modernas podem otimizar modelos de medição, seleção de questões e controle de testes para criar sistemas mais robustos, justos e eficientes.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong Chen2026-03-10🤖 cs.LG

Simulating Non-Markovian Open Quantum Dynamics with Neural Quantum States

Este artigo apresenta o framework NQS-DQME, que utiliza estados quânticos neurais e dissipatons para simular com precisão e escalabilidade a dinâmica quântica dissipativa não-Markoviana, superando as limitações computacionais de métodos anteriores.

Long Cao, Liwei Ge, Daochi Zhang, Xiang Li, Yao Wang, Rui-Xue Xu, YiJing Yan, Xiao Zheng2026-03-10⚛️ quant-ph

LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks

O artigo apresenta o LoRA-Ensemble, um método eficiente e parametrizado para modelagem de incerteza em redes de autoatenção que utiliza adaptações de baixo rank para criar um ensemble implícito, superando técnicas existentes e igualando ou superando a precisão de ensembles explícitos com melhor calibração.

Dominik J. Mühlematter, Michelle Halbheer, Alexander Becker, Dominik Narnhofer, Helge Aasen, Konrad Schindler, Mehmet Ozgur Turkoglu2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

O artigo apresenta o FEX, um novo framework que utiliza otimização por gradiente de política para gerar explicações baseadas em atribuição de forma rápida e escalável, reduzindo drasticamente o tempo de inferência e o uso de memória em comparação com abordagens tradicionais, sem comprometer a qualidade ou a aplicabilidade geral.

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Este artigo investiga a fase de corrupção observada no ajuste fino de poucos exemplos de Modelos de Difusão, identifica sua causa na distribuição de aprendizado restrita e propõe o uso de Redes Neurais Bayesianas para mitigar esse problema, melhorando a fidelidade, qualidade e diversidade das imagens geradas sem custos adicionais de inferência.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

DKDL-Net: A Lightweight Bearing Fault Detection Model via Decoupled Knowledge Distillation and Low-Rank Adaptation Fine-tuning

Este artigo propõe o DKDL-Net, um modelo leve de detecção de falhas em rolamentos que combina destilação de conhecimento desacoplada e ajuste fino de baixo rank para alcançar uma precisão de 99,48% com apenas 6.838 parâmetros, superando os modelos existentes em eficiência computacional e desempenho.

Ovanes Petrosian, Li Pengyi, He Yulong + 4 more2026-03-10🤖 cs.LG

Estimating Treatment Effects under Algorithmic Interference: A Structured Neural Networks Approach

Este artigo propõe uma abordagem semiparamétrica estruturada baseada em redes neurais para corrigir o viés causado pela interferência algorítmica em experimentos de plataformas de conteúdo, permitindo a estimativa precisa do efeito global do tratamento ao modelar explicitamente a competição por exposição entre criadores.

Ruohan Zhan, Shichao Han, Yuchen Hu, Zhenling Jiang2026-03-10🤖 cs.LG

LAMBDA: A Large Model Based Data Agent

O artigo apresenta o LAMBDA, um sistema de análise de dados baseado em agentes de linguagem natural de código aberto e sem necessidade de programação, que combina agentes programadores e inspetores com intervenção humana direta e integração de conhecimento externo para tornar a análise de dados mais acessível e eficiente.

Maojun Sun, Ruijian Han, Binyan Jiang + 4 more2026-03-10🤖 cs.AI

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

O artigo apresenta o OTAD, um modelo de defesa adversarial robusto que combina treinamento de redes neurais com regularização baseada em transporte ótimo e interpolação via problema de integração convexa para garantir continuidade de Lipschitz local, superando modelos existentes em diversos conjuntos de dados.

Kuo Gai, Sicong Wang, Shihua Zhang2026-03-10🤖 cs.LG

Mini-batch Estimation for Deep Cox Models: Statistical Foundations and Practical Guidance

Este artigo estabelece as fundações estatísticas do estimador de máxima verossimilhança parcial em mini-lotes (mb-MPLE) para redes neurais de Cox, demonstrando sua consistência e eficiência assintótica, enquanto oferece orientações práticas para o ajuste de hiperparâmetros e a convergência do gradiente descendente estocástico em aplicações de larga escala.

Lang Zeng, Weijing Tang, Zhao Ren, Ying Ding2026-03-10🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Este artigo propõe um método de Amostragem de Importância Annealed (AIS) combinado com reparametrização eficiente para otimizar o aprendizado variacional de Modelos de Variáveis Latentes de Processo Gaussiano (GPLVMs), superando as limitações de abordagens anteriores em espaços de alta dimensão e alcançando melhores limites variacionais e convergência em diversos conjuntos de dados.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

The Z-Gromov-Wasserstein Distance

Este artigo estabelece uma teoria unificada para a comparação de redes generalizadas (Z-redes) através da definição da distância Z-Gromov-Wasserstein, demonstrando que ela constitui uma métrica com propriedades desejáveis e fornecendo limites inferiores computáveis para aplicações práticas.

Martin Bauer, Facundo Mémoli, Tom Needham + 1 more2026-03-10🤖 cs.LG

From Model Explanation to Data Misinterpretation: A Cautionary Analysis of Post Hoc Explainers in Business Research

Este estudo alerta que o uso de explicadores *post hoc* como SHAP e LIME para validar hipóteses em pesquisas de negócios é problemático, pois, apesar de sua alta precisão preditiva, eles frequentemente falham em recuperar com fidelidade as relações reais dos dados devido a fatores como correlação e o efeito Rashomon, devendo ser utilizados apenas como ferramentas exploratórias e não confirmatórias.

Tong Wang (Jeffrey), Ronilo Ragodos (Jeffrey), Lu Feng (Jeffrey), Yu (Jeffrey), Hu2026-03-10🤖 cs.LG

Reconsidering the energy efficiency of spiking neural networks

Este artigo propõe uma reavaliação rigorosa da eficiência energética das Redes Neurais de Spiking (SNNs) em comparação com Redes Neurais Artificiais Quantizadas (QNNs), utilizando um modelo analítico abrangente que considera custos de movimentação de dados e memória, demonstrando que as SNNs só superam as QNNs em regimes operacionais específicos (como baixas taxas de disparo) e que, em cenários otimizados, podem dobrar a vida útil da bateria de dispositivos como relógios inteligentes.

Zhanglu Yan, Zhenyu Bai, Weng-Fai Wong2026-03-10🤖 cs.LG

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

Este artigo propõe uma Rede de Osciladores Acoplados (CON) que, ao garantir estrutura lagrangiana, estabilidade global e mapeamento invertível, permite o controle de alto desempenho de sistemas físicos complexos diretamente no espaço latente utilizando apenas imagens como feedback.

Maximilian Stölzle, Cosimo Della Santina2026-03-10🤖 cs.LG

xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing

O artigo apresenta o xTED, um framework que utiliza um modelo de difusão para editar trajetórias de um domínio de origem e adaptá-las a um domínio alvo, preenchendo lacunas de dados de forma universal e flexível para melhorar o aprendizado de políticas em tarefas de tomada de decisão com dados limitados.

Haoyi Niu, Qimao Chen, Tenglong Liu, Jianxiong Li, Guyue Zhou, Yi Zhang, Jianming Hu, Xianyuan Zhan2026-03-10🤖 cs.LG

← Anterior Próximo →