cs.LG artigos | Gist.Science

Hierarchical Industrial Demand Forecasting with Temporal and Uncertainty Explanations

Este artigo apresenta um novo método de interpretabilidade para previsão hierárquica de séries temporais probabilísticas que, ao explicar a importância das variáveis, a incerteza e as mudanças nos dados, aumenta a confiança e a adoção de modelos de previsão em cenários industriais complexos, como demonstrado em estudos de caso reais de uma grande empresa química.

Harshavardhan Kamarthi, Shangqing Xu, Xinjie Tong, Xingyu Zhou, James Peters, Joseph Czyzyk, B. Aditya Prakash2026-03-09🤖 cs.LG

Causal Interpretation of Neural Network Computations with Contribution Decomposition

O artigo apresenta o CODEC, um método que utiliza autoencoders esparsos para decompor o comportamento de redes neurais em contribuições causais esparsas, permitindo uma interpretação mais profunda e o controle manipulativo das camadas intermediárias em modelos de classificação de imagens e de atividade neural.

Joshua Brendan Melander, Zaki Alaoui, Shenghua Liu, Surya Ganguli, Stephen A. Baccus2026-03-09🤖 cs.LG

Boosting deep Reinforcement Learning using pretraining with Logical Options

O artigo propõe o H²RL, uma abordagem híbrida de aprendizado por reforço profundo que utiliza pré-treinamento baseado em opções lógicas para alinhar agentes a objetivos de longo prazo, superando as limitações de métodos puramente simbólicos ou neurais em tarefas complexas.

Zihan Ye, Phil Chau, Raban Emunds, Jannis Blüml, Cedric Derstroff, Quentin Delfosse, Oleg Arenz, Kristian Kersting2026-03-09🤖 cs.AI

A recipe for scalable attention-based MLIPs: unlocking long-range accuracy with all-to-all node attention

O artigo apresenta o AllScAIP, um modelo de potencial interatômico baseado em aprendizado de máquina que utiliza atenção entre todos os nós para capturar interações de longo alcance de forma orientada por dados, superando as limitações de modelos anteriores e alcançando precisão de ponta em sistemas moleculares e materiais.

Eric Qu, Brandon M. Wood, Aditi S. Krishnapriyan, Zachary W. Ulissi2026-03-09🔬 cond-mat.mtrl-sci

SCOPE: Scene-Contextualized Incremental Few-Shot 3D Segmentation

O artigo apresenta o SCOPE, um framework plug-and-play que melhora a segmentação 3D incremental de poucos exemplos ao enriquecer protótipos de novas classes com informações extraídas de regiões de fundo não rotuladas, alcançando desempenho superior e reduzindo o esquecimento catastrófico.

Vishal Thengane, Zhaochong An, Tianjin Huang, Son Lam Phung, Abdesselam Bouzerdoum, Lu Yin, Na Zhao, Xiatian Zhu2026-03-09🤖 cs.LG

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

O artigo apresenta o BEVLM, um framework que integra representações de Visão de Pássaro (BEV) com Modelos de Linguagem de Grande Escala (LLMs) para superar limitações de consistência espacial e riqueza semântica, resultando em melhorias significativas de 46% na precisão de raciocínio em cenas de direção e de 29% no desempenho de condução autônoma em cenários críticos de segurança.

Thomas Monninger, Shaoyuan Xie, Qi Alfred Chen, Sihao Ding2026-03-09🤖 cs.AI

Linear Multidimensional Regression with Interactive Fixed-Effects

Este artigo propõe um estimador de regressão linear para dados de painel multidimensionais com efeitos fixos interativos, que combina métodos de fator de Bai (2009) com uma transformação ponderada dentro do grupo para alcançar consistência na taxa paramétrica e normalidade assintótica, sendo aplicado para estimar a elasticidade-preço da demanda por cerveja.

Hugo Freeman2026-03-06💻 cs

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Este artigo propõe dois algoritmos de primeira ordem sem derivadas (zeroth-order), o ZO-PDAPG e o ZO-RMPDPG, que garantem complexidade iterativa para encontrar pontos estacionários em problemas minimax não convexos com restrições lineares acopladas, estabelecendo novos padrões de desempenho, especialmente no cenário estocástico sem restrições acopladas.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

Data Collaboration Analysis with Orthonormal Basis Selection and Alignment

O artigo apresenta a Colaboração de Dados Ortonormal (ODC), um método que impõe bases ortonormais para reduzir o alinhamento de representações a um problema de Procrustes Ortogonal com solução fechada, garantindo concordância ortogonal, estabilidade numérica e acelerações de até 100 vezes sem comprometer a privacidade ou a precisão.

Keiyu Nosaka, Yamato Suetake, Yuichi Takano + 1 more2026-03-06🔢 math

Localized Distributional Robustness in Submodular Multi-Task Subset Selection

Este trabalho propõe uma abordagem de otimização submodular multi-tarefa que, ao introduzir um termo de regularização por entropia relativa, garante robustez distribucional local e eficiência computacional através de métodos gananciosos, validada em cenários de seleção de satélites e sumarização de imagens.

Ege C. Kaya, Abolfazl Hashemi2026-03-06🔢 math

Distilling Privileged Information for Dubins Traveling Salesman Problems with Neighborhoods

Este artigo apresenta um novo método de aprendizado que, ao utilizar duas fases de treinamento para distilar informações privilegiadas de um algoritmo heurístico, resolve o Problema do Caixeiro Viajante com Vizinhanças para veículos não holonômicos de forma 50 vezes mais rápida que o método original, superando outras abordagens de aprendizado por imitação e reforço.

Min Kyu Shin, Su-Jeong Park, Seung-Keol Ryu + 2 more2026-03-06💻 cs

HEroBM: a deep equivariant graph neural network for universal backmapping from coarse-grained to all-atom representations

O artigo apresenta o HEroBM, uma rede neural gráfica equivariante profunda e escalável que realiza o backmapping universal e preciso de representações de grão grosso para atômicas em qualquer sistema químico, superando as limitações de métodos anteriores em transferibilidade e qualidade geométrica.

Daniele Angioletti, Stefano Raniolo, Vittorio Limongelli2026-03-06🔬 physics

Learning to Cover: Online Learning and Optimization with Irreversible Decisions

Este artigo propõe e analisa um algoritmo assintoticamente ótimo para um problema de aprendizado online e otimização com decisões irreversíveis de cobertura, demonstrando que uma política que equilibra exploração inicial e exploração subsequente minimiza o arrependimento de forma sublinear à medida que o número de instalações aumenta.

Alexandre Jacquillat, Michael Lingzhi Li2026-03-06🔢 math

Parallel Split Learning with Global Sampling

O artigo apresenta o GPSL, um esquema de aprendizado dividido paralelo que, ao fixar o tamanho do lote global e utilizar amostragem global, elimina vieses de arredondamento e estabiliza o treinamento em cenários de dados não-IID, alcançando precisão comparável à centralizada com overhead negligenciável.

Mohammad Kohankhaki, Ahmad Ayad, Mahdi Barhoush + 1 more2026-03-06💻 cs

Towards a Fairer Non-negative Matrix Factorization

Este artigo propõe uma abordagem de fatoração de matriz não negativa (NMF) com uma formulação min-max para mitigar viés em tarefas de aprendizado de máquina, apresentando algoritmos de otimização e evidenciando, por meio de experimentos, que o aumento da equidade pode ocorrer às custas de um maior erro para alguns indivíduos, ressaltando a necessidade de adaptar a escolha do método ao contexto específico da aplicação.

Lara Kassab, Erin George, Deanna Needell + 3 more2026-03-06💻 cs

An Experimental Study on Fairness-aware Machine Learning for Credit Scoring Problems

Este artigo apresenta um estudo experimental abrangente que demonstra que modelos de aprendizado de máquina conscientes de justiça alcançam um melhor equilíbrio entre precisão preditiva e equidade em comparação com modelos de classificação tradicionais no contexto de pontuação de crédito.

Huyen Giang Thi Thu, Thang Viet Doan, Ha-Bang Ban + 1 more2026-03-06💻 cs

Path Planning for Masked Diffusion Model Sampling

Este artigo apresenta o Path Planning (P2), uma nova estratégia de amostragem para Modelos de Difusão Mascaramento (MDMs) que generaliza métodos existentes ao introduzir um estágio de planejamento para selecionar e refinar tokens, resultando em melhorias significativas no desempenho generativo em diversas tarefas como biologia, raciocínio matemático e geração de código.

Fred Zhangzhi Peng, Zachary Bezemek, Sawan Patel + 5 more2026-03-06💻 cs

Curse of Dimensionality in Neural Network Optimization

Este artigo demonstra que a otimização de redes neurais rasas sofre da maldição da dimensionalidade, onde a taxa de decaimento do risco populacional durante o treinamento por fluxo de gradiente é limitada pela suavidade da função alvo e pela dimensão do espaço, resultando em convergência lenta que piora conforme a dimensionalidade aumenta.

Sanghoon Na, Haizhao Yang2026-03-06🔢 math

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Este trabalho estende o método de fluxo de entropia para derivar limites de generalização para uma ampla classe de algoritmos de aprendizado governados por processos de Markov, estabelecendo uma conexão unificada entre o erro de generalização e as propriedades ergódicas desses processos por meio de novas fórmulas exatas e aproximações de tempo contínuo.

Benjamin Dupuis, Maxime Haddouche, George Deligiannidis + 1 more2026-03-06💻 cs

Sink equilibria and the attractors of learning in games

Este artigo refuta a conjectura de que existe uma correspondência biunívoca entre os atratores da dinâmica replicadora e as equações de sumidouro em jogos, demonstrando contraexemplos baseados em "fontes locais" e estabelecendo a pseudoconvexidade como uma condição suficiente para que tal correspondência seja válida em jogos de dois jogadores.

Oliver Biggar, Christos Papadimitriou2026-03-06💻 cs

← Anterior Próximo →