Hierarchical Industrial Demand Forecasting with Temporal and Uncertainty Explanations

Este artigo apresenta um novo método de interpretabilidade para previsão hierárquica de séries temporais probabilísticas que, ao explicar a importância das variáveis, a incerteza e as mudanças nos dados, aumenta a confiança e a adoção de modelos de previsão em cenários industriais complexos, como demonstrado em estudos de caso reais de uma grande empresa química.

Harshavardhan Kamarthi, Shangqing Xu, Xinjie Tong, Xingyu Zhou, James Peters, Joseph Czyzyk, B. Aditya Prakash2026-03-09🤖 cs.LG

Causal Interpretation of Neural Network Computations with Contribution Decomposition

O artigo apresenta o CODEC, um método que utiliza autoencoders esparsos para decompor o comportamento de redes neurais em contribuições causais esparsas, permitindo uma interpretação mais profunda e o controle manipulativo das camadas intermediárias em modelos de classificação de imagens e de atividade neural.

Joshua Brendan Melander, Zaki Alaoui, Shenghua Liu, Surya Ganguli, Stephen A. Baccus2026-03-09🤖 cs.LG

A recipe for scalable attention-based MLIPs: unlocking long-range accuracy with all-to-all node attention

O artigo apresenta o AllScAIP, um modelo de potencial interatômico baseado em aprendizado de máquina que utiliza atenção entre todos os nós para capturar interações de longo alcance de forma orientada por dados, superando as limitações de modelos anteriores e alcançando precisão de ponta em sistemas moleculares e materiais.

Eric Qu, Brandon M. Wood, Aditi S. Krishnapriyan, Zachary W. Ulissi2026-03-09🔬 cond-mat.mtrl-sci

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

O artigo apresenta o BEVLM, um framework que integra representações de Visão de Pássaro (BEV) com Modelos de Linguagem de Grande Escala (LLMs) para superar limitações de consistência espacial e riqueza semântica, resultando em melhorias significativas de 46% na precisão de raciocínio em cenas de direção e de 29% no desempenho de condução autônoma em cenários críticos de segurança.

Thomas Monninger, Shaoyuan Xie, Qi Alfred Chen, Sihao Ding2026-03-09🤖 cs.AI

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Este artigo propõe dois algoritmos de primeira ordem sem derivadas (zeroth-order), o ZO-PDAPG e o ZO-RMPDPG, que garantem complexidade iterativa para encontrar pontos estacionários em problemas minimax não convexos com restrições lineares acopladas, estabelecendo novos padrões de desempenho, especialmente no cenário estocástico sem restrições acopladas.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

Distilling Privileged Information for Dubins Traveling Salesman Problems with Neighborhoods

Este artigo apresenta um novo método de aprendizado que, ao utilizar duas fases de treinamento para distilar informações privilegiadas de um algoritmo heurístico, resolve o Problema do Caixeiro Viajante com Vizinhanças para veículos não holonômicos de forma 50 vezes mais rápida que o método original, superando outras abordagens de aprendizado por imitação e reforço.

Min Kyu Shin, Su-Jeong Park, Seung-Keol Ryu + 2 more2026-03-06💻 cs

HEroBM: a deep equivariant graph neural network for universal backmapping from coarse-grained to all-atom representations

O artigo apresenta o HEroBM, uma rede neural gráfica equivariante profunda e escalável que realiza o backmapping universal e preciso de representações de grão grosso para atômicas em qualquer sistema químico, superando as limitações de métodos anteriores em transferibilidade e qualidade geométrica.

Daniele Angioletti, Stefano Raniolo, Vittorio Limongelli2026-03-06🔬 physics

Towards a Fairer Non-negative Matrix Factorization

Este artigo propõe uma abordagem de fatoração de matriz não negativa (NMF) com uma formulação min-max para mitigar viés em tarefas de aprendizado de máquina, apresentando algoritmos de otimização e evidenciando, por meio de experimentos, que o aumento da equidade pode ocorrer às custas de um maior erro para alguns indivíduos, ressaltando a necessidade de adaptar a escolha do método ao contexto específico da aplicação.

Lara Kassab, Erin George, Deanna Needell + 3 more2026-03-06💻 cs

Path Planning for Masked Diffusion Model Sampling

Este artigo apresenta o Path Planning (P2), uma nova estratégia de amostragem para Modelos de Difusão Mascaramento (MDMs) que generaliza métodos existentes ao introduzir um estágio de planejamento para selecionar e refinar tokens, resultando em melhorias significativas no desempenho generativo em diversas tarefas como biologia, raciocínio matemático e geração de código.

Fred Zhangzhi Peng, Zachary Bezemek, Sawan Patel + 5 more2026-03-06💻 cs

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Este trabalho estende o método de fluxo de entropia para derivar limites de generalização para uma ampla classe de algoritmos de aprendizado governados por processos de Markov, estabelecendo uma conexão unificada entre o erro de generalização e as propriedades ergódicas desses processos por meio de novas fórmulas exatas e aproximações de tempo contínuo.

Benjamin Dupuis, Maxime Haddouche, George Deligiannidis + 1 more2026-03-06💻 cs