A recipe for scalable attention-based MLIPs: unlocking long-range accuracy with all-to-all node attention

O artigo apresenta o AllScAIP, um modelo de potencial interatômico baseado em aprendizado de máquina que utiliza atenção entre todos os nós para capturar interações de longo alcance de forma orientada por dados, superando as limitações de modelos anteriores e alcançando precisão de ponta em sistemas moleculares e materiais.

Eric Qu, Brandon M. Wood, Aditi S. Krishnapriyan, Zachary W. Ulissi2026-03-09🔬 cond-mat.mtrl-sci

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

O artigo apresenta o BEVLM, um framework que integra representações de Visão de Pássaro (BEV) com Modelos de Linguagem de Grande Escala (LLMs) para superar limitações de consistência espacial e riqueza semântica, resultando em melhorias significativas de 46% na precisão de raciocínio em cenas de direção e de 29% no desempenho de condução autônoma em cenários críticos de segurança.

Thomas Monninger, Shaoyuan Xie, Qi Alfred Chen, Sihao Ding2026-03-09🤖 cs.AI

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Este artigo propõe dois algoritmos de primeira ordem sem derivadas (zeroth-order), o ZO-PDAPG e o ZO-RMPDPG, que garantem complexidade iterativa para encontrar pontos estacionários em problemas minimax não convexos com restrições lineares acopladas, estabelecendo novos padrões de desempenho, especialmente no cenário estocástico sem restrições acopladas.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

Distilling Privileged Information for Dubins Traveling Salesman Problems with Neighborhoods

Este artigo apresenta um novo método de aprendizado que, ao utilizar duas fases de treinamento para distilar informações privilegiadas de um algoritmo heurístico, resolve o Problema do Caixeiro Viajante com Vizinhanças para veículos não holonômicos de forma 50 vezes mais rápida que o método original, superando outras abordagens de aprendizado por imitação e reforço.

Min Kyu Shin, Su-Jeong Park, Seung-Keol Ryu + 2 more2026-03-06💻 cs

HEroBM: a deep equivariant graph neural network for universal backmapping from coarse-grained to all-atom representations

O artigo apresenta o HEroBM, uma rede neural gráfica equivariante profunda e escalável que realiza o backmapping universal e preciso de representações de grão grosso para atômicas em qualquer sistema químico, superando as limitações de métodos anteriores em transferibilidade e qualidade geométrica.

Daniele Angioletti, Stefano Raniolo, Vittorio Limongelli2026-03-06🔬 physics

Towards a Fairer Non-negative Matrix Factorization

Este artigo propõe uma abordagem de fatoração de matriz não negativa (NMF) com uma formulação min-max para mitigar viés em tarefas de aprendizado de máquina, apresentando algoritmos de otimização e evidenciando, por meio de experimentos, que o aumento da equidade pode ocorrer às custas de um maior erro para alguns indivíduos, ressaltando a necessidade de adaptar a escolha do método ao contexto específico da aplicação.

Lara Kassab, Erin George, Deanna Needell + 3 more2026-03-06💻 cs

Path Planning for Masked Diffusion Model Sampling

Este artigo apresenta o Path Planning (P2), uma nova estratégia de amostragem para Modelos de Difusão Mascaramento (MDMs) que generaliza métodos existentes ao introduzir um estágio de planejamento para selecionar e refinar tokens, resultando em melhorias significativas no desempenho generativo em diversas tarefas como biologia, raciocínio matemático e geração de código.

Fred Zhangzhi Peng, Zachary Bezemek, Sawan Patel + 5 more2026-03-06💻 cs

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Este trabalho estende o método de fluxo de entropia para derivar limites de generalização para uma ampla classe de algoritmos de aprendizado governados por processos de Markov, estabelecendo uma conexão unificada entre o erro de generalização e as propriedades ergódicas desses processos por meio de novas fórmulas exatas e aproximações de tempo contínuo.

Benjamin Dupuis, Maxime Haddouche, George Deligiannidis + 1 more2026-03-06💻 cs

FBFL: A Field-Based Coordination Approach for Data Heterogeneity in Federated Learning

Este artigo propõe o FBFL, uma abordagem de aprendizado federado baseada em campos que utiliza macroprogramação e coordenação espacial para criar uma arquitetura hierárquica auto-organizada, superando os desafios de heterogeneidade de dados não-IID e falhas de servidor, enquanto supera métodos existentes como FedAvg, FedProx e Scaffold em cenários não-IID.

Davide Domini, Gianluca Aguzzi, Lukas Esterle + 1 more2026-03-06💻 cs

Generative Models in Decision Making: A Survey

Esta pesquisa apresenta uma revisão abrangente que propõe uma taxonomia unificada baseada no raciocínio probabilístico para classificar modelos generativos em quatro funções distintas (controladores, modeladores, otimizadores e avaliadores) no contexto da tomada de decisão, analisando seus desafios de aplicação em domínios de alto risco e traçando o caminho para a Inteligência Física Generalista.

Xinyu Shao, Jianping Zhang, Haozhi Wang + 9 more2026-03-06💻 cs