Towards Explainable Deep Learning for Ship Trajectory Prediction in Inland Waterways

Este estudo apresenta um modelo de previsão de trajetória de navios em vias navegáveis interiores baseado em LSTM e atenção, que, embora atinja uma precisão comparável a trabalhos similares, revela através de sua arquitetura interpretável que as melhorias de desempenho não são inteiramente impulsionadas por relações causais com os navios vizinhos, destacando a importância da explicabilidade para garantir a confiança nesses sistemas.

Tom Legel, Dirk Söffker, Roland Schätzle + 1 more2026-03-06💻 cs

Bayesian Modeling of Collatz Stopping Times: A Probabilistic Machine Learning Perspective

Este artigo analisa os tempos de parada da conjectura de Collatz para n107n \le 10^7 através de uma perspectiva de aprendizado de máquina probabilístico, demonstrando que um modelo hierárquico bayesiano de regressão Negativa Binomial supera aproximações geradoras baseadas em decomposição de blocos ímpares, enquanto evidencia que a estrutura modular de baixa ordem é um fator crucial para a heterogeneidade observada nos dados.

Nicolò Bonacorsi, Matteo Bordoni2026-03-06🔢 math

Augmenting representations with scientific papers

Este trabalho apresenta um framework de aprendizado contrastivo que alinha espectros de raios X com conhecimento extraído de artigos científicos, criando representações multimodais compartilhadas que melhoram a estimativa de variáveis físicas e facilitam a identificação de fontes astrofísicas raras ou pouco compreendidas.

Nicolò Oreste Pinciroli Vago, Rocco Di Tella, Carolina Cuesta-Lázaro + 3 more2026-03-06✓ Author reviewed 🔭 astro-ph

Projected Hessian Learning: Fast Curvature Supervision for Accurate Machine-Learning Interatomic Potentials

O artigo apresenta o Aprendizado de Hessiano Projetado (PHL), um método escalável que treina potenciais interatômicos de aprendizado de máquina utilizando produtos vetor-Hessiano para incorporar informações de curvatura com precisão próxima à do Hessiano completo, mas com custo computacional e de memória significativamente reduzidos.

Austin Rodriguez, Justin S. Smith, Sakib Matin + 3 more2026-03-06🔬 physics

The Volterra signature

O artigo propõe a assinatura de Volterra como uma representação de recursos explícita e matematicamente fundamentada para séries temporais não markovianas, demonstrando suas propriedades de universalidade, invariância à reparametrização temporal e eficiência computacional, o que resulta em melhor desempenho em tarefas de aprendizado dinâmico em comparação com assinaturas de caminho clássicas.

Paul P. Hager, Fabian N. Harang, Luca Pelizzari + 1 more2026-03-06💻 cs

Invariant Causal Routing for Governing Social Norms in Online Market Economies

Este artigo propõe o quadro de governança "Roteamento Causal Invariante" (ICR), que integra raciocínio contrafactual e descoberta causal invariante para identificar regras de política interpretáveis e estáveis que orientam normas sociais emergentes em economias de mercado online, superando as limitações de abordagens baseadas em correlação ao garantir eficácia sob mudanças de distribuição.

Xiangning Yu, Qirui Mi, Xiao Xue + 4 more2026-03-06💻 cs

An LLM-Guided Query-Aware Inference System for GNN Models on Large Knowledge Graphs

O artigo apresenta o KG-WISE, um sistema de inferência orientado a consultas que utiliza Grandes Modelos de Linguagem (LLMs) para decompor e carregar dinamicamente componentes específicos de modelos de Redes Neurais em Grafos (GNNs) em grandes Grafos de Conhecimento, alcançando ganhos significativos de velocidade e redução de uso de memória sem comprometer a precisão.

Waleed Afandi, Hussein Abdallah, Ashraf Aboulnaga + 1 more2026-03-06💻 cs

Weather-Related Crash Risk Forecasting: A Deep Learning Approach for Heterogenous Spatiotemporal Data

Este estudo apresenta um framework baseado em aprendizado profundo que utiliza um ensemble de modelos ConvLSTM treinados em grades espaciais sobrepostas para prever com maior precisão o risco de acidentes de trânsito relacionados ao clima na Carolina do Norte, superando modelos tradicionais ao capturar dependências espaciais e dinâmicas temporais em dados heterogêneos.

Abimbola Ogungbire, Srinivas Pulugurtha2026-03-06💻 cs

Fusion and Grouping Strategies in Deep Learning for Local Climate Zone Classification of Multimodal Remote Sensing Data

Este estudo analisa estratégias de fusão e agrupamento em redes neurais convolucionais para classificação de Zonas Climáticas Locais (LCZ) usando dados de sensoriamento remoto multimodais, demonstrando que uma abordagem híbrida combinada com agrupamento de bandas e fusão de rótulos alcança a maior precisão geral (76,6%) e melhora significativamente a detecção de classes sub-representadas no conjunto de dados So2Sat LCZ42.

Ancymol Thomas, Jaya Sreevalsan-Nair2026-03-06💻 cs

Why Do Neural Networks Forget: A Study of Collapse in Continual Learning

Este estudo investiga a forte correlação entre o esquecimento catastrófico e o colapso estrutural em aprendizado contínuo, demonstrando através da análise do rank efetivo (eRank) em diversas arquiteturas e estratégias que a perda de capacidade de expansão do espaço de características força a sobrescrita de representações existentes, afetando diretamente a retenção de tarefas anteriores.

Yunqin Zhu, Jun Jin2026-03-06💻 cs

Self-Attribution Bias: When AI Monitors Go Easy on Themselves

O artigo demonstra que sistemas de IA agênticos sofrem de um viés de autoatribuição, no qual os modelos de linguagem avaliam suas próprias ações como menos arriscadas ou mais corretas quando geradas em turnos anteriores do assistente em comparação com o mesmo conteúdo apresentado pelo usuário, levando a uma superestimação da confiabilidade desses monitores em cenários de implantação real.

Dipika Khullar, Jack Hopkins, Rowan Wang + 1 more2026-03-06💻 cs

A Late-Fusion Multimodal AI Framework for Privacy-Preserving Deduplication in National Healthcare Data Environments

Este trabalho propõe um novo framework de IA multimodal com fusão tardia que utiliza embeddings semânticos, padrões comportamentais e metadados de dispositivos para realizar a deduplicação de registros em ambientes de dados de saúde nacionais de forma escalável e em conformidade com a privacidade, eliminando a dependência de identificadores diretos sensíveis.

Mohammed Omer Shakeel Ahmed2026-03-06💻 cs

PDE foundation model-accelerated inverse estimation of system parameters in inertial confinement fusion

Este trabalho demonstra que o ajuste fino de um modelo fundamental de EDP pré-treinado (MORPH) supera o treinamento do zero na estimativa inversa de parâmetros de fusão por confinamento inercial a partir de imagens de raios X hiperspectrais, alcançando alta precisão e melhorando a eficiência amostral, especialmente em cenários com dados limitados.

Mahindra Rautela, Alexander Scheinker, Bradley Love + 4 more2026-03-06🔬 physics