Fusion and Grouping Strategies in Deep Learning for Local Climate Zone Classification of Multimodal Remote Sensing Data

Este estudo analisa estratégias de fusão e agrupamento em redes neurais convolucionais para classificação de Zonas Climáticas Locais (LCZ) usando dados de sensoriamento remoto multimodais, demonstrando que uma abordagem híbrida combinada com agrupamento de bandas e fusão de rótulos alcança a maior precisão geral (76,6%) e melhora significativamente a detecção de classes sub-representadas no conjunto de dados So2Sat LCZ42.

Ancymol Thomas, Jaya Sreevalsan-Nair2026-03-06💻 cs

Why Do Neural Networks Forget: A Study of Collapse in Continual Learning

Este estudo investiga a forte correlação entre o esquecimento catastrófico e o colapso estrutural em aprendizado contínuo, demonstrando através da análise do rank efetivo (eRank) em diversas arquiteturas e estratégias que a perda de capacidade de expansão do espaço de características força a sobrescrita de representações existentes, afetando diretamente a retenção de tarefas anteriores.

Yunqin Zhu, Jun Jin2026-03-06💻 cs

Self-Attribution Bias: When AI Monitors Go Easy on Themselves

O artigo demonstra que sistemas de IA agênticos sofrem de um viés de autoatribuição, no qual os modelos de linguagem avaliam suas próprias ações como menos arriscadas ou mais corretas quando geradas em turnos anteriores do assistente em comparação com o mesmo conteúdo apresentado pelo usuário, levando a uma superestimação da confiabilidade desses monitores em cenários de implantação real.

Dipika Khullar, Jack Hopkins, Rowan Wang + 1 more2026-03-06💻 cs

A Late-Fusion Multimodal AI Framework for Privacy-Preserving Deduplication in National Healthcare Data Environments

Este trabalho propõe um novo framework de IA multimodal com fusão tardia que utiliza embeddings semânticos, padrões comportamentais e metadados de dispositivos para realizar a deduplicação de registros em ambientes de dados de saúde nacionais de forma escalável e em conformidade com a privacidade, eliminando a dependência de identificadores diretos sensíveis.

Mohammed Omer Shakeel Ahmed2026-03-06💻 cs

PDE foundation model-accelerated inverse estimation of system parameters in inertial confinement fusion

Este trabalho demonstra que o ajuste fino de um modelo fundamental de EDP pré-treinado (MORPH) supera o treinamento do zero na estimativa inversa de parâmetros de fusão por confinamento inercial a partir de imagens de raios X hiperspectrais, alcançando alta precisão e melhorando a eficiência amostral, especialmente em cenários com dados limitados.

Mahindra Rautela, Alexander Scheinker, Bradley Love + 4 more2026-03-06🔬 physics

K-Means as a Radial Basis function Network: a Variational and Gradient-based Equivalence

Este trabalho estabelece uma equivalência variacional e baseada em gradientes entre o algoritmo K-Means e redes neurais de Funções de Base Radial (RBF) diferenciáveis, demonstrando que, à medida que o parâmetro de temperatura tende a zero, o objetivo RBF converge para a solução do K-Means e suas atualizações recuperam as regras exatas de centróide, permitindo a integração estável de agrupamento diferenciável em arquiteturas de aprendizado profundo.

Felipe de Jesus Felix Arredondo, Alejandro Ucan-Puc, Carlos Astengo Noguez2026-03-06🔢 math

Optimal Prediction-Augmented Algorithms for Testing Independence of Distributions

Este trabalho propõe algoritmos ótimos de teste de independência que utilizam informações preditivas auxiliares para reduzir a complexidade de amostragem quando as previsões são precisas, mantendo ao mesmo tempo a validade no pior caso e estabelecendo limites inferiores que comprovam a otimalidade do método em cenários bivariados e de alta dimensão.

Maryam Aliakbarpour, Alireza Azizi, Ria Stevens2026-03-06💻 cs

Spinverse: Differentiable Physics for Permeability-Aware Microstructure Reconstruction from Diffusion MRI

O Spinverse é um método de reconstrução de microestrutura a partir de ressonância magnética de difusão que utiliza um simulador de Bloch-Torrey totalmente diferenciável para inferir permeabilidades em faces de uma malha tetraédrica, permitindo a emergência de interfaces microestruturais sem alterar a conectividade da malha.

Prathamesh Pradeep Khole, Mario M. Brenes, Zahra Kais Petiwala + 5 more2026-03-06💻 cs

When Sensors Fail: Temporal Sequence Models for Robust PPO under Sensor Drift

Este artigo demonstra que a integração de modelos de sequência temporal, como Transformers, ao algoritmo PPO melhora significativamente a robustez de agentes de aprendizado por reforço contra falhas persistentes de sensores, permitindo a inferência de informações ausentes e a manutenção de alto desempenho em ambientes com deriva de observação.

Kevin Vogt-Lowell, Theodoros Tsiligkaridis, Rodney Lafuente-Mercado + 4 more2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

O artigo apresenta o iAgentBench, um novo benchmark dinâmico para perguntas de resposta aberta que avalia a capacidade de agentes de IA de realizar "sensemaking" (compreensão e síntese) ao integrar evidências de múltiplas fontes em tópicos de alto interesse, superando as limitações de benchmarks tradicionais que exigem apenas a recuperação de um único trecho.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

Direct Estimation of Tree Volume and Aboveground Biomass Using Deep Regression with Synthetic Lidar Data

Este estudo propõe uma abordagem direta para estimar o volume de árvores e a biomassa acima do solo em nível de parcela, utilizando redes de regressão profunda treinadas com dados LiDAR sintéticos, que demonstraram maior precisão e menor subestimação em comparação com os métodos indiretos baseados em modelos alométricos.

Habib Pourdelan, Zhengkang Xiang, Hugh Stewart + 3 more2026-03-06💻 cs

Engineering Regression Without Real-Data Training: Domain Adaptation for Tabular Foundation Models Using Multi-Dataset Embeddings

Este artigo apresenta o TREDBench e um método de curadoria de dados sintéticos guiado por embeddings para adaptar o modelo TabPFN 2.5 a tarefas de regressão de engenharia sem treinamento em dados reais, demonstrando ganhos significativos em precisão e eficiência de dados ao preencher a lacuna entre distribuições sintéticas e reais.

Lyle Regenwetter, Rosen Yu, Cyril Picard + 1 more2026-03-06💻 cs

SLO-Aware Compute Resource Allocation for Prefill-Decode Disaggregated LLM Inference

Este artigo propõe uma abordagem híbrida que combina modelagem teórica e medições empíricas para determinar a alocação ótima de recursos computacionais em sistemas de inferência de LLM com desagregação Prefill-Decode, garantindo o cumprimento de objetivos de nível de serviço (SLOs) relacionados ao tempo de primeiro token e ao tempo por token de saída.

Luchang Li, Dongfang Li, Bozhao Gong + 1 more2026-03-06🔢 math