cs.LG artigos | Gist.Science

Fusion and Grouping Strategies in Deep Learning for Local Climate Zone Classification of Multimodal Remote Sensing Data

Este estudo analisa estratégias de fusão e agrupamento em redes neurais convolucionais para classificação de Zonas Climáticas Locais (LCZ) usando dados de sensoriamento remoto multimodais, demonstrando que uma abordagem híbrida combinada com agrupamento de bandas e fusão de rótulos alcança a maior precisão geral (76,6%) e melhora significativamente a detecção de classes sub-representadas no conjunto de dados So2Sat LCZ42.

Ancymol Thomas, Jaya Sreevalsan-Nair2026-03-06💻 cs

Why Do Neural Networks Forget: A Study of Collapse in Continual Learning

Este estudo investiga a forte correlação entre o esquecimento catastrófico e o colapso estrutural em aprendizado contínuo, demonstrando através da análise do rank efetivo (eRank) em diversas arquiteturas e estratégias que a perda de capacidade de expansão do espaço de características força a sobrescrita de representações existentes, afetando diretamente a retenção de tarefas anteriores.

Yunqin Zhu, Jun Jin2026-03-06💻 cs

Self-Attribution Bias: When AI Monitors Go Easy on Themselves

O artigo demonstra que sistemas de IA agênticos sofrem de um viés de autoatribuição, no qual os modelos de linguagem avaliam suas próprias ações como menos arriscadas ou mais corretas quando geradas em turnos anteriores do assistente em comparação com o mesmo conteúdo apresentado pelo usuário, levando a uma superestimação da confiabilidade desses monitores em cenários de implantação real.

Dipika Khullar, Jack Hopkins, Rowan Wang + 1 more2026-03-06💻 cs

A Late-Fusion Multimodal AI Framework for Privacy-Preserving Deduplication in National Healthcare Data Environments

Este trabalho propõe um novo framework de IA multimodal com fusão tardia que utiliza embeddings semânticos, padrões comportamentais e metadados de dispositivos para realizar a deduplicação de registros em ambientes de dados de saúde nacionais de forma escalável e em conformidade com a privacidade, eliminando a dependência de identificadores diretos sensíveis.

Mohammed Omer Shakeel Ahmed2026-03-06💻 cs

PDE foundation model-accelerated inverse estimation of system parameters in inertial confinement fusion

Este trabalho demonstra que o ajuste fino de um modelo fundamental de EDP pré-treinado (MORPH) supera o treinamento do zero na estimativa inversa de parâmetros de fusão por confinamento inercial a partir de imagens de raios X hiperspectrais, alcançando alta precisão e melhorando a eficiência amostral, especialmente em cenários com dados limitados.

Mahindra Rautela, Alexander Scheinker, Bradley Love + 4 more2026-03-06🔬 physics

K-Means as a Radial Basis function Network: a Variational and Gradient-based Equivalence

Este trabalho estabelece uma equivalência variacional e baseada em gradientes entre o algoritmo K-Means e redes neurais de Funções de Base Radial (RBF) diferenciáveis, demonstrando que, à medida que o parâmetro de temperatura tende a zero, o objetivo RBF converge para a solução do K-Means e suas atualizações recuperam as regras exatas de centróide, permitindo a integração estável de agrupamento diferenciável em arquiteturas de aprendizado profundo.

Felipe de Jesus Felix Arredondo, Alejandro Ucan-Puc, Carlos Astengo Noguez2026-03-06🔢 math

Optimal Prediction-Augmented Algorithms for Testing Independence of Distributions

Este trabalho propõe algoritmos ótimos de teste de independência que utilizam informações preditivas auxiliares para reduzir a complexidade de amostragem quando as previsões são precisas, mantendo ao mesmo tempo a validade no pior caso e estabelecendo limites inferiores que comprovam a otimalidade do método em cenários bivariados e de alta dimensão.

Maryam Aliakbarpour, Alireza Azizi, Ria Stevens2026-03-06💻 cs

Spinverse: Differentiable Physics for Permeability-Aware Microstructure Reconstruction from Diffusion MRI

O Spinverse é um método de reconstrução de microestrutura a partir de ressonância magnética de difusão que utiliza um simulador de Bloch-Torrey totalmente diferenciável para inferir permeabilidades em faces de uma malha tetraédrica, permitindo a emergência de interfaces microestruturais sem alterar a conectividade da malha.

Prathamesh Pradeep Khole, Mario M. Brenes, Zahra Kais Petiwala + 5 more2026-03-06💻 cs

When Sensors Fail: Temporal Sequence Models for Robust PPO under Sensor Drift

Este artigo demonstra que a integração de modelos de sequência temporal, como Transformers, ao algoritmo PPO melhora significativamente a robustez de agentes de aprendizado por reforço contra falhas persistentes de sensores, permitindo a inferência de informações ausentes e a manutenção de alto desempenho em ambientes com deriva de observação.

Kevin Vogt-Lowell, Theodoros Tsiligkaridis, Rodney Lafuente-Mercado + 4 more2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

O artigo apresenta o iAgentBench, um novo benchmark dinâmico para perguntas de resposta aberta que avalia a capacidade de agentes de IA de realizar "sensemaking" (compreensão e síntese) ao integrar evidências de múltiplas fontes em tópicos de alto interesse, superando as limitações de benchmarks tradicionais que exigem apenas a recuperação de um único trecho.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

Neuro-Symbolic Financial Reasoning via Deterministic Fact Ledgers and Adversarial Low-Latency Hallucination Detector

O artigo apresenta o VeNRA, um agente de raciocínio financeiro neuro-simbólico que substitui a recuperação probabilística de texto por um Ledger de Fatos Universal estritamente tipado e um detector de alucinações adversarial treinado via simulação, garantindo precisão aritmética e zero alucinações em ambientes de alta latência.

Pedram Agand2026-03-06💻 cs

Improving the accuracy of physics-informed neural networks via last-layer retraining

O artigo propõe um método de re-treinamento da última camada que acopla Redes Neurais Informadas pela Física (PINNs) a um pós-processamento em um espaço de funções, reduzindo os erros em quatro a cinco ordens de grandeza e permitindo a reutilização de bases para problemas mais complexos e a seleção ótima do número de funções de base.

Saad Qadeer, Panos Stinis2026-03-06🔢 math

Direct Estimation of Tree Volume and Aboveground Biomass Using Deep Regression with Synthetic Lidar Data

Este estudo propõe uma abordagem direta para estimar o volume de árvores e a biomassa acima do solo em nível de parcela, utilizando redes de regressão profunda treinadas com dados LiDAR sintéticos, que demonstraram maior precisão e menor subestimação em comparação com os métodos indiretos baseados em modelos alométricos.

Habib Pourdelan, Zhengkang Xiang, Hugh Stewart + 3 more2026-03-06💻 cs

Why the Brain Consolidates: Predictive Forgetting for Optimal Generalisation

Este artigo propõe que a consolidação da memória atua como um mecanismo de "esquecimento preditivo" que, ao comprimir iterativamente as representações neurais offline para reter apenas informações que preveem resultados futuros, otimiza a generalização e resolve limitações teóricas sobre a estabilidade e o drift representacional.

Zafeirios Fountas, Adnan Oomerjee, Haitham Bou-Ammar + 2 more2026-03-06💻 cs

Generalizing Fair Top- $k$ Selection: An Integrative Approach

Este artigo propõe uma abordagem integrativa para a seleção justa de top- $k$ que generaliza cenários anteriores para múltiplos grupos protegidos, analisa a complexidade computacional do problema, introduz uma nova medida de disparidade baseada em perda de utilidade para maior estabilidade e apresenta uma solução prática com alto desempenho empírico em conjuntos de dados reais.

Guangya Cai2026-03-06💻 cs

Engineering Regression Without Real-Data Training: Domain Adaptation for Tabular Foundation Models Using Multi-Dataset Embeddings

Este artigo apresenta o TREDBench e um método de curadoria de dados sintéticos guiado por embeddings para adaptar o modelo TabPFN 2.5 a tarefas de regressão de engenharia sem treinamento em dados reais, demonstrando ganhos significativos em precisão e eficiência de dados ao preencher a lacuna entre distribuições sintéticas e reais.

Lyle Regenwetter, Rosen Yu, Cyril Picard + 1 more2026-03-06💻 cs

Implicit Bias and Loss of Plasticity in Matrix Completion: Depth Promotes Low-Rankness

Este artigo demonstra que o aumento da profundidade em redes neurais lineares para a completude de matrizes intensifica a dinâmica acoplada, promovendo um viés implícito de baixo posto que não apenas resolve questões abertas sobre convergência a posto-1, mas também explica como modelos profundos evitam a perda de plasticidade observada em redes rasas.

Baekrok Shin, Chulhee Yun2026-03-06💻 cs

When Denoising Hinders: Revisiting Zero-Shot ASR with SAM-Audio and Whisper

Este estudo demonstra que o uso do modelo de aprimoramento de fala SAM-Audio como etapa de pré-processamento para sistemas de reconhecimento de fala zero-shot (Whisper) degrada consistentemente a precisão da transcrição, revelando que a melhoria na qualidade perceptual do áudio não se traduz necessariamente em ganhos de reconhecimento para máquinas.

Akif Islam, Raufun Nahar, Md. Ekramul Hamid2026-03-06💻 cs

Probabilistic Dreaming for World Models

Este trabalho propõe inovações probabilísticas ao modelo Dreamer que permitem a exploração paralela de estados latentes e a manutenção de hipóteses distintas para futuros mutuamente exclusivos, resultando em melhor desempenho e menor variância no domínio MPE SimpleTag.

Gavin Wong2026-03-06💻 cs

SLO-Aware Compute Resource Allocation for Prefill-Decode Disaggregated LLM Inference

Este artigo propõe uma abordagem híbrida que combina modelagem teórica e medições empíricas para determinar a alocação ótima de recursos computacionais em sistemas de inferência de LLM com desagregação Prefill-Decode, garantindo o cumprimento de objetivos de nível de serviço (SLOs) relacionados ao tempo de primeiro token e ao tempo por token de saída.

Luchang Li, Dongfang Li, Bozhao Gong + 1 more2026-03-06🔢 math

← Anterior Próximo →

cs.LG