MoECLIP: Patch-Specialized Experts for Zero-shot Anomaly Detection

O artigo apresenta o MoECLIP, uma arquitetura de Mistura de Especialistas (MoE) que aprimora a Detecção de Anomalias Zero-Shot ao direcionar dinamicamente cada patch de imagem para um especialista LoRA especializado, utilizando separação ortogonal de recursos congelados e uma perda de quadro apertado equiangular (ETF) para evitar redundância e superar os métodos existentes em diversos domínios.

Jun Yeong Park, JunYoung Seo, Minji Kang + 1 more2026-03-05🤖 cs.AI

ProSMA-UNet: Decoder Conditioning for Proximal-Sparse Skip Feature Selection

O artigo apresenta o ProSMA-UNet, uma arquitetura de segmentação médica que reformula as conexões de salto como um problema de seleção esparsa de características condicionada ao decodificador, utilizando um operador de proximidade 1\ell_1 para eliminar explicitamente ruídos e texturas irrelevantes, alcançando desempenho superior em benchmarks 2D e 3D desafiadores.

Chun-Wun Cheng, Yanqi Cheng, Peiyuan Jing + 4 more2026-03-05💻 cs

mHC-HSI: Clustering-Guided Hyper-Connection Mamba for Hyperspectral Image Classification

Este artigo apresenta o mHC-HSI, um modelo inovador de classificação de imagens hiperespectrais que combina o Mamba com conexões hiperconectadas guiadas por agrupamento para melhorar a aprendizagem de características espaciais e espectrais, a interpretabilidade e a precisão através da decomposição em clusters e da integração de conhecimento físico espectral.

Yimin Zhu, Zack Dewis, Quinn Ledingham + 6 more2026-03-05💻 cs

Impact of Localization Errors on Label Quality for Online HD Map Construction

Este estudo analisa o impacto de erros de localização (como ruído de rampa, Gaussiano e Perlin) na qualidade dos rótulos para a construção de mapas HD online, demonstrando que erros de ângulo afetam mais severamente o desempenho do modelo do que erros de posição e que a degradação do desempenho cresce mais do que linearmente com o aumento de dados ruidosos.

Alexander Blumberg, Jonas Merkert, Richard Fehler + 4 more2026-03-05💻 cs

Geographically-Weighted Weakly Supervised Bayesian High-Resolution Transformer for 200m Resolution Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data

Este estudo apresenta uma nova abordagem baseada em um Transformer Bayesiano de Alta Resolução com aprendizado supervisionado fraco geograficamente ponderado, que funde dados de Sentinel-1, RCM e AMSR2 para gerar mapas de concentração de gelo marinho no Ártico com resolução de 200 metros e estimativas de incerteza confiáveis, superando desafios como características sutis do gelo e rótulos imperfeitos.

Mabel Heffring, Lincoln Linlin Xu2026-03-05🤖 cs.LG

PhyPrompt: RL-based Prompt Refinement for Physically Plausible Text-to-Video Generation

O PhyPrompt é um framework de aprendizado por reforço que refina automaticamente prompts para geradores de texto-para-vídeo, utilizando um currículo dinâmico de recompensas para otimizar simultaneamente a aderência semântica e a plausibilidade física, superando modelos muito maiores e alcançando resultados superiores em diversas arquiteturas.

Shang Wu, Chenwei Xu, Zhuofan Xia + 6 more2026-03-05🤖 cs.AI

Modeling Cross-vision Synergy for Unified Large Vision Model

O artigo apresenta o PolyV, um modelo unificado de visão que alcança sinergia entre diferentes modalidades visuais (imagens, vídeos e dados 3D) através de uma arquitetura de mistura de especialistas esparsa e um paradigma de treinamento focado em alinhamento e refinamento mútuo, superando significativamente os modelos existentes em diversas tarefas de compreensão visual.

Shengqiong Wu, Lanhu Wu, Mingyang Bao + 5 more2026-03-05💻 cs

Confidence-aware Monocular Depth Estimation for Minimally Invasive Surgery

Este artigo propõe um novo framework de estimativa de profundidade monocultural consciente de confiança para cirurgia minimamente invasiva, que utiliza alvos de confiança calibrados, funções de perda adaptadas e uma cabeça de inferência para melhorar a precisão e quantificar a confiabilidade das previsões de profundidade na presença de ruídos e artefatos endoscópicos.

Muhammad Asad, Emanuele Colleoni, Pritesh Mehta + 7 more2026-03-05💻 cs