Gated Differential Linear Attention: A Linear-Time Decoder for High-Fidelity Medical Segmentation

O artigo apresenta o PVT-GDLA, um decodificador baseado em Transformer que utiliza Atenção Linear Diferencial Portada (GDLA) para alcançar segmentação médica de alta fidelidade com complexidade linear, superando as limitações de custo computacional e diluição de atenção de modelos anteriores ao preservar bordas anatômicas precisas e dependências de longo alcance de forma eficiente.

Hongbo Zheng, Afshin Bozorgpour, Dorit Merhof + 1 more2026-03-06💻 cs

IoUCert: Robustness Verification for Anchor-based Object Detectors

O artigo apresenta o IoUCert, um novo framework de verificação formal que supera as limitações existentes ao garantir a robustez de detectores de objetos baseados em âncoras, como SSD e YOLO, através de uma transformação de coordenadas que permite o cálculo de limites ótimos para a métrica de Interseção sobre União (IoU) sem degradação de precisão.

Benedikt Brückner, Alejandro J. Mercado, Yanghao Zhang, Panagiotis Kouvaros, Alessio Lomuscio2026-03-06🔒 cs.CR

A Unified Framework for Joint Detection of Lacunes and Enlarged Perivascular Spaces

Este artigo propõe um framework unificado de detecção conjunta para lacunas e espaços perivascular dilatados (EPVS) que, ao empregar atenção cruzada inicializada com zero e estratégias de perda mista para superar a interferência de características e o desequilíbrio de classes, alcança desempenho superior ao estado da arte na detecção de lacunas e demonstra robustez em grandes coortes populacionais.

Lucas He, Krinos Li, Hanyuan Zhang + 7 more2026-03-06💻 cs

Lost in Translation: How Language Re-Aligns Vision for Cross-Species Pathology

Este estudo demonstra que o alinhamento semântico via linguagem, através do método "Semantic Anchoring", supera a colapso de embeddings e melhora significativamente a detecção de câncer em modelos de visão computacional ao permitir a reinterpretação semântica de características visuais para generalização entre espécies e tipos de câncer, sem a necessidade de retreinamento completo.

Ekansh Arora2026-03-06💻 cs

Recognition of Daily Activities through Multi-Modal Deep Learning: A Video, Pose, and Object-Aware Approach for Ambient Assisted Living

Este artigo apresenta uma abordagem de aprendizado profundo multi-modal que integra redes neurais convolucionais 3D, dados de pose humana e detecção de objetos via mecanismo de atenção cruzada para melhorar o reconhecimento de atividades diárias em ambientes de Vida Assistida Ambientada, visando promover a segurança e autonomia de idosos.

Kooshan Hashemifard, Pau Climent-Pérez, Francisco Florez-Revuelta2026-03-06💻 cs

InverseNet: Benchmarking Operator Mismatch and Calibration Across Compressive Imaging Modalities

O artigo apresenta o InverseNet, o primeiro benchmark transversal a múltiplas modalidades de imageamento compressivo, demonstrando que a discrepância entre o operador físico e o modelo computacional degrada drasticamente o desempenho dos métodos de aprendizado profundo, enquanto arquiteturas condicionadas ao operador e calibração cega conseguem recuperar a maior parte dessa perda.

Chengshuai Yang, Xin Yuan2026-03-06💻 cs

Fusion and Grouping Strategies in Deep Learning for Local Climate Zone Classification of Multimodal Remote Sensing Data

Este estudo analisa estratégias de fusão e agrupamento em redes neurais convolucionais para classificação de Zonas Climáticas Locais (LCZ) usando dados de sensoriamento remoto multimodais, demonstrando que uma abordagem híbrida combinada com agrupamento de bandas e fusão de rótulos alcança a maior precisão geral (76,6%) e melhora significativamente a detecção de classes sub-representadas no conjunto de dados So2Sat LCZ42.

Ancymol Thomas, Jaya Sreevalsan-Nair2026-03-06💻 cs

Structure-Guided Histopathology Synthesis via Dual-LoRA Diffusion

Este artigo propõe o "Dual-LoRA Controllable Diffusion", um framework unificado de difusão guiado por centróides que utiliza adaptadores LoRA especializados para realizar simultaneamente a conclusão de estruturas locais e a síntese global em imagens de histopatologia, superando os métodos existentes ao garantir maior fidelidade estrutural e realismo morfológico com baixo custo de anotação.

Xuan Xu, Prateek Prasanna2026-03-06💻 cs