UWF-RI2FA: Generating Multi-frame Ultrawide-field Fluorescein Angiography from Ultrawide-field Retinal Imaging Improves Diabetic Retinopathy Stratification

Este estudo apresenta o modelo UWF-RI2FA, que utiliza inteligência artificial generativa para criar imagens sintéticas de angiografia fluoresceína ultralarga sem necessidade de injeção de corante, demonstrando que essas imagens melhoram significativamente a estratificação da retinopatia diabética.

Ruoyu Chen, Kezheng Xu, Kangyan Zheng + 4 more2026-02-25⚡ eess

RegTrack: Simplicity Beneath Complexity in Robust Multi-Modal 3D Multi-Object Tracking

O artigo apresenta o RegTrack, um método robusto e eficiente para rastreamento multi-objeto 3D multimodal que, inspirado na teoria de calibre de Yang-Mills e utilizando apenas 2,6 milhões de parâmetros, supera 35 concorrentes ao empregar um codificador tri-cue unificado para realizar associação baseada em similaridade e compensação de movimento sem depender de métricas complexas ou priores específicos de classe.

Lipeng Gu, Xuefeng Yan, Song Wang + 1 more2026-02-25💻 cs

Implementation of neural network operators with applications to remote sensing data

Este artigo apresenta dois algoritmos baseados em operadores de redes neurais multidimensionais ativados por funções sigmoidais tangente hiperbólica para modelagem e aprimoramento de dados de sensoriamento remoto, demonstrando, por meio de experimentos numéricos no conjunto de dados RETINA, que eles superam os métodos de interpolação clássicos, especialmente no Índice de Similaridade Estrutural (SSIM).

Danilo Costarelli, Michele Piconi2026-02-25💻 cs

Two Models for Surface Segmentation using the Total Variation of the Normal Vector

Este artigo propõe e compara duas abordagens variacionais para segmentação de superfícies em malhas triangulares, demonstrando que um regularizador baseado na variação total no espaço de rótulos, resolvido com um esquema de Newton em variedades para reduzir custos computacionais, oferece resultados superiores na remoção de ruído em regiões de curvatura constante.

Manuel Weiß, Lukas Baumgärtner, Laura Weigl + 3 more2026-02-25💻 cs

Revisiting the Generalization Problem of Low-level Vision Models Through the Lens of Image Deraining

Este artigo investiga as causas da falha de generalização em modelos de visão de baixo nível, identificando o "aprendizado de atalho" como o principal obstáculo e propondo estratégias para equilibrar a complexidade dos dados e utilizar priors de modelos generativos, com validação experimental em tarefas como remoção de chuva, ruído e desfoque.

Jinfan Hu, Zhiyuan You, Jinjin Gu + 3 more2026-02-25💻 cs

A deep learning framework for efficient pathology image analysis

O artigo apresenta o EAGLE, um novo framework de aprendizado profundo que utiliza modelos fundamentais para selecionar e analisar seletivamente regiões informativas em imagens de patologia, superando os métodos atuais em precisão e reduzindo o tempo de processamento em mais de 99%, o que viabiliza fluxos de trabalho em tempo real e torna a patologia assistida por IA mais acessível.

Peter Neidlinger, Tim Lenz, Sebastian Foersch + 24 more2026-02-25💻 cs

VISIONLOGIC: From Neuron Activations to Causally Grounded Concept Rules for Vision Models

O VisionLogic é um novo framework neural-simbólico que gera explicações hierárquicas e interpretáveis para modelos de visão computacional, convertendo ativações neuronais em regras lógicas globais fundamentadas causalmente em conceitos visuais validados, superando métodos anteriores ao garantir que os conceitos descobertos sejam efetivamente causais para as previsões do modelo.

Chuqin Geng, Yuhe Jiang, Ziyu Zhao + 4 more2026-02-25💻 cs

Enhancing Out-of-Distribution Detection with Extended Logit Normalization

Este trabalho propõe o ELogitNorm, uma nova formulação sem hiperparâmetros que corrige o fenômeno de colapso de características no LogitNorm ao adicionar um termo de perda sensível à distância de características, melhorando significativamente a detecção de dados fora de distribuição e a calibração de confiança sem comprometer a precisão da classificação.

Yifan Ding, Xixi Liu, Jonas Unger + 1 more2026-02-25💻 cs

HoloLLM: Multisensory Foundation Model for Language-Grounded Human Sensing and Reasoning

O artigo apresenta o HoloLLM, um modelo de linguagem multimodal que integra sensores incomuns como LiDAR, infravermelho, radar mmWave e WiFi para superar as limitações da visão em ambientes reais, utilizando um projetor universal de injeção de modalidades e uma pipeline de curadoria de dados colaborativa para alcançar uma percepção e raciocínio humanos significativamente mais precisos e robustos.

Chuhao Zhou, Jianfei Yang2026-02-25💬 cs.CL

Addressing Camera Sensors Faults in Vision-Based Navigation: Simulation and Dataset Development

Este estudo aborda os desafios da navegação baseada em visão em missões espaciais ao caracterizar falhas de sensores, desenvolver um framework de simulação para gerar imagens defeituosas sintéticas e criar um conjunto de dados essencial para treinar e testar algoritmos de Inteligência Artificial na detecção dessas falhas.

Riccardo Gallon, Fabian Schiemenz, Alessandra Menicucci + 1 more2026-02-25🤖 cs.AI

NRSeg: Noise-Resilient Learning for BEV Semantic Segmentation via Driving World Models

O artigo apresenta o NRSeg, um framework de aprendizado resiliente a ruídos para segmentação semântica em visão de pássaro (BEV) que utiliza dados sintéticos de modelos de mundo de direção, combinando métricas de consistência geométrica, previsão paralela de distribuições e exclusão semântica hierárquica para alcançar desempenho superior em tarefas não supervisionadas e semi-supervisionadas.

Siyu Li, Fei Teng, Yihong Cao + 3 more2026-02-25⚡ eess