Lumosaic: Hyperspectral Video via Active Illumination and Coded-Exposure Pixels

O artigo apresenta o Lumosaic, um sistema ativo de vídeo hiperespectral compacto que combina uma matriz de LEDs de banda estreita com uma câmera de exposição codificada por pixel para capturar, em tempo real, vídeos hiperespectrais de 30 quadros por segundo com alta fidelidade espectral e estabilidade temporal, superando as limitações dos sistemas passivos ao sincronizar a iluminação e a exposição para lidar com cenas dinâmicas.

Dhruv Verma, Andrew Qiu, Roberto Rangel + 8 more2026-02-26⚡ eess

WeaveTime: Stream from Earlier Frames into Emergent Memory in VideoLLMs

O artigo apresenta o WeaveTime, um framework leve e agnóstico ao modelo que aprimora a compreensão temporal em VideoLLMs para cenários de streaming ao ensinar a percepção de ordem por meio de um objetivo de reconstrução temporal e gerenciar dinamicamente o foco entre o passado e o presente durante a inferência, resultando em maior precisão e menor latência sem alterações arquiteturais.

Yulin Zhang, Cheng Shi, Sibei Yang2026-02-26💻 cs

MedTri: A Platform for Structured Medical Report Normalization to Enhance Vision-Language Pretraining

O artigo apresenta o MedTri, uma plataforma de normalização que converte relatórios médicos livres em tripletas estruturadas baseadas em anatomia, demonstrando que essa padronização melhora significativamente a qualidade do pré-treinamento visão-linguagem em radiologia ao eliminar ruídos estilísticos e preservar informações essenciais.

Yuetan Chu, Xinhua Ma, Xinran Jin + 2 more2026-02-26💻 cs

CASR: A Robust Cyclic Framework for Arbitrary Large-Scale Super-Resolution with Distribution Alignment and Self-Similarity Awareness

O CASR é um framework cíclico simples e eficiente que supera as limitações de deslocamento de distribuição na super-resolução de escala arbitrária, alinhando estruturas e restaurando texturas por meio de módulos de agregação de superpixels e auto-similaridade para garantir inferência estável e generalização superior em ampliações extremas.

Wenhao Guo, Zhaoran Zhao, Peng Lu + 3 more2026-02-26💻 cs

Mixed Magnification Aggregation for Generalizable Region-Level Representations in Computational Pathology

Este artigo propõe um codificador de agregação de região em múltiplas ampliações que funde representações de tiles de imagens de patologia usando modelagem de mascaramento de embeddings, demonstrando melhorias no desempenho preditivo para biomarcadores ao capturar contextos espaciais e features multi-resolução.

Eric Zimmermann, Julian Viret, Michal Zelechowski + 7 more2026-02-26💻 cs

ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation

O artigo apresenta o ScaleDepth, um método inovador de estimativa de profundidade monoculométrica que decompõe a tarefa em predição de escala e estimativa de profundidade relativa, permitindo uma generalização superior e unificada para cenas internas e externas sem necessidade de ajuste fino ou definição prévia de faixas de profundidade.

Ruijie Zhu, Chuxin Wang, Ziyang Song + 3 more2026-02-25💻 cs

UWF-RI2FA: Generating Multi-frame Ultrawide-field Fluorescein Angiography from Ultrawide-field Retinal Imaging Improves Diabetic Retinopathy Stratification

Este estudo apresenta o modelo UWF-RI2FA, que utiliza inteligência artificial generativa para criar imagens sintéticas de angiografia fluoresceína ultralarga sem necessidade de injeção de corante, demonstrando que essas imagens melhoram significativamente a estratificação da retinopatia diabética.

Ruoyu Chen, Kezheng Xu, Kangyan Zheng + 4 more2026-02-25⚡ eess

RegTrack: Simplicity Beneath Complexity in Robust Multi-Modal 3D Multi-Object Tracking

O artigo apresenta o RegTrack, um método robusto e eficiente para rastreamento multi-objeto 3D multimodal que, inspirado na teoria de calibre de Yang-Mills e utilizando apenas 2,6 milhões de parâmetros, supera 35 concorrentes ao empregar um codificador tri-cue unificado para realizar associação baseada em similaridade e compensação de movimento sem depender de métricas complexas ou priores específicos de classe.

Lipeng Gu, Xuefeng Yan, Song Wang + 1 more2026-02-25💻 cs

Implementation of neural network operators with applications to remote sensing data

Este artigo apresenta dois algoritmos baseados em operadores de redes neurais multidimensionais ativados por funções sigmoidais tangente hiperbólica para modelagem e aprimoramento de dados de sensoriamento remoto, demonstrando, por meio de experimentos numéricos no conjunto de dados RETINA, que eles superam os métodos de interpolação clássicos, especialmente no Índice de Similaridade Estrutural (SSIM).

Danilo Costarelli, Michele Piconi2026-02-25💻 cs

Two Models for Surface Segmentation using the Total Variation of the Normal Vector

Este artigo propõe e compara duas abordagens variacionais para segmentação de superfícies em malhas triangulares, demonstrando que um regularizador baseado na variação total no espaço de rótulos, resolvido com um esquema de Newton em variedades para reduzir custos computacionais, oferece resultados superiores na remoção de ruído em regiões de curvatura constante.

Manuel Weiß, Lukas Baumgärtner, Laura Weigl + 3 more2026-02-25💻 cs

Revisiting the Generalization Problem of Low-level Vision Models Through the Lens of Image Deraining

Este artigo investiga as causas da falha de generalização em modelos de visão de baixo nível, identificando o "aprendizado de atalho" como o principal obstáculo e propondo estratégias para equilibrar a complexidade dos dados e utilizar priors de modelos generativos, com validação experimental em tarefas como remoção de chuva, ruído e desfoque.

Jinfan Hu, Zhiyuan You, Jinjin Gu + 3 more2026-02-25💻 cs

A deep learning framework for efficient pathology image analysis

O artigo apresenta o EAGLE, um novo framework de aprendizado profundo que utiliza modelos fundamentais para selecionar e analisar seletivamente regiões informativas em imagens de patologia, superando os métodos atuais em precisão e reduzindo o tempo de processamento em mais de 99%, o que viabiliza fluxos de trabalho em tempo real e torna a patologia assistida por IA mais acessível.

Peter Neidlinger, Tim Lenz, Sebastian Foersch + 24 more2026-02-25💻 cs