Perception Characteristics Distance: Measuring Stability and Robustness of Perception System in Dynamic Conditions under a Certain Decision Rule

Este artigo apresenta a Distância de Características de Percepção (PCD), uma nova métrica que incorpora a incerteza dos modelos para avaliar a estabilidade e robustez de sistemas de direção autônoma em condições dinâmicas, validada através do novo conjunto de dados SensorRainFall que demonstra a superioridade da métrica sobre os métodos tradicionais em diferentes cenários climáticos e de iluminação.

Boyu Jiang, Liang Shi, Zhengzhi Lin + 3 more2026-02-24📊 stat

See-in-Pairs: Reference Image-Guided Comparative Vision-Language Models for Medical Diagnosis

Este trabalho demonstra que a incorporação de imagens de referência saudáveis e prompts comparativos em modelos de visão e linguagem médica, potencializada por um ajuste fino supervisionado leve, melhora significativamente o desempenho diagnóstico ao alinhar melhor as representações visuais e textuais e aumentar a eficiência amostral.

Ruinan Jin, Gexin Huang, Xinwei Shen + 3 more2026-02-24💻 cs

Modulate and Reconstruct: Learning Hyperspectral Imaging from Misaligned Smartphone Views

Este trabalho propõe um novo framework de reconstrução hiperespectral a partir de múltiplas imagens (MI-HSR) que utiliza um sistema de três câmeras de smartphone com filtros espectrais e um módulo de alinhamento leve para superar as limitações de abordagens de imagem única, resultando em estimativas espectrais 30% mais precisas e um aumento de 5% na qualidade de reconstrução, apoiado pelo lançamento do primeiro dataset específico para essa tarefa.

Daniil Reutsky, Daniil Vladimirov, Yasin Mamedov + 4 more2026-02-24💻 cs

Exploring Partial Multi-Label Learning via Integrating Semantic Co-occurrence Knowledge

Este artigo apresenta o SCINet, uma nova estrutura para aprendizado multirrotulado parcial que supera os métodos mais recentes ao integrar conhecimento semântico de co-ocorrência por meio de um prompter bi-dominante, um módulo de fusão cruzada e uma estratégia de aumento semântico intrínseco para lidar eficazmente com dados incompletamente anotados.

Xin Wu, Fei Teng, Yue Feng + 4 more2026-02-24🤖 cs.AI

Winsor-CAM: Human-Tunable Visual Explanations from Deep Networks via Layer-Wise Winsorization

O artigo apresenta o Winsor-CAM, um método eficiente e ajustável pelo usuário que gera explicações visuais robustas para redes neurais convolucionais ao agregar mapas de gradiente de todas as camadas e aplicar Winsorização percentilada para atenuar contribuições de outliers, superando consistentemente técnicas existentes em métricas de localização e fidelidade em tarefas de visão computacional e médica.

Casey Wall, Longwei Wang, Rodrigue Rizk + 1 more2026-02-24🤖 cs.AI

DEFNet: Multitasks-based Deep Evidential Fusion Network for Blind Image Quality Assessment

O artigo propõe o DEFNet, uma Rede de Fusão Profunda Baseada em Evidências Multitarefa que aprimora a Avaliação de Qualidade de Imagem Cega (BIQA) através da integração de tarefas auxiliares, uma estratégia de fusão de informações confiável e estimativa de incerteza avançada, demonstrando robustez e generalização em diversos conjuntos de dados.

Yiwei Lou, Yuanpeng He, Rongchao Zhang + 3 more2026-02-24⚡ eess

Decoding Tourist Perception in Historic Urban Quarters with Multimodal Social Media Data: An AI-Based Framework and Evidence from Shanghai

Este estudo propõe um quadro baseado em IA que integra dados multimodais de mídia social para decodificar a percepção turística em bairros históricos de Xangai, revelando lacunas entre a realidade física e a representação visual online para orientar o planejamento urbano e a gestão do patrimônio.

Kaizhen Tan, Yufan Wu, Yuxuan Liu + 1 more2026-02-24🤖 cs.AI

Modelling and analysis of the 8 filters from the "master key filters hypothesis" for depthwise-separable deep networks in relation to idealized receptive fields based on scale-space theory

Este artigo demonstra que os filtros aprendidos em redes profundas separáveis por profundidade, baseadas na arquitetura ConvNeXt, podem ser efetivamente modelados e substituídos por filtros de espaço de escala discretos idealizados, derivados de operadores de diferença aplicados a kernels gaussianos, mantendo propriedades preditivas comparáveis.

Tony Lindeberg, Zahra Babaiee, Peyman M. Kiasari2026-02-24💻 cs

Unleashing the Power of Discrete-Time State Representation: Ultrafast Target-based IMU-Camera Spatial-Temporal Calibration

Este artigo propõe um método de calibração espacial-temporal IMU-câmera ultra-rápido e eficiente que substitui a representação de estado contínua tradicional por uma representação de tempo discreto, superando as limitações computacionais e de calibração temporal para viabilizar a calibração em massa de plataformas visuais-inerciais.

Junlin Song, Antoine Richard, Miguel Olivares-Mendez2026-02-24💻 cs

RangeSAM: On the Potential of Visual Foundation Models for Range-View represented LiDAR segmentation

O artigo apresenta o RangeSAM, o primeiro framework que adapta o modelo de fundação visual SAM2 para a segmentação de nuvens de pontos LiDAR em visão de alcance, alcançando desempenho competitivo no SemanticKITTI com alta eficiência computacional ao explorar modificações arquitetônicas específicas para as propriedades geométricas das projeções esféricas.

Paul Julius Kühn, Duc Anh Nguyen, Arjan Kuijper + 1 more2026-02-24💻 cs

Comparing and Integrating Different Notions of Representational Correspondence in Neural Systems

Este artigo avalia e integra múltiplas métricas de similaridade representacional em sistemas neurais biológicos e artificiais, demonstrando que a fusão de grafos de similaridade (via Similarity Network Fusion) supera medidas individuais ao revelar com maior clareza a estrutura hierárquica do processamento visual e as relações entre famílias de modelos.

Jialin Wu, Shreya Saha, Yiqing Bo + 1 more2026-02-24🤖 cs.AI