Exploring Interpretability for Visual Prompt Tuning with Cross-layer Concepts

Este artigo apresenta o Interpretable Visual Prompt Tuning (IVPT), um novo framework que introduz protótipos de conceitos entre camadas para vincular prompts visuais a conceitos semânticos compreensíveis por humanos, permitindo a geração de prompts interpretáveis em múltiplas profundidades da rede e demonstrando superioridade em desempenho e interpretabilidade em benchmarks de classificação de granularidade fina.

Yubin Wang, Xinyang Jiang, De Cheng + 4 more2026-02-24💻 cs

Hier-COS: Making Deep Features Hierarchy-aware via Composition of Orthogonal Subspaces

Este artigo apresenta o Hier-COS, um novo framework que utiliza a composição de subespaços ortogonais para criar representações de características hierarquicamente conscientes e consistentes, superando as limitações das métricas de avaliação existentes através da proposta do HOPS e alcançando desempenho superior em tarefas de classificação hierárquica.

Depanshu Sani, Saket Anand2026-02-24🤖 cs.LG

SphOR: A Representation Learning Perspective on Open-set Recognition for Identifying Unknown Classes in Deep Learning Models

O artigo propõe o SpHOR, uma abordagem de aprendizado de representação supervisionada que, ao empregar embeddings de rótulos ortogonais, restrições esféricas e técnicas de regularização como Mixup e Label Smoothing, melhora significativamente a separabilidade angular e de norma para alcançar resultados de ponta na Reconhecimento de Conjunto Aberto (OSR).

Nadarasar Bahavan, Sachith Seneviratne, Saman Halgamuge2026-02-24💻 cs

Can Vision-Language Models Answer Face to Face Questions in the Real-World?

Este trabalho apresenta o novo conjunto de dados e benchmark Qualcomm Interactive Video Dataset (IVD) para avaliar a capacidade de modelos de visão e linguagem de responder a perguntas em tempo real sobre cenas do mundo vivo, demonstrando que, embora os modelos atuais fiquem muito aquém do desempenho humano, o ajuste fino com esses dados pode reduzir significativamente essa lacuna em diversas habilidades perceptivas.

Reza Pourreza, Rishit Dagli, Apratim Bhattacharyya + 3 more2026-02-24💻 cs

Learn by Reasoning: Analogical Weight Generation for Few-Shot Class-Incremental Learning

Este artigo propõe um novo método de geração de pesos analógicos inspirado no cérebro humano, denominado BiAG, que utiliza atenção de auto-peso, analogia entre pesos e protótipos, e conversão semântica baseada na teoria do Colapso Neural para gerar pesos de novas classes em cenários de Aprendizado Incremental de Classe com Poucos Exemplos (FSCIL) sem ajuste fino de parâmetros, alcançando desempenho superior ao estado da arte em diversos conjuntos de dados.

Jizhou Han, Chenhao Ding, Yuhang He + 4 more2026-02-24🤖 cs.AI

Feature Representation Transferring to Lightweight Models via Perception Coherence

Este artigo propõe um método de transferência de representação de recursos para modelos leves baseado no conceito de "coerência de percepção", que utiliza um novo função de perda probabilística para alinhar as classificações de dissimilaridade dos dados entre o professor e o aluno, permitindo que o modelo menor aprenda a percepção global do professor sem precisar preservar sua geometria absoluta.

Hai-Vy Nguyen, Fabrice Gamboa, Sixin Zhang + 3 more2026-02-24📊 stat