UniCUE: Unified Recognition and Generation Framework for Chinese Cued Speech Video-to-Speech Generation

O artigo apresenta o UniCUE, um framework unificado pioneiro que gera fala diretamente a partir de vídeos de Linguagem de Sinais Visual (Cued Speech) em mandarim sem depender de texto intermediário, integrando tarefas de reconhecimento e geração para superar as limitações de pipelines existentes e validado com um novo conjunto de dados em larga escala.

Jinting Wang, Shan Yang, Chenxing Li + 2 more2026-03-03⚡ eess

Improving Wildlife Out-of-Distribution Detection: Africas Big Five

Este estudo demonstra que métodos baseados em características, especificamente o Nearest Class Mean (NCM) com recursos pré-treinados no ImageNet, superam os métodos de detecção de distribuição fora do padrão (OOD) existentes na identificação de animais da "Grande Cincão" africana, melhorando significativamente a capacidade de generalização e reduzindo a confiança excessiva em classes desconhecidas.

Mufhumudzi Muthivhi, Jiahao Huo, Fredrik Gustafsson + 1 more2026-03-03🤖 cs.AI

PD2^{2}GS: Part-Level Decoupling and Continuous Deformation of Articulated Objects via Gaussian Splatting

O artigo apresenta o PD2^{2}GS, um novo framework não supervisionado que utiliza Gaussian Splatting para realizar a reconstrução, o desacoplamento por partes e o controle contínuo de objetos articulados através de um campo gaussiano canônico compartilhado e deformações contínuas, superando métodos anteriores em precisão geométrica e cinemática e introduzindo o conjunto de dados RS-Art para avaliação em cenários reais.

Haowen Wang, Xiaoping Yuan, Zhao Jin + 6 more2026-03-03💻 cs

VITA: Zero-Shot Value Functions via Test-Time Adaptation of Vision-Language Models

O artigo apresenta o VITA, um método de aprendizado de funções de valor *zero-shot* que supera as limitações de raciocínio temporal e generalização dos Modelos Visão-Linguagem congelados através de adaptação em tempo de teste e amostragem baseada em dissimilaridade, demonstrando superioridade em tarefas de manipulação robótica e no aprendizado por reforço offline.

Christos Ziakas, Alessandra Russo2026-03-03🤖 cs.AI

NIC-RobustBench: A Comprehensive Open-Source Toolkit for Neural Image Compression and Robustness Analysis

Este artigo apresenta o NIC-RobustBench, um toolkit de código aberto que preenche uma lacuna na avaliação de robustez adversarial para compressão de imagem neural, oferecendo um framework abrangente para testar múltiplos ataques e defesas, analisar métricas de taxa-distorção e avaliar o impacto em tarefas subsequentes.

Georgii Bychkov, Khaled Abud, Egor Kovalev + 4 more2026-03-03⚡ eess

Consistency-Driven Calibration and Matching for Few-Shot Class-Incremental Learning

O artigo propõe o framework ConCM, que aborda o aprendizado incremental de classes com poucos exemplos através de uma calibração de protótipos baseada em memória e um ajuste dinâmico de estrutura, garantindo consistência de características e estrutura para superar conflitos de conhecimento e alcançar desempenho superior em benchmarks de grande escala.

Qinzhe Wang, Zixuan Chen, Keke Huang + 3 more2026-03-03🤖 cs.LG

Rethinking Visual Token Reduction in LVLMs Under Cross-Modal Misalignment

Este trabalho apresenta o VisionDrop, um método de redução de tokens visuais sem treinamento que supera as limitações da dependência de sinais textuais ao identificar e preservar tokens informativos exclusivamente com base na atenção intra-modal, resultando em ganhos significativos de eficiência computacional com mínima perda de desempenho em Modelos Visuais-Linguísticos.

Rui Xu, Yunke Wang, Yong Luo + 1 more2026-03-03💻 cs