Stylos: Multi-View 3D Stylization with Single-Forward Gaussian Splatting

O artigo apresenta o Stylos, um framework inovador de transferência de estilo 3D baseado em Gaussian Splatting que gera cenas 3D estilizadas a partir de uma única passagem direta, sem necessidade de otimização por cena ou poses pré-computadas, garantindo consistência visual entre múltiplas vistas e preservação geométrica através de uma arquitetura Transformer com perda de estilo baseada em voxels.

Hanzhou Liu, Jia Huang, Mi Lu + 2 more2026-03-03💻 cs

Incomplete Multi-Label Image Recognition by Co-learning Semantic-Aware Features and Label Recovery

Este artigo propõe o framework CSL, uma abordagem unificada de co-aprendizado que supera os desafios do reconhecimento de imagens multi-rótulo com rótulos incompletos, integrando a extração de características semânticas robustas e a recuperação adaptativa de rótulos ausentes para alcançar desempenho superior em conjuntos de dados públicos.

Zhi-Fen He, Ren-Dong Xie, Bo Li + 2 more2026-03-03💻 cs

UniFlow: A Unified Pixel Flow Tokenizer for Visual Understanding and Generation

O artigo apresenta o UniFlow, um tokenizador visual unificado que supera o dilema entre compreensão e geração ao combinar auto-distilação adaptativa em camadas para herdar características semânticas robustas com um decodificador leve de fluxo de pixels que garante reconstrução de alta fidelidade, alcançando resultados superiores em diversas tarefas de entendimento e geração de imagens.

Zhengrong Yue, Haiyu Zhang, Xiangyu Zeng + 7 more2026-03-03💻 cs

Fly-CL: A Fly-Inspired Framework for Enhancing Efficient Decorrelation and Reduced Training Time in Pre-trained Model-based Continual Representation Learning

O artigo apresenta o Fly-CL, um framework bioinspirado no circuito olfativo de moscas que utiliza modelos pré-treinados quase congelados para resolver problemas de multicolinearidade na aprendizagem contínua, reduzindo significativamente o tempo de treinamento sem comprometer o desempenho.

Heming Zou, Yunliang Zang, Wutong Xu + 1 more2026-03-03🤖 cs.AI

Mono4DGS-HDR: High Dynamic Range 4D Gaussian Splatting from Alternating-exposure Monocular Videos

O artigo apresenta o Mono4DGS-HDR, um sistema pioneiro que utiliza uma abordagem de otimização em duas etapas baseada em Gaussian Splatting para reconstruir cenas 4D de alto alcance dinâmico (HDR) a partir de vídeos monoculares não calibrados com exposições alternadas, alcançando superioridade em qualidade e velocidade de renderização.

Jinfeng Liu, Lingtong Kong, Mi Zhou + 2 more2026-03-03💻 cs

BioCAP: Exploiting Synthetic Captions Beyond Labels in Biological Foundation Models

O artigo apresenta o BioCAP, um modelo fundamental biológico que utiliza legendas sintéticas geradas por modelos de linguagem multimodal para superar a escassez de descrições textuais específicas, melhorando assim a classificação de espécies e a recuperação de imagens ao alinhar características visuais e textuais em um espaço latente compartilhado.

Ziheng Zhang, Xinyue Ma, Arpita Chowdhury + 9 more2026-03-03💬 cs.CL