Joint Post-Training Quantization of Vision Transformers with Learned Prompt-Guided Data Generation

Este trabalho apresenta um framework de quantização pós-treinamento conjunta para Vision Transformers que, sem utilizar dados rotulados, otimiza todas as camadas simultaneamente e emprega uma estratégia de geração de dados livre de rótulos guiada por prompts aprendidos via Stable Diffusion Turbo, alcançando resultados state-of-the-art em configurações de baixo bit e superando métodos anteriores.

Shile Li, Markus Karmann, Onay Urfalioglu2026-02-24💻 cs

TIACam: Text-Anchored Invariant Feature Learning with Auto-Augmentation for Camera-Robust Zero-Watermarking

O artigo apresenta o TIACam, um framework inovador de marcação zero robusta a câmeras que combina um aumentador automático aprendível, alinhamento adversarial entre imagem e texto para consistência semântica e uma cabeça de marcação que vincula mensagens binárias em um espaço de características invariantes, superando assim as complexas degradações ópticas introduzidas pela recaptura por câmera.

Abdullah All Tanvir, Agnibh Dasgupta, Xin Zhong2026-02-24⚡ eess

Structure-Level Disentangled Diffusion for Few-Shot Chinese Font Generation

O artigo apresenta o SLD-Font, um modelo de difusão que realiza o desentrelaçamento no nível estrutural para gerar fontes chinesas com poucos exemplos, garantindo alta fidelidade estilística e precisão de conteúdo através de canais separados, atenção cruzada baseada em CLIP, remoção de ruído de fundo e uma estratégia de ajuste fino eficiente em parâmetros.

Jie Li, Suorong Yang, Jian Zhao + 1 more2026-02-24🤖 cs.AI

Characterization of Residual Morphological Substructure Using Supervised and Unsupervised Deep Learning

Este estudo avalia a aplicação de redes neurais convolucionais supervisionadas e autoencoders variacionais convolucionais não supervisionados na caracterização de subestruturas morfológicas residuais em imagens de galáxias do CANDELS, demonstrando que os recursos latentes do modelo supervisionado correlacionam-se eficazmente com métricas quantitativas de força residual, enquanto o modelo não supervisionado apresenta poder discriminatório limitado.

Kameswara Bharadwaj Mantha, Daniel H. McIntosh, Cody Ciaschi + 9 more2026-02-24🔭 astro-ph

PrivacyBench: Privacy Isn't Free in Hybrid Privacy-Preserving Vision Systems

O artigo apresenta o PrivacyBench, um framework de benchmarking que revela como a combinação arbitrária de técnicas de privacidade em sistemas de visão híbridos pode levar a falhas catastróficas de convergência e custos elevados, fornecendo diretrizes sistemáticas para avaliar trade-offs entre privacidade, utilidade e custo antes da implantação.

Nnaemeka Obiefuna, Samuel Oyeneye, Similoluwa Odunaiya + 2 more2026-02-24💻 cs

SCHEMA for Gemini 3 Pro Image: A Structured Methodology for Controlled AI Image Generation on Google's Native Multimodal Model

Este artigo apresenta o SCHEMA, uma metodologia de engenharia de prompts estruturada e validada empiricamente para o modelo Google Gemini 3 Pro Image, que utiliza um sistema progressivo de três níveis e componentes modulares para garantir alta conformidade, coerência e controle preciso na geração de imagens em seis domínios profissionais.

Luca Cazzaniga2026-02-24💻 cs