Training-Free Multi-Concept Image Editing

O artigo apresenta o Concept Distillation Sampling (CDS), um framework unificado e sem necessidade de treinamento que supera as limitações linguísticas de métodos anteriores para permitir a edição de imagens com múltiplos conceitos, preservando a fidelidade da identidade e detalhes intrincados através da integração de um backbone de destilação estável e mecanismos de ponderação dinâmica.

Niki Foteinopoulou, Ignas Budvytis, Stephan Liwicki2026-03-04💻 cs

Uni-Animator: Towards Unified Visual Colorization

O artigo apresenta o Uni-Animator, um novo framework baseado em Diffusion Transformer que unifica a colorização de esboços em imagens e vídeos, superando limitações anteriores na transferência de cor, preservação de detalhes físicos e coerência temporal através de técnicas inovadoras como incorporação de patches de referência, reforço de detalhes físicos e codificação dinâmica RoPE baseada em esboços.

Xinyuan Chen, Yao Xu, Shaowen Wang + 2 more2026-03-04💻 cs

A Novel Evolutionary Method for Automated Skull-Face Overlay in Computer-Aided Craniofacial Superimposition

Este artigo apresenta o Lilium, um método evolutivo automatizado que aprimora a sobreposição crânio-facial na identificação forense ao modelar a variabilidade dos tecidos moles e otimizar parâmetros por meio de um algoritmo de evolução diferencial, superando assim os métodos atuais em precisão e robustez.

Práxedes Martínez-Moreno, Andrea Valsecchi, Pablo Mesejo + 3 more2026-03-04🤖 cs.AI

GLIDE-Reg: Global-to-Local Deformable Registration Using Co-Optimized Foundation and Handcrafted Features

O artigo apresenta o GLIDE-Reg, um método de registro deformável que combina características semânticas globais de fundação com descritores locais artesanais para superar a falta de robustez e generalização em diferentes resoluções e coberturas anatômicas, alcançando desempenho superior ao estado da arte em múltiplos conjuntos de dados de imagens médicas.

Yunzheng Zhu, Aichi Chien, Kimaya kulkarni + 5 more2026-03-04⚡ eess

ShiftLUT: Spatial Shift Enhanced Look-Up Tables for Efficient Image Restoration

O artigo apresenta o ShiftLUT, um novo framework para restauração de imagens que combina um módulo de deslocamento espacial aprendível, uma arquitetura assimétrica de duplo ramo e uma estratégia de compressão de LUT para alcançar o maior campo receptivo entre métodos baseados em LUT, superando o estado da arte em desempenho e eficiência sem aumentar significativamente o custo computacional ou de armazenamento.

Xiaolong Zeng, Yitong Yu, Shiyao Xiong + 4 more2026-03-04💻 cs

Learning to Weigh Waste: A Physics-Informed Multimodal Fusion Framework and Large-Scale Dataset for Commercial and Industrial Applications

Este artigo apresenta o framework Multimodal Weight Predictor (MWP) e o conjunto de dados Waste-Weight-10K, que combinam imagens RGB com metadados físicos para estimar com precisão o peso de resíduos industriais e comerciais, alcançando alta acurácia e fornecendo explicações interpretáveis por meio de IA.

Md. Adnanul Islam, Wasimul Karim, Md Mahbub Alam + 7 more2026-03-04💻 cs