Class Visualizations and Activation Atlases for Enhancing Interpretability in Deep Learning-Based Computational Pathology

Este artigo avalia sistematicamente visualizações de classe e atlas de ativação em modelos baseados em transformadores para patologia computacional, demonstrando que, embora essas técnicas revelem estruturas morfológicas coerentes em níveis de tecido e grupos amplos de câncer, sua eficácia diminui em subclasses sobrepostas, refletindo a complexidade intrínseca das representações aprendidas e a variabilidade entre especialistas.

Marco Gustav, Fabian Wolf, Christina Glasner, Nic G. Reitsam, Stefan Schulz, Kira Aschenbroich, Bruno Märkl, Sebastian Foersch, Jakob Nikolas Kather2026-03-10💻 cs

FabricGen: Microstructure-Aware Woven Fabric Generation

O artigo apresenta o FabricGen, um framework end-to-end que gera materiais de tecidos realistas a partir de descrições textuais, decompondo o processo na criação de texturas macro-escalares via modelos de difusão e na síntese de padrões de tecelagem micro-escalares guiados por um modelo de linguagem especializado (WeavingLLM) que respeita os princípios da tecelagem.

Yingjie Tang, Di Luo, Zixiong Wang, Xiaoli Ling, jian Yang, Beibei Wang2026-03-10💻 cs

Variational Flow Maps: Make Some Noise for One-Step Conditional Generation

O artigo apresenta as Variational Flow Maps (VFMs), um novo framework que permite a geração condicional de imagens de alta qualidade em um único passo ao aprender uma distribuição de ruído adaptada via um modelo de adaptador, superando as limitações de trajetórias iterativas dos modelos de difusão tradicionais para resolver problemas inversos e condicionais com maior eficiência.

Abbas Mammadov, So Takao, Bohan Chen, Ricardo Baptista, Morteza Mardani, Yee Whye Teh, Julius Berner2026-03-10🤖 cs.LG

Virtual Try-On for Cultural Clothing: A Benchmarking Study

Este artigo apresenta o BD-VITON, um novo conjunto de dados focado em vestuário cultural bengali (como sarees, panjabis e salwar kameez) para superar as limitações de generalização dos sistemas atuais de "virtual try-on" em relação a roupas não ocidentais, além de estabelecer e avaliar baselines robustas para modelos como StableViton, HR-VITON e VITON-HD nesse contexto.

Muhammad Tausif Ul Islam, Shahir Awlad, Sameen Yeaser Adib, Md. Atiqur Rahman, Sabbir Ahmed, Md. Hasanul Kabir2026-03-10💻 cs

MAviS: A Multimodal Conversational Assistant For Avian Species

O artigo apresenta o MAviS, um assistente conversacional multimodal especializado em aves, composto pelo conjunto de dados MAviS-Dataset, pelo modelo MAviS-Chat e pelo benchmark MAviS-Bench, que juntos superam os modelos de base existentes ao oferecer compreensão detalhada e respostas precisas para mais de 1.000 espécies de aves, integrando áudio, visão e texto para aplicações em conservação da biodiversidade.

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models

O artigo apresenta o StructSAM, um framework de fusão e recuperação de tokens que preserva a estrutura e o espectro para otimizar os modelos Segment Anything (SAM), reduzindo significativamente o custo computacional sem comprometer a precisão nas bordas e nas regiões de prompt.

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

Faster-HEAL: An Efficient and Privacy-Preserving Collaborative Perception Framework for Heterogeneous Autonomous Vehicles

O artigo apresenta o Faster-HEAL, um framework colaborativo leve e que preserva a privacidade, capaz de alinhar eficientemente características de veículos autônomos heterogêneos em um espaço unificado por meio de prompts visuais de baixo rank e fusão em pirâmide, superando as limitações de métodos anteriores sem a necessidade de retreinar modelos completos.

Armin Maleki, Hayder Radha2026-03-10💻 cs

A Lightweight Digital-Twin-Based Framework for Edge-Assisted Vehicle Tracking and Collision Prediction

Este artigo apresenta um framework leve baseado em gêmeo digital para rastreamento de veículos e previsão de colisões em sistemas de transporte inteligentes, que utiliza apenas detecção de objetos e mapas de trajetória pré-construídos para alcançar alta precisão com baixo custo computacional em dispositivos de borda.

Murat Arda Onsu, Poonam Lohan, Burak Kantarci, Aisha Syed, Matthew Andrews, Sean Kennedy2026-03-10💻 cs