EntON: Eigenentropy-Optimized Neighborhood Densification in 3D Gaussian Splatting

O artigo apresenta o EntON, uma estratégia inovadora de densificação de vizinhança otimizada por Entropia Eigen em 3D Gaussian Splatting que utiliza características geométricas locais para alternar entre refinamento baseado em gradiente e densificação consciente da estrutura, resultando em reconstruções 3D com maior precisão geométrica e qualidade de renderização, ao mesmo tempo que reduz o número de Gaussianas e o tempo de treinamento.

Miriam Jäger, Boris Jutzi2026-03-09💻 cs

Low-latency Event-based Object Detection with Spatially-Sparse Linear Attention

O artigo propõe o SSLA-Det, um modelo de detecção de objetos baseado em eventos que utiliza a atenção linear espacialmente esparsa (SSLA) para superar os gargalos de treinamento e eficiência das abordagens assíncronas existentes, alcançando estado da arte em precisão enquanto reduz a computação por evento em mais de 20 vezes.

Haiqing Hao, Zhipeng Sui, Rong Zou, Zijia Dai, Nikola Zubic, Davide Scaramuzza, Wenhui Wang2026-03-09💻 cs

TaPD: Temporal-adaptive Progressive Distillation for Observation-Adaptive Trajectory Forecasting in Autonomous Driving

O artigo apresenta o TaPD, um framework unificado e plug-and-play que utiliza destilação de conhecimento progressiva e um módulo de preenchimento temporal para melhorar significativamente a previsão de trajetórias em veículos autônomos, especialmente em cenários com históricos de observação variáveis ou extremamente curtos.

Mingyu Fan, Yi Liu, Hao Zhou, Deheng Qian, Mohammad Haziq Khan, Matthias Raetsch2026-03-09🤖 cs.AI

GazeMoE: Perception of Gaze Target with Mixture-of-Experts

O artigo apresenta o GazeMoE, um novo framework end-to-end que utiliza módulos de Mistura de Especialistas (MoE) para selecionar adaptativamente pistas de um modelo de fundação congelado e estimar com estado da arte o alvo do olhar humano, abordando desafios como desequilíbrio de classes e a necessidade de integrar múltiplas pistas multimodais.

Zhuangzhuang Dai, Zhongxi Lu, Vincent G. Zakka, Luis J. Manso, Jose M Alcaraz Calero, Chen Li2026-03-09🤖 cs.AI

HiPP-Prune: Hierarchical Preference-Conditioned Structured Pruning for Vision-Language Models

O artigo apresenta o HiPP-Prune, um framework de poda estruturada hierárquica para modelos visão-linguagem que utiliza otimização de política baseada em preferências do usuário para gerenciar o trade-off entre eficiência, utilidade da tarefa e robustez contra alucinações, preservando a sensibilidade visual crítica durante a compressão.

Lincen Bai, Hedi Tabia, Raul Santos-Rodriguez2026-03-09🤖 cs.AI

Spectral and Trajectory Regularization for Diffusion Transformer Super-Resolution

O artigo apresenta o StrSR, um novo framework de destilação adversarial em um único passo que utiliza regularização espectral e de trajetória para superar as limitações de distorções periódicas e incompatibilidade de trajetórias nos modelos Diffusion Transformer, alcançando desempenho de ponta em super-resolução de imagens do mundo real.

Jingkai Wang, Yixin Tang, Jue Gong, Jiatong Li, Shu Li, Libo Liu, Jianliang Lan, Yutong Liu, Yulun Zhang2026-03-09💻 cs

3D CBCT Artefact Removal Using Perpendicular Score-Based Diffusion Models

Este artigo propõe um método inovador de remoção de artefatos em imagens 3D de CBCT dentário, utilizando modelos de difusão baseados em pontuação perpendicular que operam no domínio das projeções para preservar as correlações espaciais e gerar reconstruções de alta qualidade.

Susanne Schaub, Florentin Bieder, Matheus L. Oliveira, Yulan Wang, Dorothea Dagassan-Berndt, Michael M. Bornstein, Philippe C. Cattin2026-03-09🤖 cs.LG

DEX-AR: A Dynamic Explainability Method for Autoregressive Vision-Language Models

O artigo apresenta o DEX-AR, um novo método de explicabilidade dinâmica para modelos de linguagem e visão autoregressivos que gera mapas de calor 2D para interpretar a geração de tokens, distinguindo entre informações visuais e linguísticas por meio de filtragem dinâmica de cabeças de atenção e agregação em nível de sequência.

Walid Bousselham, Angie Boggust, Hendrik Strobelt, Hilde Kuehne2026-03-09🤖 cs.AI

Latent Transfer Attack: Adversarial Examples via Generative Latent Spaces

O artigo propõe o LTA (Latent Transfer Attack), um método de ataque adversarial que otimiza perturbações no espaço latente de um VAE do Stable Diffusion em vez do espaço de pixels, resultando em exemplos mais robustos, de baixa frequência e com maior capacidade de transferência entre diferentes arquiteturas de modelos de visão computacional.

Eitan Shaar, Ariel Shaulov, Yalcin Tur, Gal Chechik, Ravid Shwartz-Ziv2026-03-09💻 cs