PolGS++: Physically-Guided Polarimetric Gaussian Splatting for Fast Reflective Surface Reconstruction

O artigo apresenta o PolGS++, um framework de Splatting Gaussiano polarimétrico guiado por física que integra um modelo pBRDF e uma máscara de visibilidade guiada por profundidade para reconstruir com alta eficiência e qualidade superfícies reflexivas, decoplando componentes difusos e especulares sem a necessidade de interseções de rastreamento de raios custosas.

Yufei Han, Chu Zhou, Youwei Lyu, Qi Chen, Si Li, Boxin Shi, Yunpeng Jia, Heng Guo, Zhanyu Ma2026-03-12💻 cs

HanMoVLM: Large Vision-Language Models for Professional Artistic Painting Evaluation

O artigo apresenta o HanMoVLM, um modelo de linguagem e visão de grande escala especializado na avaliação profissional de pinturas chinesas, que utiliza raciocínio passo a passo validado por especialistas e uma função de recompensa para superar a cegueira artística de modelos existentes e servir como verificador de alta qualidade para aprimorar a geração de imagens.

Hongji Yang, Yucheng Zhou, Wencheng Han, Songlian Li, Xiaotong Zhao, Jianbing Shen2026-03-12💻 cs

Human Presence Detection via Wi-Fi Range-Filtered Doppler Spectrum on Commodity Laptops

Este artigo apresenta a primeira solução de detecção de presença humana em laptops comerciais que utiliza exclusivamente o hardware Wi-Fi embutido, empregando uma nova técnica de Espectro Doppler Filtrado por Alcance (RF-DS) e um framework de processamento adaptativo para identificar usuários com baixo custo computacional, sem necessidade de sensores externos, infraestrutura de rede adicional ou preocupações com privacidade.

Jessica Sanson, Rahul C. Shah, Valerio Frascolla2026-03-12⚡ eess

UltrasoundAgents: Hierarchical Multi-Agent Evidence-Chain Reasoning for Breast Ultrasound Diagnosis

O artigo apresenta o UltrasoundAgents, um quadro hierárquico de agentes múltiplos que simula o fluxo de trabalho clínico no diagnóstico de ultrassom mamário, utilizando uma estratégia de treinamento progressivo para localizar lesões, analisar atributos específicos e realizar raciocínio baseado em evidências para prever categorias BI-RADS e malignidade com maior rastreabilidade e precisão.

Yali Zhu, Kang Zhou, Dingbang Wu, Gaofeng Meng2026-03-12💻 cs

Beyond Sequential Distance: Inter-Modal Distance Invariant Position Encoding

O artigo propõe o DIPE, um mecanismo de codificação de posição invariante à distância inter-modal que mitiga o desvanecimento visual em cenários de longo contexto ao preservar a proximidade perceptiva entre tokens visuais e textuais, garantindo uma ancoragem visual estável sem comprometer o desempenho em tarefas de curto contexto.

Lin Chen, Bolin Ni, Qi Yang, Zili Wang, Kun Ding, Ying Wang, Houwen Peng, Shiming Xiang2026-03-12💻 cs

Lifelong Imitation Learning with Multimodal Latent Replay and Incremental Adjustment

Este artigo apresenta um framework de aprendizado por imitação para toda a vida que utiliza replay latente multimodal e ajuste incremental de recursos para refinar continuamente políticas em tarefas sequenciais, estabelecendo novos recordes nos benchmarks LIBERO com ganhos significativos de desempenho e redução do esquecimento.

Fanqi Yu, Matteo Tiezzi, Tommaso Apicella, Cigdem Beyan, Vittorio Murino2026-03-12💻 cs

Bridging the Skill Gap in Clinical CBCT Interpretation with CBCTRepD

O artigo apresenta o CBCTRepD, um sistema de IA generativa bilíngue que, ao ser treinado em um grande conjunto de dados de CBCT oral, demonstra melhorar significativamente a qualidade, a padronização e a precisão clínica dos laudos radiológicos, atuando como uma ferramenta eficaz para reduzir erros de omissão e elevar o desempenho de radiologistas em todos os níveis de experiência.

Qinxin Wu, Fucheng Niu, Hengchuan Zhu, Yifan Sun, Ye Shen, Xu Li, Han Wu, Leqi Liu, Zhiwen Pan, Zuozhu Liu, Fudong Zhu, Bin Feng2026-03-12💻 cs

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Este artigo propõe o "Historical Consensus Training", um método iterativo que utiliza múltiplas clusterizações de modelos de mistura gaussiana para criar uma barreira histórica no espaço de parâmetros, eliminando permanentemente o colapso posterior em autoencoders variacionais sem depender de restrições arquiteturais ou ajuste de hiperparâmetros.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Med-DualLoRA: Local Adaptation of Foundation Models for 3D Cardiac MRI

O artigo apresenta o Med-DualLoRA, um framework de ajuste fino federado e eficiente em parâmetros para modelos de fundação em RM cardíaca 3D, que utiliza adaptações LoRA locais e globais para preservar a privacidade dos dados, reduzir custos de comunicação e melhorar o desempenho em ambientes multi-centro heterogêneos.

Joan Perramon-Llussà, Amelia Jiménez-Sánchez, Grzegorz Skorupko, Fotis Avgoustidis, Carlos Martín-Isla, Karim Lekadir, Polyxeni Gkontra2026-03-12💻 cs