Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering

Este artigo apresenta o Semantically Decoupled Latent Steering (SDLS), um método de controle sem treinamento que utiliza decomposição semântica e ortogonalização baseada em QR para suprir alucinações de comparação prévia na geração de laudos radiológicos, melhorando a fidelidade clínica sem comprometer a integridade narrativa.

Ao Li, Rui Liu, Mingjie Li + 6 more2026-03-02💻 cs

Any Model, Any Place, Any Time: Get Remote Sensing Foundation Model Embeddings On Demand

O artigo apresenta o rs-embed, uma biblioteca Python que unifica o acesso a embeddings de modelos fundamentais de sensoriamento remoto, permitindo a extração sob demanda de dados para qualquer local e período com uma única linha de código, superando assim as barreiras de heterogeneidade e facilitando comparações justas e processamento em larga escala.

Dingqi Ye, Daniel Kiv, Wei Hu + 2 more2026-03-02🤖 cs.LG

HiDrop: Hierarchical Vision Token Reduction in MLLMs via Late Injection, Concave Pyramid Pruning, and Early Exit

O HiDrop é um framework inovador para Multimodal Large Language Models (MLLMs) que reduz em cerca de 90% os tokens visuais e acelera o treinamento em 1,72 vezes, alinhando a poda dinâmica de tokens à função hierárquica das camadas do modelo por meio de injeção tardia, poda piramidal côncava e saída antecipada, sem comprometer o desempenho.

Hao Wu, Yingqi Fan, Jinyang Dai + 3 more2026-03-02💬 cs.CL

Can Unified Generation and Understanding Models Maintain Semantic Equivalence Across Different Output Modalities?

Este trabalho introduz o VGUBench para demonstrar que, embora os Modelos de Linguagem Multimodal Unificados (U-MLLMs) apresentem raciocínio textual robusto e fidelidade de renderização, eles falham em manter a equivalência semântica ao gerar respostas visuais, revelando uma ruptura na alinhamento semântico entre modalidades em vez de uma deficiência na capacidade de geração.

Hongbo Jiang, Jie Li, Yunhang Shen + 4 more2026-03-02💻 cs

UTPTrack: Towards Simple and Unified Token Pruning for Visual Tracking

O UTPTrack é um novo framework unificado de poda de tokens que, ao comprimir conjuntamente as regiões de busca e os modelos estáticos e dinâmicos por meio de uma estratégia guiada por atenção, alcança um estado da arte em eficiência e precisão para rastreamento visual em tempo real, mantendo ou até superando o desempenho de base enquanto reduz significativamente o custo computacional.

Hao Wu, Xudong Wang, Jialiang Zhang + 5 more2026-03-02💬 cs.CL

Unsupervised Causal Prototypical Networks for De-biased Interpretable Dermoscopy Diagnosis

O artigo apresenta o CausalProto, uma Rede Prototípica Causal Não Supervisionada que utiliza um Modelo Causal Estrutural e um gargalo de informação para desconectar características patológicas de confusores ambientais em imagens de dermatoscopia, permitindo diagnósticos mais precisos, interpretáveis e livres de viés sem comprometer a acurácia.

Junhao Jia, Yueyi Wu, Huangwei Chen + 4 more2026-03-02⚡ eess

OPTIAGENT: A Physics-Driven Agentic Framework for Automated Optical Design

O artigo apresenta o OPTIAGENT, um quadro de trabalho agênico baseado em LLMs que, ao utilizar um conjunto de dados especializado, otimização de política orientada por recompensas físicas e integração com rotinas de otimização óptica, permite que usuários sem formação especializada projetem sistemas de lentes funcionais com desempenho superior aos métodos tradicionais.

Yuyu Geng, Lei Sun, Yao Gao + 6 more2026-03-02🤖 cs.LG

VideoPulse: Neonatal heart rate and peripheral capillary oxygen saturation (SpO2) estimation from contact free video

O artigo apresenta o VideoPulse, um novo conjunto de dados e uma pipeline de aprendizado profundo que permitem a estimativa precisa da frequência cardíaca e da saturação de oxigênio (SpO2) em neonatos a partir de vídeos faciais sem contato, oferecendo uma solução não invasiva e de baixo custo para monitoramento em unidades de terapia intensiva neonatal.

Deependra Dewagiri, Kamesh Anuradha, Pabadhi Liyanage + 6 more2026-03-02⚡ eess