Risk-Aware World Model Predictive Control for Generalizable End-to-End Autonomous Driving

O artigo apresenta o RaWMPC, um framework unificado de controle preditivo baseado em modelo de mundo que, ao prever consequências e avaliar riscos explicitamente sem depender de demonstrações de especialistas, permite que veículos autônomos tomem decisões seguras e generalizáveis em cenários raros ou fora da distribuição dos dados de treinamento.

Jiangxin Sun, Feng Xue, Teng Long + 4 more2026-02-27🤖 cs.AI

Decomposing Private Image Generation via Coarse-to-Fine Wavelet Modeling

Este trabalho propõe um framework de privacidade diferencial baseado em wavelets que finetuna um modelo em coeficientes de baixa frequência para capturar estruturas globais sensíveis e utiliza um modelo de super-resolução público para adicionar detalhes de alta frequência, alcançando um melhor equilíbrio entre privacidade e qualidade na geração de imagens.

Jasmine Bayrooti, Weiwei Kong, Natalia Ponomareva + 3 more2026-02-27💻 cs

LineGraph2Road: Structural Graph Reasoning on Line Graphs for Road Network Extraction

O artigo apresenta o LineGraph2Road, uma nova estrutura que melhora a extração de redes viárias a partir de imagens de satélite ao formular a previsão de conectividade como uma classificação binária em um grafo euclidiano esparsificado e aplicar um Transformer de Grafos sobre seu grafo de linhas para capturar dependências de longo alcance e topologias complexas, alcançando resultados state-of-the-art em métricas topológicas e de precisão.

Zhengyang Wei, Renzhi Jing, Yiyi He + 1 more2026-02-27💻 cs

PGVMS: A Prompt-Guided Unified Framework for Virtual Multiplex IHC Staining with Pathological Semantic Learning

O artigo apresenta o PGVMS, um quadro unificado guiado por prompts que supera desafios na coloração IHC virtual multiplexa ao empregar aprendizado semântico patológico, estratégias de aprendizado conscientes de proteínas e consistência de protótipos para gerar representações IHC precisas a partir de imagens H&E, mesmo utilizando apenas dados de treinamento uniplex.

Fuqiang Chen, Ranran Zhang, Wanming Hu + 6 more2026-02-27💻 cs

ManifoldGD: Training-Free Hierarchical Manifold Guidance for Diffusion-Based Dataset Distillation

O artigo apresenta o ManifoldGD, uma abordagem de distilação de dados livre de treinamento que utiliza um guia hierárquico baseado em variedades latentes para sintetizar conjuntos de dados compactos e representativos com alta fidelidade e diversidade, superando métodos existentes sem a necessidade de re-treinamento de modelos.

Ayush Roy, Wei-Yang Alex Lee, Rudrasis Chakraborty + 1 more2026-02-27🤖 cs.LG

Retrieve and Segment: Are a Few Examples Enough to Bridge the Supervision Gap in Open-Vocabulary Segmentation?

O artigo propõe uma abordagem de adaptação em tempo de teste baseada em recuperação e poucos exemplos que combina características textuais e visuais para reduzir significativamente a lacuna de desempenho entre a segmentação zero-shot e a supervisionada, mantendo a capacidade de segmentação de vocabulário aberto.

Tilemachos Aravanis, Vladan Stojnić, Bill Psomas + 2 more2026-02-27💻 cs

Scale Can't Overcome Pragmatics: The Impact of Reporting Bias on Vision-Language Reasoning

O estudo demonstra que o viés de relato nos dados de treinamento de Modelos Visuais-Linguísticos impede o desenvolvimento de habilidades de raciocínio (como espacial, temporal, negação e contagem), mostrando que o aumento de escala não supera essa limitação e que a curadoria intencional de dados com informações tácitas é essencial para corrigi-la.

Amita Kamath, Jack Hessel, Khyathi Chandu + 3 more2026-02-27💬 cs.CL

VGG-T3^3: Offline Feed-Forward 3D Reconstruction at Scale

O artigo apresenta o VGG-T3^3, um modelo de reconstrução 3D offline escalável que supera as limitações de custo computacional quadrático dos métodos existentes ao condensar a representação geométrica em um MLP de tamanho fixo via treinamento no momento do teste, permitindo uma reconstrução de grandes coleções de imagens com velocidade linear e alta precisão.

Sven Elflein, Ruilong Li, Sérgio Agostinho + 4 more2026-02-27💻 cs

Real-Time Motion Detection Using Dynamic Mode Decomposition

Este trabalho propõe um algoritmo simples e interpretável para detecção de movimento em vídeo em tempo real, fundamentado na Decomposição de Modo Dinâmico (DMD), que correlaciona a evolução de características de vídeo com os autovalores resultantes da aplicação do método a segmentos de vídeo, demonstrando sua eficácia em cenários de segurança através de curvas ROC e validação cruzada.

Marco Mignacca, Simone Brugiapaglia, Jason J. Bramburger2026-02-26💻 cs