MC-INR: Efficient Encoding of Multivariate Scientific Simulation Data using Meta-Learning and Clustered Implicit Neural Representations

O artigo propõe o MC-INR, um novo framework baseado em redes neurais que utiliza meta-aprendizado e agrupamento dinâmico para codificar eficientemente dados de simulação científica multivariada em grades não estruturadas, superando as limitações das representações neurais implícitas existentes.

Hyunsoo Son, Jeonghyun Noh, Suemin Jeon + 2 more2026-03-04🤖 cs.LG

Zero-shot CT Super-Resolution using Diffusion-based 2D Projection Priors and Signed 3D Gaussians

Este trabalho propõe um novo framework de super-resolução zero-shot para tomografia computadorizada 3D que integra priores de projeção 2D baseados em difusão e uma técnica de splatting gaussiano com blendagem alfa negativa para reconstruir volumes de alta resolução a partir de entradas de baixa resolução sem necessidade de dados pareados.

Jeonghyun Noh, Hyun-Jic Oh, Won-Ki Jeong2026-03-04⚡ eess

Are VLMs Ready for Lane Topology Awareness in Autonomous Driving?

Este trabalho avalia sistematicamente a capacidade de Modelos Visão-Linguagem (VLMs) de compreender a topologia viária para condução autónoma, revelando que, apesar de alguns modelos proprietários alcançarem resultados moderados, tanto estes como os modelos de código aberto enfrentam dificuldades significativas em raciocínio espacial, indicando que esta competência permanece um gargalo fundamental.

Xin Chen, Jia He, Maozheng Li + 5 more2026-03-04💻 cs

Proxy-GS: Unified Occlusion Priors for Training and Inference in Structured 3D Gaussian Splatting

O Proxy-GS é um pipeline inovador que utiliza um sistema de proxy ultrarrápido para introduzir consciência de oclusão no treinamento e inferência de 3DGS estruturado, otimizando a eliminação de primitivas redundantes e a densificação para alcançar tanto maior velocidade de renderização quanto qualidade visual superior em cenas complexas.

Yuanyuan Gao, Yuning Gong, Yifei Liu + 6 more2026-03-04💻 cs

Arbitrary Generative Video Interpolation

O artigo apresenta o ArbInterp, um novo framework de interpolação generativa de vídeo que permite a síntese de quadros intermediários em qualquer timestamp e de qualquer duração, superando as limitações de rigidez dos métodos anteriores através de uma codificação posicional temporal adaptativa e uma estratégia de condicionamento que decopla aparência e movimento para garantir consistência e continuidade.

Guozhen Zhang, Haiguang Wang, Chunyu Wang + 3 more2026-03-04💻 cs

Reasoning as Representation: Rethinking Visual Reinforcement Learning in Image Quality Assessment

Este artigo demonstra que a capacidade de generalização de modelos de avaliação de qualidade de imagem baseados em raciocínio e aprendizado por reforço deriva da conversão de representações visuais redundantes em representações textuais compactas, propondo o algoritmo RALI que, ao alinhar diretamente imagens a essas representações textuais via aprendizado contrastivo, elimina a necessidade de processos de raciocínio e grandes modelos de linguagem, alcançando desempenho comparável com menos de 5% dos parâmetros e tempo de inferência.

Shijie Zhao, Xuanyu Zhang, Weiqi Li + 4 more2026-03-04💻 cs