FeatureGS: Eigenvalue-Feature Optimization in 3D Gaussian Splatting for Geometrically Accurate and Artifact-Reduced Reconstruction

O artigo apresenta o FeatureGS, um método que aprimora a reconstrução 3D por Splatting Gaussiano ao introduzir uma função de perda geométrica baseada em autovalores, resultando em maior precisão geométrica, redução drástica de artefatos flutuantes e menor uso de memória, permitindo o uso direto dos centros dos Gaussianos para representação geométrica.

Miriam Jäger, Markus Hillemann, Boris Jutzi2026-03-09💻 cs

PoI: A Filter to Extract Pixel of Interest from Novel Views for Scene Coordinate Regression

O artigo apresenta o PoI (Pixel-of-Interest), um quadro que aprimora a regressão de coordenadas da cena para localização visual ao combinar a síntese de novas vistas refinada por difusão com uma estratégia progressiva de filtragem de pixels baseada em erro de reprojeção, garantindo assim a confiabilidade dos dados sintéticos e alcançando desempenho superior em benchmarks padrão.

Feifei Li, Qi Song, Chi Zhang, Hui Shuai, Rui Huang2026-03-09💻 cs

{\lambda}Scale: Enabling Fast Scaling for Serverless Large Language Model Inference

O artigo apresenta o {\lambda}Scale, um sistema de inferência serverless para grandes modelos de linguagem que utiliza redes RDMA de alta velocidade e a técnica "execute-while-load" para acelerar o dimensionamento de modelos, reduzindo a latência e os custos em comparação com soluções existentes.

Minchen Yu, Rui Yang, Chaobo Jia, Zhaoyuan Su, Sheng Yao, Tingfeng Lan, Yuchen Yang, Zirui Wang, Yue Cheng, Wei Wang, Ao Wang, Ruichuan Chen2026-03-09💻 cs

Escaping The Big Data Paradigm in Self-Supervised Representation Learning

Este artigo apresenta o SCOTT, uma arquitetura de tokenização rasa que combina viéses convolucionais com uma estrutura MIM-JEPA, permitindo que modelos Vision Transformers aprendam representações robustas a partir de zero em regimes de dados escassos, desafiando a necessidade de grandes conjuntos de dados e recursos computacionais massivos para aprendizado de representação em visão computacional.

Carlos Vélez García, Miguel Cazorla, Jorge Pomares2026-03-09💻 cs

Whole-Body Model-Predictive Control of Legged Robots with MuJoCo

Este artigo demonstra que uma abordagem simples de controle preditivo de modelo (MPC) baseada no algoritmo iLQR e no MuJoCo é surpreendentemente eficaz no mundo real, permitindo a generalização de políticas de locomoção e manipulação para robôs quadrúpedes e humanoides com poucas considerações de simulação para realidade.

John Z. Zhang, Taylor A. Howell, Zeji Yi, Chaoyi Pan, Guanya Shi, Guannan Qu, Tom Erez, Yuval Tassa, Zachary Manchester2026-03-09💻 cs

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

O artigo apresenta o ECLARE, um método de super-resolução auto-supervisionado que melhora a resolução de volumes de ressonância magnética anisotrópica ao estimar o perfil da fatia e aprender mapeamentos intra-volumes, superando métodos existentes em recuperação de sinal e tarefas subsequentes sem sofrer de deslocamento de domínio.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. Dewey2026-03-09💻 cs

EarthScape: A Multimodal Dataset for Surficial Geologic Mapping and Earth Surface Analysis

O artigo apresenta o EarthScape, um conjunto de dados multimodal pronto para IA que integra elevação, imagens aéreas e dados vetoriais para automatizar e escalar o mapeamento geológico superficial, demonstrando que as características do terreno oferecem o sinal preditivo mais confiável em comparação com dados espectros e de elevação brutos.

Matthew Massey, Nusrat Munia, Abdullah-Al-Zubaer Imran2026-03-09💻 cs

Evaluating quality metrics through the lenses of psychophysical measurements of low-level vision

Este artigo apresenta um conjunto de testes baseados em medições psicofísicas da visão de baixo nível para avaliar a capacidade de métricas de qualidade de imagem e vídeo em capturar aspectos fundamentais da percepção humana, revelando limitações e comportamentos específicos de 34 métricas existentes que não são facilmente observados em protocolos de avaliação padrão.

Dounia Hammou, Yancheng Cai, Pavan Madhusudanarao, Christos G. Bampis, Rafał K. Mantiuk2026-03-09💻 cs

FAST: An Efficient Scheduler for All-to-All GPU Communication

O artigo apresenta o FAST, um escalonador eficiente para comunicação All-to-All(v) em clusters de GPU que resolve problemas de assimetria e congestionamento em modelos MoE, superando soluções existentes em desempenho e reduzindo drasticamente o tempo de síntese.

Yiran Lei, Dongjoo Lee, Liangyu Zhao, Daniar Kurniawan, Chanmyeong Kim, Heetaek Jeong, Changsu Kim, Hyeonseong Choi, Liangcheng Yu, Arvind Krishnamurthy, Justine Sherry, Eriko Nurvitadhi2026-03-09💻 cs

Alchemist: Turning Public Text-to-Image Data into Generative Gold

O artigo apresenta o Alchemist, um novo método e um conjunto de dados de ajuste fino supervisionado compacto (3.350 amostras) derivado de dados públicos de texto para imagem, que utiliza um modelo generativo pré-treinado como estimador para selecionar amostras de alto impacto, resultando em melhorias significativas na qualidade estética e alinhamento de cinco modelos públicos sem comprometer a diversidade.

Valerii Startsev, Alexander Ustyuzhanin, Alexey Kirillov, Dmitry Baranchuk, Sergey Kastryulin2026-03-09💻 cs