Grounding Machine Creativity in Game Design Knowledge Representations: Empirical Probing of LLM-Based Executable Synthesis of Goal Playable Patterns under Structural Constraints

Este artigo investiga a capacidade de modelos de linguagem grandes (LLMs) de sintetizar código C# executável no Unity, partindo de Padrões Jogáveis de Objetivo (GPCs), demonstrando que, embora os modelos possam gerar código, a síntese escalável é limitada principalmente por falhas de "grounding" estrutural e de projeto ao tentar atender simultaneamente às restrições sintéticas do motor e ao significado semântico dos padrões de jogo.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10💻 cs

Vision Language Models Cannot Reason About Physical Transformation

O artigo apresenta o ConservationBench, um benchmark que revela que os Modelos de Linguagem e Visão (VLMs) atuais falham sistematicamente ao raciocinar sobre transformações físicas e não conseguem manter representações invariantes de propriedades físicas em cenas dinâmicas, dependendo excessivamente de priores textuais em vez de compreensão visual genuína.

Dezhi Luo, Yijiang Li, Maijunxian Wang, Tianwei Zhao, Bingyang Wang, Siheng Wang, Pinyuan Feng, Pooyan Rahmanzadehgervi, Ziqiao Ma, Hokin Deng2026-03-10💻 cs

Efficient Trajectory Optimization for Autonomous Racing via Formula-1 Data-Driven Initialization

Este artigo propõe uma estratégia de inicialização baseada em aprendizado, utilizando dados de telemetria da Fórmula 1 para prever trajetórias de corrida expert a partir da geometria local da pista, o que acelera significativamente a convergência e reduz o tempo de execução dos otimizadores de trajetória para corridas autônomas sem comprometer o tempo final da volta.

Samir Shehadeh, Lukas Kutsch, Nils Dengler, Sicong Pan, Maren Bennewitz2026-03-10💻 cs

Deep Expert Injection for Anchoring Retinal VLMs with Domain-Specific Knowledge

O artigo apresenta o EyExIn, um framework eficiente em dados que utiliza um mecanismo de injeção profunda de especialistas para ancorar modelos de linguagem visual em conhecimento oftalmológico específico, superando lacunas de percepção e raciocínio e alcançando desempenho superior em diagnósticos de retina.

Shuai Lu, Meng Wang, Jia Guo, Jiawei Du, Bo Liu, Shengzhu Yang, Weihang Zhang, Huazhu Fu, Huiqi Li2026-03-10💻 cs

The Model Knows Which Tokens Matter: Automatic Token Selection via Noise Gating

O artigo apresenta o AutoSelect, um método que reformula a poda de tokens visuais como um problema de comunicação com restrição de capacidade, utilizando um mecanismo de "gate" de ruído e um denoiser para treinar um seletor leve em modelos VLM congelados, permitindo a seleção automática dos tokens mais importantes durante a inferência com ganhos significativos de velocidade e precisão quase total.

Landi He, Xiaoyu Yang, Lijian Xu2026-03-10💻 cs

Tutorial on Aided Inertial Navigation Systems: A Modern Treatment Using Lie-Group Theoretical Methods

Este tutorial apresenta uma introdução orientada ao controle para sistemas de navegação inercial assistida, utilizando uma formulação baseada na teoria de grupos de Lie centrada no grupo estendido SE₂(3) para desenvolver uma estrutura geométrica clara que funde medições inerciais com informações auxiliares, destacando explicitamente os papéis da invariância e da simetria.

Soulaimane Berkane2026-03-10💻 cs

CanoVerse: 3D Object Scalable Canonicalization and Dataset for Generation and Pose

O artigo apresenta o CanoVerse, um novo framework de canonicização e um massivo dataset de 320 mil objetos 3D que resolvem a ambiguidade de rotação, permitindo geração mais estável, recuperação precisa de formas e estimativa de orientação zero-shot.

Li Jin, Yuchen Yang, Weikai Chen, Yujie Wang, Dehao Hao, Tanghui Jia, Yingda Yin, Zeyu Hu, Runze Zhang, Keyang Luo, Li Yuan, Long Quan, Xin Wang, Xueying Qin2026-03-10💻 cs