RiO-DETR: DETR for Real-time Oriented Object Detection

O artigo apresenta o RiO-DETR, o primeiro detector baseado em transformers capaz de realizar detecção de objetos orientados em tempo real, superando desafios como periodicidade angular e convergência lenta através de designs nativos de tarefa que estabelecem um novo equilíbrio entre velocidade e precisão.

Zhangchi Hu, Yifan Zhao, Yansong Peng, Wenzhang Sun, Xiangchen Yin, Jie Chen, Peixi Wu, Hebei Li, Xinghao Wang, Dongsheng Jiang, Xiaoyan Sun2026-03-11💻 cs

MetaDAT: Generalizable Trajectory Prediction via Meta Pre-training and Data-Adaptive Test-Time Updating

O artigo apresenta o MetaDAT, um método de previsão de trajetória que combina um framework de meta-aprendizado para pré-treinamento e um mecanismo de atualização adaptativa de dados em tempo de teste, superando os métodos atuais ao lidar com mudanças de distribuição e garantindo alta precisão e eficiência em cenários desafiadores.

Yuning Wang, Pu Zhang, Yuan He, Ke Wang, Jianru Xue2026-03-11💻 cs

First Steps towards Categorical Algebraic Artificial Chemistry

Este artigo apresenta a construção de um functor que atribui dinâmica a um modelo algébrico de componentes interagentes, generalizando o modelo computacional AlChemy de Fontana e Buss e explorando o uso da teoria das categorias para formalizar a conexão entre as facetas algébricas e dinâmicas da química artificial.

Joe Pratt-Johns (Edinburgh Napier University), Toby St. Clere Smithe (Kodamai Ltd), Chris Guiver (Edinburgh Napier University), Kevin Hughes (Edinburgh Napier University), Peter Andras (Edinburgh Napier University)2026-03-11💻 cs

ShapeMark: Robust and Diversity-Preserving Watermarking for Diffusion Models

O artigo "ShapeMark" apresenta um método de marca d'água robusto e que preserva a diversidade para modelos de difusão, superando as limitações das abordagens existentes ao codificar bits de marca d'água em padrões estruturados de ruído e introduzir um design de randomização que evita padrões fixos, garantindo alta qualidade de geração e resistência em cenários com perdas.

Yuqi Qian, Yun Cao, Haocheng Fu, Meiyang Lv, Meineng Zhu2026-03-11💻 cs

Stein Variational Ergodic Surface Coverage with SE(3) Constraints

Este trabalho apresenta um método inovador de Descida de Gradiente Variacional de Stein (SVGD) pré-condicionado com restrições SE(3) para otimização de trajetórias ergódicas, permitindo que robôs gerem trajetórias de cobertura de superfícies complexas em nuvens de pontos com maior qualidade e eficiência computacional do que as abordagens existentes.

Jiayun Li, Yufeng Jin, Sangli Teng, Dejian Gong, Georgia Chalvatzaki2026-03-11💻 cs

SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments

O artigo apresenta o SEA-Nav, um quadro de aprendizado por reforço que combina funções de barreira controlável diferenciáveis, replay adaptativo de colisões e restrições cinemáticas para permitir que robôs quadrúpedes naveguem com segurança e agilidade em ambientes densamente obstruídos com tempo de treinamento de apenas alguns minutos.

Shiyi Chen, Mingye Yang, Haiyan Mao, Jiaqi Zhang, Haiyi Liu, Shuheng He, Debing Zhang, Zihao Qiu, Chun Zhang2026-03-11💻 cs

TopoOR: A Unified Topological Scene Representation for the Operating Room

O artigo apresenta o TopoOR, uma nova representação topológica unificada para salas cirúrgicas que supera as limitações estruturais dos grafos de cena tradicionais ao modelar interações de ordem superior e preservar a geometria e multimodalidade essenciais para tarefas críticas de segurança, como a detecção de violações de esterilidade e a previsão de ações robóticas.

Tony Danjun Wang, Ka Young Kim, Tolga Birdal, Nassir Navab, Lennart Bastian2026-03-11💻 cs

Experience Report on the Adaptable Integration of Requirements Engineering Courses into Curricula for Professionals

Este artigo relata a experiência no desenvolvimento de três currículos de engenharia de software para profissionais e descreve uma abordagem sistemática baseada no mapeamento de conteúdo para integrar cursos de engenharia de requisitos, propondo princípios fundamentais para essa adaptação.

Oleksandr Kosenkov, Konstantin Blaschke, Tony Gorschek, Michael Unterkalmsteiner, Oleksandr Adamov, Davide Fucci2026-03-11💻 cs

OmniEarth: A Benchmark for Evaluating Vision-Language Models in Geospatial Tasks

O artigo apresenta o OmniEarth, um novo benchmark abrangente para avaliar modelos de visão e linguagem em tarefas de observação da Terra, que organiza 28 tarefas em dimensões de percepção, raciocínio e robustez utilizando dados de satélite e instruções verificadas para revelar as limitações atuais desses modelos em cenários geoespaciais complexos.

Ronghao Fu, Haoran Liu, Weijie Zhang, Zhiwen Lin, Xiao Yang, Peng Zhang, Bo Yang2026-03-11💻 cs

MORE-R1: Guiding LVLM for Multimodal Object-Entity Relation Extraction via Stepwise Reasoning with Reinforcement Learning

O artigo apresenta o MORE-R1, um modelo inovador que aprimora a extração de relações entre objetos visuais e entidades textuais em Grandes Modelos de Linguagem e Visão (LVLMs) ao integrar um processo de raciocínio passo a passo otimizado por Aprendizado por Reforço, alcançando desempenho superior ao estado da arte no benchmark MORE.

Xiang Yuan, Xu Chu, Xinrong Chen, Haochen Li, Zonghong Dai, Hongcheng Fan, Xiaoyue Yuan, Weiping Li, Tong Mo2026-03-11💻 cs

Prune Redundancy, Preserve Essence: Vision Token Compression in VLMs via Synergistic Importance-Diversity

O artigo apresenta o PruneSID, uma abordagem de compressão de tokens visuais sem treinamento que combina análise de componentes semânticos e supressão de não-máximos intra-grupo para eliminar redundâncias preservando a essência da informação, alcançando desempenho state-of-the-art e aceleração significativa em Modelos de Linguagem e Visão (VLMs).

Zhengyao Fang, Pengyuan Lyu, Chengquan Zhang, Guangming Lu, Jun Yu, Wenjie Pei2026-03-11💻 cs

StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving

O artigo apresenta o StyleVLA, um modelo de Visão-Linguagem-Ação (VLA) baseado em física e treinado com um grande conjunto de dados instrucionais, que supera modelos proprietários ao gerar trajetórias de direção autônoma não apenas seguras, mas também fisicamente viáveis e adaptadas a estilos de condução diversos.

Yuan Gao, Dengyuan Hua, Mattia Piccinini, Finn Rasmus Schäfer, Korbinian Moller, Lin Li, Johannes Betz2026-03-11💻 cs

Component-Aware Sketch-to-Image Generation Using Self-Attention Encoding and Coordinate-Preserving Fusion

Este artigo apresenta um novo framework de geração de imagens a partir de esboços, composto por uma rede codificadora baseada em autoatenção, um módulo de fusão que preserva coordenadas e um revisor de refinamento adaptativo, que supera os modelos existentes em fidelidade e coerência semântica em diversos domínios.

Ali Zia, Muhammad Umer Ramzan, Usman Ali, Muhammad Faheem, Abdelwahed Khamis, Shahnawaz Qureshi2026-03-11💻 cs

Streaming Autoregressive Video Generation via Diagonal Distillation

O artigo propõe a "Diagonal Distillation", um método inovador que utiliza uma estratégia de geração assimétrica e modelagem de fluxo óptico para superar as limitações de coerência temporal e latência nos modelos de vídeo autoregressivos, permitindo a geração de vídeos em streaming de alta qualidade com um aceleramento de 277,3 vezes em relação aos modelos não destilados.

Jinxiu Liu, Xuanming Liu, Kangfu Mei, Yandong Wen, Ming-HsuanYang, Weiyang Liu2026-03-11💻 cs