Real-Time Neural Video Compression with Unified Intra and Inter Coding

Este artigo apresenta um novo framework de compressão de vídeo neural em tempo real que unifica codificação intra e inter em um único modelo adaptativo, superando as limitações de propagação de erro e gerência de novos conteúdos para alcançar uma redução média de 12,1% na taxa BD em comparação com o estado da arte DCVC-RT, mantendo simultaneamente desempenho de codificação e decodificação em tempo real.

Hui Xiang, Yifan Bian, Li Li, Jingran Wu, Xianguo Zhang, Dong Liu2026-03-11💻 cs

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

Este artigo desafia a premissa de que o replanejamento reativo exige a atualização de planos existentes, demonstrando que algoritmos de planejamento quase certamente assintoticamente ótimos (ASAO), como EIT* e AORRTC, podem resolver problemas incrementais de forma mais eficiente ao tratar cada consulta como um problema independente, encontrando trajetórias globais consistentes e de alta qualidade em ambientes dinâmicos sem a necessidade de reutilização explícita de planos.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. Gammell2026-03-11💻 cs

Proper Body Landmark Subset Enables More Accurate and 5X Faster Recognition of Isolated Signs in LIBRAS

Este artigo demonstra que a seleção de um subconjunto adequado de marcos corporais, combinada com técnicas de imputação por splines e o uso do MediaPipe, permite reconhecer sinais isolados da LIBRAS com precisão superior ou comparável aos métodos atuais, reduzindo o tempo de processamento em mais de 5 vezes.

Daniele L. V. dos Santos, Thiago B. Pereira, Carlos Eduardo G. R. Alves, Richard J. M. G. Tello, Francisco de A. Boldt, Thiago M. Paixão2026-03-11💻 cs

SPAN: Spatial-Projection Alignment for Monocular 3D Object Detection

O artigo propõe o SPAN (Spatial-Projection Alignment), um novo método para detecção 3D monocular que supera as limitações de consistência geométrica dos detectores existentes ao alinhar espacialmente as caixas 3D previstas com os verdadeiros e garantir que sua projeção 2D corresponda às caixas de detecção na imagem, resultando em melhor desempenho e estabilidade de treinamento.

Yifan Wang, Yian Zhao, Fanqi Pu, Xiaochen Yang, Yang Tang, Xi Chen, Wenming Yang2026-03-11💻 cs

V-Attack: Targeting Disentangled Value Features for Controllable Adversarial Attacks on LVLMs

O artigo propõe o V-Attack, um novo método de ataque adversarial para Modelos Visuais-Linguísticos de Grande Escala (LVLMs) que supera as limitações de controle semântico existentes ao manipular diretamente as características de valor (V) desentrelaçadas, resultando em uma taxa de sucesso de ataque significativamente maior ao permitir a alteração precisa de conceitos locais nas imagens.

Sen Nie, Jie Zhang, Jianxin Yan, Shiguang Shan, Xilin Chen2026-03-11💻 cs

Bootstrap Dynamic-Aware 3D Visual Representation for Scalable Robot Learning

O artigo apresenta o AFRO, um framework de aprendizado auto-supervisionado que gera representações 3D dinâmicas e conscientes de ações para robótica, superando métodos existentes ao modelar transições causais sem necessidade de supervisão por reconstrução geométrica ou dados de ação, resultando em taxas de sucesso significativamente maiores em tarefas de manipulação.

Qiwei Liang, Boyang Cai, Minghao Lai, Sitong Zhuang, Tao Lin, Yan Qin, Yixuan Ye, Jiaming Liang, Renjing Xu2026-03-11💻 cs

Beware of the Classical Benchmark Instances for the Traveling Salesman Problem with Time Windows

O artigo demonstra que um método exato simples resolve a maioria das instâncias clássicas de benchmark do Problema do Caixeiro Viajante com Janelas de Tempo em menos de dez segundos, concluindo que essas instâncias não são mais representativas para avaliação de desempenho e exigem cautela no desenho de conjuntos de treinamento para algoritmos de aprendizado de máquina.

Francisco J. Soulignac2026-03-11💻 cs

AVGGT: Rethinking Global Attention for Accelerating VGGT

O artigo AVGGT propõe um esquema de aceleração sem treinamento que, baseado na análise das funções das camadas de atenção global, converte camadas iniciais em atenção de quadro e subsampleia as camadas finais, resultando em ganhos de velocidade de 2x a 10x em modelos como VGGT e π3\pi^3 sem comprometer a precisão em cenários de visão 3D multi-visão densa.

Xianbing Sun, Zhikai Zhu, Zhengyu Lou, Bo Yang, Jinyang Tang, Liqing Zhang, He Wang, Jianfu Zhang2026-03-11💻 cs

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

O artigo apresenta o UniBYD, um framework unificado que utiliza aprendizado por reforço dinâmico e uma representação morfológica unificada para superar as limitações da imitação humana, permitindo que políticas de manipulação robótica se adaptem eficientemente a diversas configurações de mãos robóticas, resultando em um aumento significativo na taxa de sucesso em comparação com o estado da arte.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao Wang2026-03-11💻 cs

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

Este artigo apresenta o DivGenBench, um novo benchmark para quantificar o colapso de modo de preferência em modelos de difusão, e propõe o D²-Align, um framework que mitiga esse problema ao corrigir direcionalmente o sinal de recompensa, preservando assim a diversidade gerativa sem comprometer a qualidade.

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu Li2026-03-11💻 cs

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

Este artigo apresenta o Preguss, um framework modular que combina análise estática e modelos de linguagem para automatizar a geração e refinamento de especificações formais, permitindo a verificação de programas de grande escala com mais de 1000 linhas de código e reduzindo o esforço humano em até 88,9%.

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei Yin2026-03-11💻 cs

CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication

O artigo apresenta o CovertComBench, um novo *benchmark* específico para avaliar a capacidade de Modelos de Linguagem Grandes (LLMs) em comunicações covert sem fio, revelando que, embora eficazes em conceitos e geração de código, eles ainda falham em realizar as derivações matemáticas complexas necessárias para garantir a segurança, indicando a necessidade de ferramentas externas para sistemas de IA confiáveis.

Zhaozhi Liu, Jiaxin Chen, Yuanai Xie, Yuna Jiang, Minrui Xu, Xiao Zhang, Pan Lai, Zan Zhou2026-03-11💻 cs