Provably Safe Trajectory Generation for Manipulators Under Motion and Environmental Uncertainties

Este artigo propõe um novo quadro de planejamento de movimento com limites de risco que integra um modelo de operador Koopman estocástico profundo para prever distribuições de estado, um método de verificação hierárquica usando programação de soma de quadrados para certificação formal de colisão e um controlador MPPI, validando sua eficácia na geração de trajetórias seguras e eficientes para manipuladores robóticos em ambientes incertos e não convexos através de simulações e experimentos reais.

Fei Meng, Zijiang Yang, Xinyu Mao, Haobo Liang, Max Q. -H. Meng2026-03-11💻 cs

Chain of Event-Centric Causal Thought for Physically Plausible Video Generation

Este artigo propõe um novo framework para geração de vídeos fisicamente plausíveis que, ao decompor fenômenos físicos em cadeias de eventos causalmente conectados por meio de raciocínio guiado por leis físicas e prompts multimodais transitivos, supera as limitações dos modelos atuais ao garantir a coerência temporal e a evolução dinâmica realista.

Zixuan Wang, Yixin Hu, Haolan Wang, Feng Chen, Yan Liu, Wen Li, Yinjie Lei2026-03-11💻 cs

Class Model Generation from Requirements using Large Language Models

Este artigo investiga a capacidade de modelos de linguagem avançados (como GPT-5 e Claude Sonnet 4.0) de gerar automaticamente diagramas de classes UML a partir de requisitos em linguagem natural, propondo um framework de validação dual que combina julgamento por IA e avaliação humana para demonstrar que tais modelos produzem diagramas estruturalmente coerentes e semanticamente significativos com alta alinhamento às avaliações de especialistas.

Jackson Nguyen, Rui En Koe, Fanyu Wang, Chetan Arora, Alessio Ferrari2026-03-11💻 cs

MedKCO: Medical Vision-Language Pretraining via Knowledge-Driven Cognitive Orchestration

O artigo apresenta o MedKCO, um método de pré-treinamento visão-linguagem médica que supera as abordagens atuais ao adotar uma orquestração cognitiva orientada por conhecimento, combinando um currículo de dados em dois níveis com uma perda contrastiva assimétrica auto-paceada para melhorar a representação de características e a generalização em tarefas downstream.

Chenran Zhang, Ruiqi Wu, Tao Zhou, Yi Zhou2026-03-11💻 cs

Training-free Motion Factorization for Compositional Video Generation

O artigo propõe um framework livre de treinamento para geração de vídeos composicionais que decompõe o movimento em três categorias (imobilidade, movimento rígido e não rígido) através de um paradigma de planejamento antes da geração, permitindo a síntese de múltiplas instâncias com aparências e movimentos diversos sem a necessidade de ajuste fino do modelo.

Zixuan Wang, Ziqin Zhou, Feng Chen, Duo Peng, Yixin Hu, Changsheng Li, Yinjie Lei2026-03-11💻 cs

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

Este estudo audita o Google Reverse Image Search e revela que, ao atuar como um guardião algorítmico na verificação de desinformação visual, a ferramenta frequentemente prioriza informações irrelevantes e falsas em detrimento de conteúdos de desmentido, criando desafios significativos para a eficácia da fact-checking.

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua Shen2026-03-11💻 cs

Agentic AI as a Network Control-Plane Intelligence Layer for Federated Learning over 6G

O artigo propõe uma camada de inteligência baseada em IA Agente para o plano de controle de redes 6G, que gerencia de forma autônoma e adaptativa o aprendizado federado, traduzindo objetivos de alto nível em ações otimizadas que consideram condições de rede e capacidades dos dispositivos para garantir baixa latência e alta eficiência.

Loc X. Nguyen, Ji Su Yoon, Huy Q. Le, Yu Qiao, Avi Deb Raha, Eui-Nam Huh, Nguyen H. Tran, Choong Seon Hong2026-03-11💻 cs

Modeling Trend Dynamics with Variational Neural ODEs for Information Popularity Prediction

O artigo apresenta o VNOIP, um novo método baseado em Equações Diferenciais Ordinárias (ODEs) Neurais Variacionais que modela dinamicamente as tendências de popularidade da informação em redes sociais, superando as limitações de abordagens existentes ao capturar dependências de longo alcance e padrões temporais contínuos para prever com maior precisão a popularidade futura.

Yuchen Wang, Dongpeng Hou, Weikai Jing, Chao Gao, Xianghua Li, Yang Liu2026-03-11💻 cs

SPAN-Nav: Generalized Spatial Awareness for Versatile Vision-Language Navigation

O artigo apresenta o SPAN-Nav, um modelo fundamental de ponta a ponta que aprimora a navegação visão-linguagem ao integrar uma consciência espacial 3D universal, extraída de um vasto conjunto de dados de ocupação e condensada em um único token para raciocínio de ações, alcançando desempenho superior em diversos cenários e validada em experimentos do mundo real.

Jiahang Liu, Tianyu Xu, Jiawei Chen, Lu Yue, Jiazhao Zhang, Zhiyong Wang, Minghan Li, Qisheng Zhao, Anqi Li, Qi Su, Zhizheng Zhang, He Wang2026-03-11💻 cs