Cutting the Cord: System Architecture for Low-Cost, GPU-Accelerated Bimanual Mobile Manipulation

Este artigo apresenta um manipulador móvel bimanual de baixo custo (menos de US$ 1.300) baseado no projeto XLeRobot, que integra computação embarcada com GPU NVIDIA Jetson Orin Nano e um design mecânico otimizado para permitir operação autônoma e teleoperada sem dependência de cabos externos.

Artemis Shaw, Chen Liu, Justin Costa, Rane Gray, Alina Skowronek, Kevin Diaz, Nam Bui, Nikolaus CorrellWed, 11 Ma💻 cs

Intelligent Spatial Estimation for Fire Hazards in Engineering Sites: An Enhanced YOLOv8-Powered Proximity Analysis Framework

Este estudo propõe um framework aprimorado baseado em YOLOv8 que integra detecção de fogo e fumaça com análise de proximidade de objetos para gerar uma avaliação quantitativa de risco e alertas prioritários em canteiros de obras, alcançando alta precisão e sendo adequado para implementação em ambientes com recursos limitados.

Ammar K. AlMhdawi, Nonso Nnamoko, Alaa Mashan UbaidWed, 11 Ma💻 cs

3D UAV Trajectory Estimation and Classification from Internet Videos via Language Model

Este trabalho apresenta um novo framework que estima trajetórias 3D e classifica drones diretamente de vídeos da internet sem anotações manuais, utilizando aquisição orientada por linguagem, geração de rótulos multimodal e refinamento baseado em física, demonstrando eficácia em tarefas de anti-drones através de transferência zero-shot que melhora com a escala de dados.

Haoxiang Lei, Daotong Wang, Shenghai Yuan, Jianbo SuWed, 11 Ma💻 cs

Provably Safe Trajectory Generation for Manipulators Under Motion and Environmental Uncertainties

Este artigo propõe um novo quadro de planejamento de movimento com limites de risco que integra um modelo de operador Koopman estocástico profundo para prever distribuições de estado, um método de verificação hierárquica usando programação de soma de quadrados para certificação formal de colisão e um controlador MPPI, validando sua eficácia na geração de trajetórias seguras e eficientes para manipuladores robóticos em ambientes incertos e não convexos através de simulações e experimentos reais.

Fei Meng, Zijiang Yang, Xinyu Mao, Haobo Liang, Max Q. -H. MengWed, 11 Ma💻 cs

Chain of Event-Centric Causal Thought for Physically Plausible Video Generation

Este artigo propõe um novo framework para geração de vídeos fisicamente plausíveis que, ao decompor fenômenos físicos em cadeias de eventos causalmente conectados por meio de raciocínio guiado por leis físicas e prompts multimodais transitivos, supera as limitações dos modelos atuais ao garantir a coerência temporal e a evolução dinâmica realista.

Zixuan Wang, Yixin Hu, Haolan Wang, Feng Chen, Yan Liu, Wen Li, Yinjie LeiWed, 11 Ma💻 cs

Class Model Generation from Requirements using Large Language Models

Este artigo investiga a capacidade de modelos de linguagem avançados (como GPT-5 e Claude Sonnet 4.0) de gerar automaticamente diagramas de classes UML a partir de requisitos em linguagem natural, propondo um framework de validação dual que combina julgamento por IA e avaliação humana para demonstrar que tais modelos produzem diagramas estruturalmente coerentes e semanticamente significativos com alta alinhamento às avaliações de especialistas.

Jackson Nguyen, Rui En Koe, Fanyu Wang, Chetan Arora, Alessio FerrariWed, 11 Ma💻 cs

MedKCO: Medical Vision-Language Pretraining via Knowledge-Driven Cognitive Orchestration

O artigo apresenta o MedKCO, um método de pré-treinamento visão-linguagem médica que supera as abordagens atuais ao adotar uma orquestração cognitiva orientada por conhecimento, combinando um currículo de dados em dois níveis com uma perda contrastiva assimétrica auto-paceada para melhorar a representação de características e a generalização em tarefas downstream.

Chenran Zhang, Ruiqi Wu, Tao Zhou, Yi ZhouWed, 11 Ma💻 cs

Training-free Motion Factorization for Compositional Video Generation

O artigo propõe um framework livre de treinamento para geração de vídeos composicionais que decompõe o movimento em três categorias (imobilidade, movimento rígido e não rígido) através de um paradigma de planejamento antes da geração, permitindo a síntese de múltiplas instâncias com aparências e movimentos diversos sem a necessidade de ajuste fino do modelo.

Zixuan Wang, Ziqin Zhou, Feng Chen, Duo Peng, Yixin Hu, Changsheng Li, Yinjie LeiWed, 11 Ma💻 cs

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

Este estudo audita o Google Reverse Image Search e revela que, ao atuar como um guardião algorítmico na verificação de desinformação visual, a ferramenta frequentemente prioriza informações irrelevantes e falsas em detrimento de conteúdos de desmentido, criando desafios significativos para a eficácia da fact-checking.

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua ShenWed, 11 Ma💻 cs

Agentic AI as a Network Control-Plane Intelligence Layer for Federated Learning over 6G

O artigo propõe uma camada de inteligência baseada em IA Agente para o plano de controle de redes 6G, que gerencia de forma autônoma e adaptativa o aprendizado federado, traduzindo objetivos de alto nível em ações otimizadas que consideram condições de rede e capacidades dos dispositivos para garantir baixa latência e alta eficiência.

Loc X. Nguyen, Ji Su Yoon, Huy Q. Le, Yu Qiao, Avi Deb Raha, Eui-Nam Huh, Nguyen H. Tran, Choong Seon HongWed, 11 Ma💻 cs