cs.RO artigos | Gist.Science

Lifelong Language-Conditioned Robotic Manipulation Learning

O artigo apresenta o SkillsCrafter, um novo framework de manipulação robótica que permite a aprendizagem contínua de múltiplas habilidades linguísticas sem esquecer as anteriores, utilizando adaptação de habilidades e agregação de especialização para preservar e generalizar o conhecimento.

Xudong Wang, Zebin Han, Zhiyu Liu + 5 more2026-03-06🤖 cs.AI

Critic in the Loop: A Tri-System VLA Framework for Robust Long-Horizon Manipulation

O artigo apresenta o "Critic in the Loop", um framework hierárquico adaptativo que integra um modelo VLM para raciocínio global, um modelo VLA para execução reativa e um crítico visual leve para rotear dinamicamente o controle, permitindo manipulação robótica robusta e eficiente em tarefas de longo horizonte ao minimizar consultas custosas e lidar com falhas.

Pengfei Yi, Yingjie Ma, Wenjiang Xu + 4 more2026-03-06💻 cs

Digital Twin Driven Textile Classification and Foreign Object Recognition in Automated Sorting Systems

Este trabalho apresenta um sistema robótico de triagem têxtil automatizada e acionado por gêmeo digital que integra percepção multimodal e modelos de linguagem visuais (VLMs) para classificar roupas e detectar objetos estranhos em tempo real, demonstrando a viabilidade de soluções escaláveis para reciclagem sustentável em ambientes industriais.

Serkan Ergun, Tobias Mitterer, Hubert Zangl2026-03-06💻 cs

Rethinking the Role of Collaborative Robots in Rehabilitation

Este artigo propõe expandir o papel dos robôs colaborativos na reabilitação física para além do treinamento de movimentos repetitivos, sugerindo que eles auxiliem terapeutas e pacientes antes, durante e após as sessões para superar barreiras de acesso, embora desafios como segurança e integração no fluxo de trabalho ainda precisem ser superados.

Vivek Gupte, Shalutha Rajapakshe, Emmanuel Senft2026-03-06💻 cs

Curve-Induced Dynamical Systems on Riemannian Manifolds and Lie Groups

Este artigo apresenta o CDSM, um quadro de trabalho em tempo real que constrói sistemas dinâmicos diretamente em variedades Riemannianas e grupos de Lie, combinando componentes tangenciais e normais para gerar comportamentos robóticos estáveis, adaptáveis e geometricamente precisos em ambientes domésticos.

Saray Bakker, Martin Schonger, Tobias Löw + 2 more2026-03-06💻 cs

From Code to Road: A Vehicle-in-the-Loop and Digital Twin-Based Framework for Central Car Server Testing in Autonomous Driving

Este trabalho apresenta um framework de teste inovador para servidores centrais de veículos em arquiteturas E/E centralizadas, que combina Veículo-em-Loop (ViL) e tecnologia de Digital Twin para validar algoritmos de direção autônoma em um ambiente seguro, reproduzível e realista, eliminando a necessidade de testes individuais de ECUs e facilitando a integração virtual-física desde as etapas iniciais do desenvolvimento.

Chengdong Wu, Sven Kirchner, Nils Purschke + 9 more2026-03-06💻 cs

Iterative On-Policy Refinement of Hierarchical Diffusion Policies for Language-Conditioned Manipulation

O artigo apresenta o HD-ExpIt, um framework que aprimora políticas de difusão hierárquicas para manipulação condicionada por linguagem através de um ciclo iterativo de refinamento on-policy, onde o planejamento baseado em difusão descobre comportamentos bem-sucedidos que são retroalimentados para melhorar tanto o planejador quanto o controlador, superando as limitações de dados offline e alcançando desempenho superior no benchmark CALVIN.

Clemence Grislain, Olivier Sigaud, Mohamed Chetouani2026-03-06💻 cs

Latent Policy Steering through One-Step Flow Policies

O artigo propõe a Latent Policy Steering (LPS), um método de aprendizado por reforço offline que alcança desempenho de ponta em tarefas robóticas ao eliminar críticos latentes proxy e permitir a otimização direta no espaço latente através de um policy de MeanFlow de um passo, garantindo assim a melhoria da política com fidelidade e estabilidade sem necessidade de ajuste fino de hiperparâmetros.

Hokyun Im, Andrey Kolobov, Jianlong Fu + 1 more2026-03-06🤖 cs.LG

Constraint-Free Static Modeling of Continuum Parallel Robot

Este artigo apresenta um modelo estático exato, baseado em configuração e livre de restrições para robôs paralelos contínuos, que elimina equações algébricas complexas através de incorporação cinemática e utiliza uma aproximação de Magnus de quarta ordem para resolver eficientemente as equações de equilíbrio não lineares sob grandes deformações e rotações.

Lingxiao Xun, Matyas Diezinger, Azad Artinian + 2 more2026-03-06💻 cs

UltraDexGrasp: Learning Universal Dexterous Grasping for Bimanual Robots with Synthetic Data

O artigo apresenta o UltraDexGrasp, um framework que utiliza um pipeline de geração de dados sintéticos para criar o conjunto de dados UltraDexGrasp-20M, permitindo que uma política de aprendizado simples alcance transferência sim-real robusta e uma taxa de sucesso de 81,2% em apreensões destreitas bimanuais universais para objetos variados.

Sizhe Yang, Yiman Xie, Zhixuan Liang + 4 more2026-03-06💻 cs

CT-Enabled Patient-Specific Simulation and Contact-Aware Robotic Planning for Cochlear Implantation

Este artigo apresenta um pipeline unificado que utiliza imagens de TC para criar simulações específicas do paciente e planejar a inserção robótica de implantes cocleares, empregando um modelo de haste de Cosserat diferenciável para prever e regular as forças de contato, minimizando assim o trauma intracoclear e os riscos de travamento ou flambagem.

Lingxiao Xun, Gang Zheng, Alexandre Kruszewski + 1 more2026-03-06💻 cs

Omni-Manip: Beyond-FOV Large-Workspace Humanoid Manipulation with Omnidirectional 3D Perception

O artigo apresenta o Omni-Manip, uma política visuomotora end-to-end baseada em LiDAR que utiliza percepção 360° e um mecanismo de atenção temporal para permitir manipulação robótica humana robusta em grandes espaços de trabalho sem a necessidade de reposicionamento frequente, superando as limitações de campo de visão das soluções tradicionais RGB-D.

Pei Qu, Zheng Li, Yufei Jia + 5 more2026-03-06💻 cs

OpenFrontier: General Navigation with Visual-Language Grounded Frontiers

O OpenFrontier é um framework de navegação sem treinamento que utiliza fronteiras visuais como âncoras semânticas para integrar modelos de visão e linguagem, permitindo que robôs realizem navegação em ambientes abertos com alto desempenho zero-shot sem a necessidade de mapeamento 3D denso ou ajuste fino.

Esteban Padilla, Boyang Sun, Marc Pollefeys + 1 more2026-03-06💻 cs

Accelerating Sampling-Based Control via Learned Linear Koopman Dynamics

Este artigo apresenta o controlador MPPI-DK, que acelera o controle preditivo baseado em amostragem substituindo a dinâmica não linear por um operador de Koopman profundo aprendido, permitindo controle em tempo real eficiente em plataformas robóticas com desempenho comparável ao uso de dinâmicas reais.

Wenjian Hao, Yuxuan Fang, Zehui Lu + 1 more2026-03-06💻 cs

Loop Closure via Maximal Cliques in 3D LiDAR-Based SLAM

Este artigo apresenta o CliReg, um algoritmo determinístico baseado na busca de cliques máximos que substitui o RANSAC para validação de fechamento de laço em SLAM baseado em LiDAR 3D, demonstrando maior robustez, precisão e confiabilidade em condições de ruído e ambiguidade ambiental.

Javier Laserna, Saurabh Gupta, Oscar Martinez Mozos + 2 more2026-03-06💻 cs

ROScopter: A Multirotor Autopilot based on ROSflight 2.0

O artigo apresenta o ROScopter, um autopiloto leve para drones multirotores projetado para pesquisadores, que utiliza a arquitetura ROSflight 2.0 e o ROS 2 para facilitar a simulação e testes de hardware, oferecendo desempenho comparável aos sistemas de última geração com um código-base significativamente mais modular e reduzido.

Jacob Moore, Ian Reid, Phil Tokumaru + 1 more2026-03-06💻 cs

PhysiFlow: Physics-Aware Humanoid Whole-Body VLA via Multi-Brain Latent Flow Matching and Robust Tracking

O artigo apresenta o PhysiFlow, um framework VLA multi-cérebro consciente da física que utiliza correspondência de fluxo latente e rastreamento robusto para garantir uma coordenação corporal completa estável e semanticamente guiada em robôs humanoides.

Weikai Qin, Sichen Wu, Ci Chen + 5 more2026-03-06💻 cs

Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World Model

O artigo apresenta o CompACT, um tokenizador discreto compacto que comprime observações em apenas 8 tokens, permitindo que modelos de mundo realizem planejamento de decisão em tempo real com custo computacional drasticamente reduzido e desempenho competitivo.

Dongwon Kim, Gawon Seo, Jinsung Lee + 2 more2026-03-06🤖 cs.AI

Residual RL--MPC for Robust Microrobotic Cell Pushing Under Time-Varying Flow

Este artigo propõe um controlador híbrido que combina Model Predictive Control (MPC) com uma política residual aprendida via Reinforcement Learning para melhorar a robustez e a precisão no empurramento de células microrrobóticas sob fluxo microfluídico variável no tempo, demonstrando superioridade sobre métodos tradicionais e capacidade de generalização para trajetórias não vistas.

Yanda Yang, Sambeeta Das2026-03-06🤖 cs.AI

Observing and Controlling Features in Vision-Language-Action Models

Este trabalho propõe e analisa os conceitos de observabilidade e controlabilidade de características em Modelos Visão-Linguagem-Ação (VLAs), demonstrando que intervenções lineares leves permitem interpretar e direcionar o comportamento de robôs em tempo real, alinhando-os a preferências do usuário sem a necessidade de ajuste fino.

Hugo Buurmeijer, Carmen Amo Alonso, Aiden Swann + 1 more2026-03-06💻 cs

← Anterior Próximo →