Critic in the Loop: A Tri-System VLA Framework for Robust Long-Horizon Manipulation

O artigo apresenta o "Critic in the Loop", um framework hierárquico adaptativo que integra um modelo VLM para raciocínio global, um modelo VLA para execução reativa e um crítico visual leve para rotear dinamicamente o controle, permitindo manipulação robótica robusta e eficiente em tarefas de longo horizonte ao minimizar consultas custosas e lidar com falhas.

Pengfei Yi, Yingjie Ma, Wenjiang Xu + 4 more2026-03-06💻 cs

Digital Twin Driven Textile Classification and Foreign Object Recognition in Automated Sorting Systems

Este trabalho apresenta um sistema robótico de triagem têxtil automatizada e acionado por gêmeo digital que integra percepção multimodal e modelos de linguagem visuais (VLMs) para classificar roupas e detectar objetos estranhos em tempo real, demonstrando a viabilidade de soluções escaláveis para reciclagem sustentável em ambientes industriais.

Serkan Ergun, Tobias Mitterer, Hubert Zangl2026-03-06💻 cs

From Code to Road: A Vehicle-in-the-Loop and Digital Twin-Based Framework for Central Car Server Testing in Autonomous Driving

Este trabalho apresenta um framework de teste inovador para servidores centrais de veículos em arquiteturas E/E centralizadas, que combina Veículo-em-Loop (ViL) e tecnologia de Digital Twin para validar algoritmos de direção autônoma em um ambiente seguro, reproduzível e realista, eliminando a necessidade de testes individuais de ECUs e facilitando a integração virtual-física desde as etapas iniciais do desenvolvimento.

Chengdong Wu, Sven Kirchner, Nils Purschke + 9 more2026-03-06💻 cs

Iterative On-Policy Refinement of Hierarchical Diffusion Policies for Language-Conditioned Manipulation

O artigo apresenta o HD-ExpIt, um framework que aprimora políticas de difusão hierárquicas para manipulação condicionada por linguagem através de um ciclo iterativo de refinamento on-policy, onde o planejamento baseado em difusão descobre comportamentos bem-sucedidos que são retroalimentados para melhorar tanto o planejador quanto o controlador, superando as limitações de dados offline e alcançando desempenho superior no benchmark CALVIN.

Clemence Grislain, Olivier Sigaud, Mohamed Chetouani2026-03-06💻 cs

Latent Policy Steering through One-Step Flow Policies

O artigo propõe a Latent Policy Steering (LPS), um método de aprendizado por reforço offline que alcança desempenho de ponta em tarefas robóticas ao eliminar críticos latentes proxy e permitir a otimização direta no espaço latente através de um policy de MeanFlow de um passo, garantindo assim a melhoria da política com fidelidade e estabilidade sem necessidade de ajuste fino de hiperparâmetros.

Hokyun Im, Andrey Kolobov, Jianlong Fu + 1 more2026-03-06🤖 cs.LG

Constraint-Free Static Modeling of Continuum Parallel Robot

Este artigo apresenta um modelo estático exato, baseado em configuração e livre de restrições para robôs paralelos contínuos, que elimina equações algébricas complexas através de incorporação cinemática e utiliza uma aproximação de Magnus de quarta ordem para resolver eficientemente as equações de equilíbrio não lineares sob grandes deformações e rotações.

Lingxiao Xun, Matyas Diezinger, Azad Artinian + 2 more2026-03-06💻 cs

UltraDexGrasp: Learning Universal Dexterous Grasping for Bimanual Robots with Synthetic Data

O artigo apresenta o UltraDexGrasp, um framework que utiliza um pipeline de geração de dados sintéticos para criar o conjunto de dados UltraDexGrasp-20M, permitindo que uma política de aprendizado simples alcance transferência sim-real robusta e uma taxa de sucesso de 81,2% em apreensões destreitas bimanuais universais para objetos variados.

Sizhe Yang, Yiman Xie, Zhixuan Liang + 4 more2026-03-06💻 cs

CT-Enabled Patient-Specific Simulation and Contact-Aware Robotic Planning for Cochlear Implantation

Este artigo apresenta um pipeline unificado que utiliza imagens de TC para criar simulações específicas do paciente e planejar a inserção robótica de implantes cocleares, empregando um modelo de haste de Cosserat diferenciável para prever e regular as forças de contato, minimizando assim o trauma intracoclear e os riscos de travamento ou flambagem.

Lingxiao Xun, Gang Zheng, Alexandre Kruszewski + 1 more2026-03-06💻 cs

Omni-Manip: Beyond-FOV Large-Workspace Humanoid Manipulation with Omnidirectional 3D Perception

O artigo apresenta o Omni-Manip, uma política visuomotora end-to-end baseada em LiDAR que utiliza percepção 360° e um mecanismo de atenção temporal para permitir manipulação robótica humana robusta em grandes espaços de trabalho sem a necessidade de reposicionamento frequente, superando as limitações de campo de visão das soluções tradicionais RGB-D.

Pei Qu, Zheng Li, Yufei Jia + 5 more2026-03-06💻 cs

Residual RL--MPC for Robust Microrobotic Cell Pushing Under Time-Varying Flow

Este artigo propõe um controlador híbrido que combina Model Predictive Control (MPC) com uma política residual aprendida via Reinforcement Learning para melhorar a robustez e a precisão no empurramento de células microrrobóticas sob fluxo microfluídico variável no tempo, demonstrando superioridade sobre métodos tradicionais e capacidade de generalização para trajetórias não vistas.

Yanda Yang, Sambeeta Das2026-03-06🤖 cs.AI