ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly
El artículo presenta ReTac-ACT, un modelo de aprendizaje por imitación que fusiona visión y tacto mediante mecanismos de atención bidireccional, un sistema de gating condicionado a la propiocepción y un objetivo de reconstrucción táctil, logrando un 90% de éxito en tareas de ensamblaje de precisión donde la retroalimentación visual falla debido a oclusiones.