ICLR: In-Context Imitation Learning with Visual Reasoning
O artigo apresenta o ICLR, um novo framework de aprendizado por imitação em contexto que aprimora a adaptação robótica a tarefas complexas ao integrar traços de raciocínio visual estruturado e previsão de ações em um único modelo transformador autoregressivo, demonstrando melhorias significativas na taxa de sucesso e generalização em comparação com métodos existentes.