IROSA: Interactive Robot Skill Adaptation using Natural Language

O artigo apresenta o IROSA, um novo framework que utiliza modelos de linguagem pré-treinados para adaptar habilidades de robôs industriais por meio de comandos em linguagem natural, mantendo uma camada de abstração segura que evita o ajuste fino do modelo e a interação direta com o hardware.

Markus Knauer, Samuel Bustamante, Thomas Eiband, Alin Albu-Schäffer, Freek Stulp, João Silvério

Publicado 2026-03-05
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um robô industrial muito inteligente, mas que só sabe fazer uma coisa: pegar uma peça de uma caixa e colocá-la em outra. Ele foi "ensinado" por um humano a fazer isso, e agora ele repete o movimento perfeitamente.

O problema? E se você quiser que ele vá mais devagar perto de uma peça frágil? Ou que ele desvie de uma caixa azul que alguém deixou no caminho? Ou que ele pare para "olhar" uma câmera antes de terminar?

No passado, para mudar algo assim, você precisaria de um programador especialista para reescrever o código do robô. Isso é lento, caro e difícil.

Este artigo apresenta uma solução chamada IROSA. Pense no IROSA como um tradutor mágico e um guarda-costas entre você (que fala português) e o robô (que só entende matemática complexa).

Aqui está como funciona, usando analogias simples:

1. O Robô é um Artista, não um Programador

O robô já aprendeu a tarefa (como desenhar um círculo perfeito). Ele não precisa ser reprogramado do zero. Ele apenas precisa de um "empurrãozinho" para ajustar o desenho.

2. O "Caixa de Ferramentas" (A Ideia Central)

A grande inovação do IROSA é que ele não deixa o robô inventar nada. Em vez disso, o robô tem uma caixa de ferramentas pré-aprovada.
Imagine que você é um cliente em um restaurante. Você não entra na cozinha e diz ao chef: "Faça um prato com sal, pimenta e um pouco de fogo". Você diz: "Quero o prato mais apimentado possível". O chef (o robô) sabe exatamente quais ingredientes (ferramentas) ele pode usar porque eles já foram testados e são seguros.

No IROSA, as "ferramentas" são:

  • Ajuste de Velocidade: "Vá mais devagar aqui."
  • Inserção de Pontos: "Passe por cima deste ponto específico."
  • Repulsão (Desvio): "Fuja daquela caixa azul."

3. O Tradutor (O Cérebro de IA)

Quando você fala: "Desvie da caixa azul e vá mais devagar", um modelo de linguagem (uma IA inteligente) atua como o garçom.

  • Ele ouve seu pedido.
  • Ele olha para a caixa de ferramentas do robô.
  • Ele escolhe as ferramentas certas ("Ferramenta de Desvio" e "Ferramenta de Desaceleração").
  • Ele define os parâmetros (quão longe desviar? quanto desacelerar?).

O Pulo do Gato: O garçom (IA) nunca entra na cozinha (o controle do robô). Ele apenas entrega o pedido escrito para o chef. Isso é crucial porque, se a IA alucinar (inventar algo errado), ela só pode escolher uma ferramenta que já existe e é segura. Ela não pode criar uma nova ferramenta perigosa.

4. Por que isso é diferente dos outros métodos?

Muitas IAs hoje tentam aprender a controlar o robô do zero, como um aluno tentando aprender a dirigir apenas assistindo a vídeos. Isso é arriscado: se o aluno errar, o carro bate.

O IROSA é como ter um piloto automático com limites rígidos.

  • Outros métodos (como o OVITA): Tentam escrever o código do robô na hora. É como pedir para o garçom escrever a receita do prato na hora. Se ele errar a gramática ou a lógica, o prato fica estragado ou o robô quebra.
  • O IROSA: Usa ferramentas prontas. É como pedir "mais sal". O robô sabe exatamente o que é "mais sal" e como aplicar sem estragar a comida.

5. O Resultado na Prática

Os pesquisadores testaram isso em um robô real fazendo uma tarefa industrial (colocar um anel de rolamento em um lugar).

  • Cenário 1: O robô ia rápido. O humano disse: "Desacelere entre a caixa e a estação". O robô obedeceu perfeitamente, ficando mais lento apenas naquele trecho.
  • Cenário 2: Apareceu uma câmera no caminho. O humano disse: "Verifique o anel com a câmera à esquerda". O robô ajustou a rota para passar perto da câmera e depois voltar ao normal.
  • Cenário 3: Uma caixa azul bloqueou o caminho. O humano disse: "Evite a caixa azul". O robô desviou automaticamente, sem bater.

Resumo em uma frase

O IROSA permite que você fale com um robô industrial em linguagem natural, como se estivesse conversando com um colega de trabalho, mas com a segurança de que o robô só fará ajustes que já foram testados e aprovados, sem precisar de um programador para mudar o código a cada pequena alteração.

É a diferença entre tentar ensinar um robô a "pensar" do zero (perigoso e difícil) e dar a ele um conjunto de "botões mágicos" seguros que ele pode apertar quando você pede.