IROSA: Interactive Robot Skill Adaptation using Natural Language

Ce papier présente IROSA, un cadre novateur combinant des modèles de langage pré-entraînés et une architecture basée sur des outils pour permettre l'adaptation interactive et sécurisée des compétences robotiques via des commandes en langage naturel, sans nécessiter de fine-tuning du modèle.

Markus Knauer, Samuel Bustamante, Thomas Eiband, Alin Albu-Schäffer, Freek Stulp, João Silvério

Publié 2026-03-05
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

🤖 IROSA : Comment parler à un robot comme à un collègue

Imaginez que vous travaillez dans une usine avec un bras robotique très intelligent, mais un peu rigide. Jusqu'à présent, pour lui dire de changer sa façon de travailler (par exemple, "va plus doucement" ou "évite cette boîte bleue"), il fallait un expert en informatique pour réécrire des lignes de code complexes. C'est comme si vous vouliez changer la recette d'un gâteau, mais que vous deviez réinventer la chimie du four pour le faire.

Les auteurs de cet article ont créé IROSA, un système qui permet de donner ces ordres simplement en parlant, comme vous le feriez avec un humain.

🧩 L'Analogie du Chef et du Sous-Chef

Pour comprendre comment ça marche, imaginez une cuisine de restaurant très occupée :

  1. Le Robot (Le Chef de Cuisine) : C'est l'expert qui sait exactement comment faire le plat (le mouvement). Il a appris à saisir une pièce et à la mettre dans un trou grâce à quelques démonstrations. Il est très précis, mais il ne comprend pas le langage humain.
  2. L'Intelligence Artificielle (Le Sous-Chef) : C'est un grand cerveau (un modèle de langage) qui parle couramment humain, mais qui ne sait pas cuisiner. Il ne peut pas toucher aux ingrédients directement, sinon il ferait une catastrophe.
  3. La Boîte à Outils Sécurisée (Le Comptoir) : C'est la partie la plus importante. Entre le Sous-Chef et le Chef, il y a un comptoir avec des boutons et des leviers prédéfinis et sécurisés.

Comment ça fonctionne ?

  • L'ancien problème : Si vous disiez "Fais un gâteau en forme de dragon", le Sous-Chef (l'IA) essayait d'écrire le code pour le faire. Parfois, il inventait des choses qui ne marchaient pas ou qui étaient dangereuses (comme mettre du verre dans le gâteau).
  • La solution IROSA : Quand vous dites "Va plus doucement avant d'arriver à la boîte", le Sous-Chef ne réécrit pas le code. Il regarde la Boîte à Outils. Il voit un bouton étiqueté "Ralentir". Il appuie dessus et règle le bouton sur "50%".
  • Le résultat : Le Chef (le robot) reçoit l'ordre via le bouton sécurisé. Il ralentit parfaitement, sans risque d'erreur, tout en gardant sa précision habituelle.

🛠️ Les Trois Super-Pouvoirs du Robot

Grâce à cette méthode, le robot peut comprendre trois types de demandes courantes dans l'industrie :

  1. Le "Ralentisseur" (Modulation de vitesse) :

    • Vous dites : "Ralentis de moitié quand tu approches de la pièce fragile."
    • Ce qui se passe : Le robot appuie sur le bouton "Ralentir" pour la partie précise du mouvement. Il ne change pas la trajectoire, juste le rythme, comme un musicien qui joue une note plus lentement.
  2. Le "Détour" (Insertion de points de passage) :

    • Vous dites : "Va vérifier la caméra sur la gauche avant de poser la pièce."
    • Ce qui se passe : Le robot ajoute un point de passage invisible sur son chemin. C'est comme si vous dessiniez un petit détour sur une carte GPS pour passer devant un magasin, sans changer la destination finale.
  3. Le "Bouclier" (Évitement d'obstacles) :

    • Vous dites : "Évite la boîte bleue !"
    • Ce qui se passe : Le robot crée une zone de sécurité imaginaire autour de la boîte bleue. Si son chemin prévu traverse cette zone, il repousse automatiquement sa trajectoire, comme un aimant qui repousse un autre aimant, pour passer au-dessus ou autour sans toucher.

🛡️ Pourquoi c'est plus sûr que les autres méthodes ?

D'autres systèmes essayent de faire parler le robot directement. C'est comme donner un couteau de chef à un enfant : c'est flexible, mais dangereux. Si l'enfant (l'IA) se trompe, il peut blesser le robot ou casser la pièce.

IROSA, c'est comme donner un télécommande à l'enfant. Il ne peut appuyer que sur les boutons qui existent déjà (Ralentir, Tourner, Éviter). Il ne peut pas inventer de nouveaux boutons dangereux.

  • Transparence : On sait exactement ce que le robot va faire car on voit quel bouton il a appuyé.
  • Sécurité : Même si l'IA fait une erreur d'interprétation, elle ne peut pas casser le robot car elle est limitée par les boutons sécurisés.
  • Pas de réapprentissage : On n'a pas besoin de rééduquer le robot à chaque fois. On utilise simplement les boutons.

🏁 En résumé

Cette recherche montre que nous pouvons bientôt dire à nos robots industriels : "Hé, va plus doucement là-bas, il y a un obstacle" et qu'ils le feront instantanément, en toute sécurité, sans qu'un ingénieur ne doive toucher à une seule ligne de code. C'est le début d'une collaboration naturelle entre l'humain et la machine, où l'on parle, et le robot exécute avec précision.