Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

Le papier présente EvoKernel, un cadre d'agents auto-évolutif qui surmonte le manque de données pour la synthèse de noyaux NPU en utilisant une approche de mémoire basée sur la valeur pour passer du brouillage initial au raffinement continu, améliorant ainsi considérablement la justesse et les performances des modèles de langage.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen

Publié 2026-03-12
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

🌟 Le Problème : Construire une maison sur un terrain vide

Imaginez que vous êtes un architecte de génie (une Intelligence Artificielle très puissante) capable de construire des gratte-ciels parfaits dans des villes connues comme New York ou Tokyo. Ces villes sont pleines de plans, de livres d'architecture et d'experts pour vous aider. C'est comme programmer pour les puces graphiques de NVIDIA (CUDA), où tout est documenté.

Mais, imaginez maintenant qu'on vous envoie sur une nouvelle île déserte (une nouvelle puce informatique appelée NPU).

  • Il n'y a aucun livre sur l'île.
  • Il n'y a aucun expert local.
  • Les règles de construction sont totalement différentes.

Si vous essayez de construire une maison ici avec vos anciennes connaissances, vous allez échouer. C'est ce qu'on appelle le "Cold Start" (démarrage à froid). Les meilleures IA du monde échouent lamentablement sur ces nouvelles puces car elles ne peuvent pas "deviner" les règles sans exemples.

🚀 La Solution : EvoKernel, l'Apprenti Ingénieur qui a une Mémoire

Les chercheurs de l'Université Jiao Tong de Shanghai ont créé EvoKernel. Ce n'est pas une IA qui apprend par cœur, mais un système qui apprend en faisant et en se souvenant.

Imaginez EvoKernel comme un apprenti ingénieur très curieux qui possède deux super-pouvoirs :

1. Le "Brouillon" (Drafting) : Essayer de faire fonctionner la machine

Au début, l'ingénieur ne sait pas par où commencer. Il essaie de construire une maison, mais elle s'effondre.

  • L'erreur : "Oh, j'ai utilisé le mauvais ciment."
  • La leçon : Au lieu de jeter ce brouillon à la poubelle, EvoKernel le note dans un carnet de notes magique. Il écrit : "Ne jamais utiliser ce ciment pour ce type de sol."
  • Le but : Trouver une maison qui tient debout, même si elle est moche.

2. Le "Raffinement" (Refining) : Rendre la maison rapide et élégante

Une fois qu'il a une maison qui ne s'effondre pas, il ne s'arrête pas là. Il veut qu'elle soit construite en 10 minutes au lieu de 10 heures.

  • Il regarde son carnet de notes pour voir ce qui a fonctionné sur d'autres chantiers.
  • Il dit : "Tiens, sur le chantier d'à côté, j'ai utilisé une grue différente qui a fait gagner du temps."
  • Il applique cette astuce. Si ça marche, il note la nouvelle astuce dans le carnet. Si ça rate, il note aussi pourquoi.

🧠 Le Secret : La "Mémoire à Valeur" (Value-Driven Memory)

C'est ici que la magie opère. La plupart des systèmes oublient tout une fois le projet fini. EvoKernel, lui, a une mémoire qui apprend à trier.

Imaginez que votre carnet de notes soit rempli de milliers d'astuces.

  • Le problème : Si vous cherchez "comment faire une porte", vous ne voulez pas lire 100 pages sur "comment peindre un mur".
  • La solution d'EvoKernel : Il a un petit assistant (un algorithme de "valeur") qui regarde votre problème actuel et dit : "Attends, pour ce problème précis, l'astuce #42 sur la 'grue rapide' est la plus utile !"

Cet assistant apprend à chaque essai. Plus il essaie, plus il devient bon pour savoir quelle information chercher dans le carnet pour résoudre le problème actuel. Il ne se contente pas de copier-coller ; il comprend pourquoi une astuce fonctionne dans un contexte donné.

🏆 Les Résultats : De l'échec total à la maîtrise

Grâce à cette méthode, EvoKernel a réussi à faire ce que les plus grandes IA du monde ne pouvaient pas faire sur les puces NPU :

  1. Il a appris de zéro : Sans aucun manuel ni expert humain.
  2. Il a réussi : Il est passé d'un taux de réussite de 11% (presque rien) à 83% (presque parfait).
  3. Il a accéléré : Les maisons qu'il construit sont 3,6 fois plus rapides que ses premiers brouillons.

💡 En résumé

EvoKernel, c'est comme donner à un génie une mémoire collective qui s'améliore toute seule. Au lieu de réinventer la roue à chaque fois, il consulte son carnet de notes intelligent pour savoir quelle astuce utiliser, ce qui lui permet de maîtriser des technologies nouvelles et complexes (comme les puces NPU) beaucoup plus vite que n'importe quel humain ou IA traditionnelle.

C'est la preuve que pour apprendre dans un monde sans données, il ne faut pas plus de livres, mais un meilleur système pour se souvenir de ses propres erreurs et de ses propres succès.