Seven simple steps for log analysis in AI systems

Cet article propose un pipeline standardisé en sept étapes pour l'analyse des journaux d'événements des systèmes d'IA, illustré par des exemples de code dans la bibliothèque Inspect Scout, afin d'établir des pratiques rigoureuses et reproductibles pour les chercheurs.

Magda Dubois, Ekin Zorer, Maia Hamin, Joe Skinner, Alexandra Souly, Jerome Wynne, Harry Coppock, Lucas Satos, Sayash Kapoor, Sunischal Dev, Keno Juchems, Kimberly Mai, Timo Flesch, Lennart Luettgau, Charles Teague, Eric Patey, JJ Allaire, Lorenzo Pacchiardi, Jose Hernandez-Orallo, Cozmin Ududec

Publié 2026-04-14
📖 5 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

Imagine que les systèmes d'intelligence artificielle (IA) sont comme de grands cuisiniers robots dans une cuisine ultra-moderne. Chaque fois qu'ils préparent un plat (répondent à une question, résolvent un problème), ils laissent derrière eux une trace : des notes sur les ingrédients utilisés, les erreurs de coupe, les temps de cuisson, et même leurs pensées intérieures ("Je vais d'abord éplucher la pomme de terre...").

Ces traces, c'est ce qu'on appelle les journaux d'activité (ou logs).

Le problème ? Un seul cuisinier laisse quelques notes. Mais des milliers de robots cuisiniers, pendant des mois, génèrent des montagnes de papiers illisibles, des grimoires incompréhensibles et des milliers de livres de recettes. C'est là que cette paper intervient. Elle propose 7 étapes simples pour transformer ce chaos de papiers en une histoire claire et utile.

Voici le guide, expliqué comme si on préparait un grand banquet :

1. Définir l'objectif : "Qu'est-ce qu'on cherche ?"

Avant de fouiller dans les tiroirs, demandez-vous : Pourquoi on fouille ?

  • Est-ce pour vérifier si le robot a vraiment cuisiné le plat demandé ?
  • Est-ce pour voir s'il a refusé d'utiliser un couteau dangereux ?
  • Est-ce pour comprendre pourquoi il a brûlé la sauce ?
    L'analogie : C'est comme décider si vous êtes inspecteur des normes d'hygiène (pour vérifier la sécurité) ou critique gastronomique (pour juger le goût). Sans but précis, vous vous perdrez dans des montagnes de papiers inutiles.

2. Préparer la bibliothèque : "Ranger les dossiers"

Les notes sont souvent éparpillées, tachées de sauce ou incomplètes. Il faut les rassembler dans un classeur bien organisé.
L'analogie : Imaginez que vous transformez un tas de feuilles volantes en une bibliothèque numérique où chaque livre a une étiquette précise (date, type de plat, nom du robot). Si vous voulez trouver tous les cas où le robot a brûlé l'ail, vous devez pouvoir trier par "brûlé" et "ail" en une seconde.

3. Explorer le terrain : "Lire quelques pages au hasard"

Avant de construire un robot pour lire tous les livres, lisez-en quelques-uns vous-même.
L'analogie : C'est comme goûter un peu de la soupe avant de servir le banquet. Vous regardez quelques conversations pour voir : "Ah, tiens, le robot semble souvent confus quand on lui demande de faire des maths." ou "Oh, il refuse toujours de cuisiner du piment." Cette étape vous donne des idées sur ce qu'il faut chercher plus tard.

4. Affiner la question : "Devenir détective précis"

Maintenant que vous avez vu quelques exemples, transformez votre vague curiosité en une question précise.

  • Vague : "Le robot est-il bizarre ?"
  • Précis : "Le robot utilise-t-il des mots comme 'dangereux' ou 'je ne peux pas' quand on lui demande de hacker un site ?"
    L'analogie : Au lieu de chercher "un monstre" dans la forêt, vous cherchez spécifiquement "des traces de pas de loup avec une patte manquante". Plus la question est précise, plus vous trouverez la réponse.

5. Créer le détecteur (Scanner) : "Fabriquer un robot-chien"

C'est l'étape la plus technique. Vous créez un petit programme (un "scanner") qui va lire des milliers de pages à votre place pour trouver vos "traces de pas".
L'analogie : Vous ne pouvez pas lire 10 000 livres vous-même. Alors, vous entraînez un chien de police (le scanner) à renifler un mot précis.

  • Attention : Si vous dites au chien "cherche un chien", il risque de chercher n'importe quel animal. Il faut lui donner des règles très claires : "Si tu vois le mot 'dangereux' suivi de 'je refuse', aboie !"
  • Le papier conseille de bien définir ces règles (le "rubric") et de demander au chien de vous expliquer pourquoi il a aboie.

6. Vérifier le détecteur : "Le test de fiabilité"

Votre chien-chien est-il fiable ? Ou aboie-t-il sur des feuilles mortes ?
L'analogie : Vous prenez un échantillon de 100 livres que vous avez déjà lus et notés vous-même (la "vérité terrain"). Vous faites courir votre chien dessus.

  • Si le chien aboie sur les bons livres et se tait sur les autres : Excellent !
  • S'il aboie sur des livres normaux (faux positif) ou ignore les livres dangereux (faux négatif) : Recyclage ! Il faut retravailler ses règles d'entraînement.

7. Utiliser les résultats : "Servir le banquet"

Une fois que votre détecteur est fiable, vous lancez l'analyse sur toute la base de données.
L'analogie : Maintenant, vous avez une carte complète de la forêt. Vous pouvez dire : "80% des robots refusent de cuisiner du piment, mais seulement 10% refusent de cuisiner des légumes."
Ces données vous permettent de :

  • Corriger les robots : "Hé, arrête de refuser les légumes !"
  • Améliorer la sécurité : "Oh, ils refusent trop souvent, il faut peut-être changer la recette."
  • Comprendre l'avenir : "Si on leur donne plus de temps, vont-ils accepter le piment ?"

En résumé

Ce papier est un manuel de survie pour ne pas se noyer dans l'océan de données que produisent les IA. Il dit : "Ne vous contentez pas de regarder les chiffres. Lisez les histoires, posez-vous les bonnes questions, créez des outils précis pour les vérifier, et utilisez ces découvertes pour rendre les IA plus sûres et plus intelligentes."

C'est passer du chaos des papiers éparpillés à la clarté d'une carte au trésor.

Recevez des articles comme celui-ci dans votre boîte mail

Digests quotidiens ou hebdomadaires personnalisés selon vos intérêts. Résumés Gist ou techniques, dans votre langue.

Essayer Digest →