\textsc{RooAgent}: An LLM Agent for \textsc{Root}-Based… — Explication vulgarisée

Imaginez que vous possédiez une bibliothèque massive et incroyablement complexe de données scientifiques. Dans le monde de la physique des particules, cette bibliothèque s'appelle Root, et elle contient les « reçus » de milliards de collisions de particules. Pour trouver une information spécifique — comme un type particulier de particule ou un motif dans les données — vous devez généralement être un bibliothécaire parlant une langue très difficile et technique (le code de programmation). Si vous ne connaissez pas le code exact, vous ne pouvez pas emprunter le livre.

RooAgent revient à engager un assistant de bibliothécaire surdoué et multilingue qui parle votre langue (l'anglais courant) et connaît parfaitement le code secret de la bibliothèque.

Voici comment cela fonctionne, décomposé en concepts simples :

1. Le Problème : La Barrière de la « Langue Étrangère »

Les physiciens des hautes énergies utilisent un outil appelé PyRoot pour analyser les données. Il est puissant, mais c'est comme essayer de commander un repas complexe dans un restaurant où le menu est écrit dans une langue que vous ne parlez pas. Vous devez connaître la syntaxe exacte pour demander « un histogramme de la quantité de mouvement des électrons » ou « un dénombrement des événements où les jets sont lourds ». Si vous faites une faute de frappe ou utilisez le mauvais mot, l'ordinateur répond simplement « Erreur ».

2. La Solution : L'Agent « Traducteur »

RooAgent agit comme un traducteur. Vous n'avez pas besoin d'apprendre le code. Vous dites simplement à l'agent ce que vous voulez en anglais courant, comme :

« Montrez-moi un graphique de la masse des quarks bottom. »
« Comptez combien d'événements se produisent si je ne regarde que les particules se déplaçant plus vite que 50 GeV. »
« Trouvez la meilleure coupure pour séparer le signal du bruit de fond. »

L'agent (alimenté par un grand modèle de langage, ou LLM) écoute votre demande, la traduit en commandes techniques correctes, exécute l'analyse et vous rend le résultat — généralement un graphique, un tableau de nombres ou un résumé.

3. Comment Ça Marche : La « Boîte à Outils »

Imaginez l'agent comme un ouvrier du bâtiment avec une boîte à outils spécifique. L'article décrit deux façons dont cet ouvrier peut être engagé :

Le Mode LangGraph : L'ouvrier utilise un « contremaître » (LangGraph) pour gérer une équipe de modèles d'IA (comme GPT-4.1 ou DeepSeek-V3). Le contremaître décompose votre grande demande en petites étapes, demande à l'IA de choisir le bon outil, puis l'exécute.
Le Mode MCP : L'ouvrier parle directement à un autre patron IA (Claude d'Anthropic) en utilisant un protocole standard (Model Context Protocol).

Dans les deux cas, les « outils » dans la boîte à outils sont des fonctions informatiques préécrites qui font le gros du travail :

Inspection : Regarder à l'intérieur des fichiers de données pour voir ce qu'ils contiennent.
Dénombrement : Compter combien d'événements respectent une règle spécifique.
Tracé : Dessiner les graphiques et les diagrammes.
Ajustement : Tracer une courbe lisse à travers les points de données pour en voir la forme.
Calcul : Faire les mathématiques pour déterminer si une découverte est statistiquement significative.

4. L'« Essai Routier »

Les auteurs ont testé cet assistant avec plusieurs scénarios pour voir s'il pouvait gérer le travail :

La Simulation « ZH » : Ils ont simulé une collision de particules spécifique (un boson Z et un boson de Higgs). L'agent a trouvé avec succès les fichiers, tracé les graphiques, compté les événements et même trouvé le « point idéal » (la meilleure coupure) pour séparer le signal du bruit de fond.
Le Défi « Multi-Tâches » : Ils ont donné à l'agent une longue et complexe instruction pour faire six choses différentes à la fois (ajuster une courbe, créer des graphiques de comparaison, exécuter un flux de coupures, optimiser les coupures, balayer des fenêtres de masse et classer les résultats). L'agent a effectué les six étapes à la suite sans aide humaine.
Le Test Statistique « Jouet » : Ils ont créé un ensemble de données factice avec un signal caché. L'agent a balayé avec succès différentes valeurs de masse, trouvé le signal caché au bon endroit (250 GeV) et calculé la probabilité qu'il ne s'agisse pas d'un simple hasard.
Le Test « Monde Réel » : Ils ont utilisé de vraies données publiques de l'expérience ATLAS au CERN (le Grand collisionneur de hadrons). L'agent a analysé avec succès les données pour un boson de Higgs se désintégrant en quatre leptons, produisant un graphique empilé correspondant à ce que des experts humains auraient produit.

5. Le Résultat

L'article affirme que RooAgent fonctionne. Il a transformé avec succès des questions en anglais courant en réponses complexes de physique.

Il a géré correctement 19 tests sur 20 de tâches uniques.
Il a terminé un flux de travail multi-tâches en 6 étapes sans s'arrêter.
Il a produit les mêmes résultats numériques qu'il utilisait GPT-4.1 d'OpenAI ou Sonnet 4.6 d'Anthropic.

La Chose :
L'agent n'est pas parfait. Lors d'un test, il s'est confondu parce que l'utilisateur avait tapé « Events » (E majuscule) au lieu de « events » (e minuscule) pour le nom du fichier. L'agent s'est arrêté et a demandé des clarifications plutôt que de deviner. De plus, parfois différents modèles d'IA peuvent choisir des plages légèrement différentes pour un graphique (par exemple, montrer 0–100 GeV contre 0–200 GeV), mais le calcul de base reste le même.

Résumé

RooAgent est un pont. Il permet aux physiciens (et potentiellement aux étudiants ou aux nouveaux chercheurs) de parler à leurs données en langage humain, tandis que l'ordinateur gère le langage technique complexe requis pour effectuer réellement l'analyse. Il ne remplace pas la compréhension du physicien de la physique, mais il élimine la barrière consistant à devoir mémoriser la syntaxe complexe du code pour faire le travail.

Résumé technique de "RooAgent : Un agent LLM pour l'analyse de physique des hautes énergies basée sur ROOT"

Énoncé du problème
L'analyse des données en physique des hautes énergies (HEP) repose fortement sur le framework ROOT et son interface Python, PyROOT, pour des tâches allant de la sélection d'événements et de l'histogrammage à l'inférence statistique. Cependant, l'utilisation de ces outils nécessite une familiarité significative avec des conventions d'API spécifiques, des structures de données (telles que les branches TTree) et l'organisation interne des échantillons d'entrée. Cette barrière à l'entrée peut entraver les nouveaux utilisateurs et rendre les tâches routinières inefficaces. Bien que les modèles de langage (LLM) aient montré des promesses dans l'automatisation de workflows multi-étapes via des "appels d'outils", il existe un besoin d'une interface spécialisée qui mappe directement les objectifs en langage naturel vers les appels de fonctions spécifiques requis pour l'analyse basée sur ROOT.

Méthodologie
Les auteurs présentent RooAgent, un package Python qui agit comme une interface en langage naturel pour l'analyse basée sur ROOT. Le système enveloppe les fonctions PyROOT en tant qu'outils exécutables pour un agent LLM. L'architecture prend en charge deux modes de fonctionnement distincts, utilisant tous deux la même implémentation sous-jacente de PyROOT :

Mode Agent LangGraph : Compatible avec GPT-4.1 d'OpenAI (via GitHub Copilot) et DeepSeek-V3 (via Ollama). Dans ce mode, le LLM raisonne sur les invites utilisateur, sélectionne des outils, construit des arguments et appelle itérativement des fonctions PyROOT jusqu'à ce que l'objectif de l'utilisateur soit atteint.
Mode Protocole de Contexte de Modèle (MCP) : Conçu pour l'intégration avec l'interface de ligne de commande (CLI) d'Anthropic Claude (spécifiquement testé avec Sonnet 4.6). Ce mode fonctionne comme un serveur MCP, où la CLI Claude agit à la fois comme le LLM et la couche d'orchestration, éliminant le besoin de dépendances LangChain ou LangGraph.

L'ensemble d'outils est modulaire et couvre le spectre complet des tâches courantes d'analyse ROOT, notamment :

Inspection : Listage du contenu des fichiers, des structures TTree et des types de données des branches.
Comptage et Sélection : Application de coupures booléennes, génération de flux de coupures (cutflows) et calcul des rendus d'événements.
Histogrammes et Statistiques : Remplissage d'histogrammes à partir de branches TTree, calcul d'intégrales, de moyennes et de RMS, et calcul de la significativité ( $S/\sqrt{S+B}$ ).
Visualisation : Génération de graphiques 1D et 2D, superposition de distributions et application d'échelles logarithmiques.
Ajustement (Fitting) : Réalisation d'ajustements gaussiens, exponentiels ou polynomiaux sur des distributions.
Optimisation : Balayage des seuils de coupure pour maximiser la significativité.
Export : Conversion des branches TTree en fichiers CSV.

Le système est conçu pour un raisonnement itératif, permettant à l'agent d'appeler plusieurs fois les outils pour affiner les résultats ou corriger des erreurs (par exemple, clarifier les noms d'arbres ou ajuster les plages de tracés).

Contributions clés

Interface unifiée : RooAgent fournit un ensemble cohérent d'outils d'analyse accessibles via le langage naturel sur différents backends LLM (OpenAI, Ollama, Anthropic) sans nécessiter de modifications du code d'analyse sous-jacent.
Registre d'outils : Le package expose une bibliothèque complète de fonctions enveloppées par PyROOT spécifiquement adaptées aux workflows HEP, incluant le calcul de significativité, la génération de flux de coupures et l'ajustement paramétrique.
Architecture double mode : En prenant en charge à la fois un agent basé sur LangGraph et un serveur MCP, le package offre de la flexibilité aux utilisateurs préférant différents écosystèmes LLM et méthodes de déploiement (local vs cloud).

Résultats
Les auteurs ont évalué RooAgent en utilisant des simulations Monte Carlo de $pp \to ZH$ ( $Z \to \ell^+\ell^-, H \to b\bar{b}$ ) et de processus de fond, ainsi que des données ouvertes d'ATLAS pour le canal $H \to ZZ^* \to 4\ell$ .

Performance de référence : Dans une série de 20 tests de tâches uniques, l'agent a produit avec succès des résultats pour 19 tâches. Les tâches comprenaient l'inspection de fichiers, le tracé d'histogrammes, le comptage d'événements, la définition de variables, l'ajustement gaussien et le balayage de significativité. Un échec est survenu en raison d'un problème de sensibilité à la casse dans une recherche de nom d'arbre, que l'agent a correctement identifié et signalé pour clarification plutôt que de produire un résultat faux.
Workflow multi-tâches : Une invite complexe exigeant six tâches séquentielles (ajustement, comparaisons cinématiques, génération de flux de coupures, optimisation de coupures, balayage de fenêtre de masse et classement de coupures) a été exécutée avec succès en environ 225 secondes sans intervention humaine.
Analyse statistique : Dans une analyse statistique factice impliquant une grille d'hypothèses de masse, l'agent a correctement fait correspondre les histogrammes, calculé les significativités observées et attendues, les valeurs p et les valeurs $CL_s$ , et identifié la masse du signal injecté (250 GeV) comme le candidat le plus fort.
Application aux données ouvertes : Appliqué aux données ouvertes d'ATLAS, l'agent a traité avec succès plusieurs fichiers ROOT, appliqué des coupures de sélection de leptons séquentielles, généré des flux de coupures et produit un graphique empilé du signal et du fond superposé aux données. Les résultats étaient cohérents entre GPT-4.1 et Sonnet 4.6.
Variations de modèles : L'article note que bien que la logique centrale reste cohérente, différents LLM (par exemple, GPT-4.1 vs DeepSeek-V3) peuvent faire des choix différents concernant les plages de tracés ou la normalisation lorsqu'ils ne sont pas explicitement contraints, soulignant l'importance de la spécificité des invites.

Signification
L'article affirme que RooAgent comble avec succès le fossé entre les invites en langage simple et les exigences techniques de l'analyse HEP basée sur ROOT. En automatisant la sélection des outils et des arguments, le système rationalise les tâches routinières et abaisse la barrière à l'entrée pour les utilisateurs peu familiers avec les subtilités de l'API ROOT. Les auteurs positionnent ce travail comme une étape vers une analyse de données HEP plus accessible, démontrant que les agents LLM peuvent orchestrer efficacement des workflows complexes et multi-étapes impliquant l'inspection de fichiers, l'inférence statistique et la visualisation. Le package est modulaire, permettant de futures extensions telles que l'intégration d'algorithmes d'apprentissage automatique en tant qu'outils appelables ou l'identification de variables optimales de sélection d'événements.

\textsc{RooAgent}: An LLM Agent for \textsc{Root}-Based High Energy Physics Analysis