Beyond Fine-Tuning: Robust Food Entity Linking under Ontology Drift with FoodOntoRAG

Each language version is independently generated for its own context, not a direct translation.

🍎 Le Problème : La Cuisine du Chaos

Imaginez que vous essayez de faire un inventaire précis de tous les ingrédients du monde, des étiquettes de yaourts aux menus de restaurants. Le problème, c'est que les gens appellent les choses de mille façons différentes.

L'un dit "sucre glace", l'autre "sucre en poudre".
L'un écrit "citrate d'acide", l'autre "additif 330".
Et les noms changent tout le temps (comme les recettes de grand-mère qui évoluent).

Pour les experts en nutrition et les régulateurs, c'est un cauchemar. Ils ont besoin d'un dictionnaire universel (une "ontologie") pour savoir exactement de quoi on parle. Mais ce dictionnaire est énorme, change souvent, et les ordinateurs traditionnels ont du mal à s'y retrouver sans être "entraînés" spécifiquement pour chaque nouvelle version. C'est comme essayer d'apprendre à un chien à reconnaître tous les types de chiens du monde, mais chaque fois que le dictionnaire change, il faut recommencer l'entraînement de zéro. C'est cher, lent et fragile.

🦸‍♂️ La Solution : FoodOntoRAG (Le Détective Intelligentsia)

Les auteurs de cet article ont créé un nouveau système appelé FoodOntoRAG. Au lieu d'entraîner un robot à mémoriser tout le dictionnaire (ce qui est lourd), ils ont créé une équipe de quatre détectives qui travaillent ensemble pour trouver la bonne réponse en temps réel.

Voici comment cette équipe fonctionne, étape par étape :

1. Le Chasseur (Le Récupérateur Hybride)

Imaginez un chasseur qui a deux types de jumelles :

Jumelles à lettres (Lexicales) : Il cherche des mots qui se ressemblent exactement (ex: "poudre" et "poudre").
Jumelles à sens (Sémantiques) : Il cherche des mots qui veulent dire la même chose, même si les lettres sont différentes (ex: "sucre glace" et "sucre en poudre").
Ce chasseur ne cherche pas tout le dictionnaire au hasard. Il fouille rapidement et ramène une petite liste de 30 candidats potentiels qui pourraient correspondre à votre ingrédient.

2. Le Juge (Le Sélecteur)

Ce candidat arrive devant un juge très strict. Le juge regarde la liste des 30 candidats et doit en choisir un seul.

Sa règle d'or : Si le mot correspond exactement, c'est gagné.
Sa règle de précision : Si plusieurs choix sont possibles, il préfère le plus précis (ex: "pomme Granny Smith" est mieux que juste "pomme").
Le juge explique son choix : "Je choisis celui-ci parce que la définition correspond parfaitement."

3. Le Contrôleur de Qualité (Le Scorer)

Le travail du juge n'est pas fini. Un deuxième expert, le Contrôleur, vérifie le travail du juge.

Il donne une note de confiance (de 0 à 100%).
Si le juge a fait une erreur ou si le choix est douteux (par exemple, si on parle de "Lebanon" la ville et que le juge a choisi "pain libanais" alors qu'on parlait de la nationalité), le Contrôleur dit : "Non, ce n'est pas bon !".
Il explique pourquoi : "C'est une erreur de catégorie."

4. Le Traducteur Créatif (Le Générateur de Synonymes)

C'est ici que la magie opère. Si le Contrôleur rejette la réponse, il ne dit pas simplement "échec". Il appelle le Traducteur.

Le Traducteur dit : "Attends, peut-être que le problème est la façon dont on a posé la question. Essayons de reformuler !".
Il propose de nouveaux mots (synonymes) pour la même idée.
Le système recommence le tour avec ces nouveaux mots, comme si on relançait la recherche avec une meilleure question.

🔄 Pourquoi c'est génial ? (L'Analogie de la Bibliothèque Vivante)

Les méthodes anciennes (le "Fine-Tuning") sont comme un étudiant qui mémorise un livre de cuisine par cœur. Si le livre change une page (une nouvelle recette ou un nouveau nom d'ingrédient), l'étudiant est perdu et doit tout réapprendre.

FoodOntoRAG, lui, est comme un bibliothécaire ultra-rapide qui ne mémorise rien par cœur.

Il va chercher les informations dans la bibliothèque (le dictionnaire) au moment où on lui pose la question.
Si la bibliothèque change demain (nouvelle édition), le bibliothécaire n'a pas besoin d'étudier. Il va juste chercher dans la nouvelle version.
Il est capable de dire : "Je ne suis pas sûr à 100%, je vais reformuler ma question pour être certain."

📊 Les Résultats : Qui gagne ?

Les chercheurs ont testé ce système sur deux terrains :

Des recettes de cuisine connues : Le système a obtenu environ 58% de réussite du premier coup, mais en utilisant sa capacité à se corriger (le boucle de feedback), il a atteint 97% de précision après vérification humaine. C'est impressionnant car il n'a jamais été "entraîné" sur ces données spécifiques !
Des produits de supermarché réels (marques inconnues) : Là, le système a écrasé la concurrence. Il a obtenu 90% de réussite, tandis que l'ancien modèle (qui avait été entraîné sur des données anciennes) n'en avait que 37%. Pourquoi ? Parce que le nouveau système s'adapte aux nouveaux produits, alors que l'ancien était "aveugle" aux nouveautés.

🌟 En Résumé

FoodOntoRAG est une méthode intelligente pour comprendre ce qu'il y a dans nos assiettes, sans avoir besoin d'entraîner des robots géants et coûteux.

Il est robuste : Il ne panique pas quand le dictionnaire change.
Il est explicable : Il vous dit toujours pourquoi il a choisi un ingrédient.
Il est autonome : Il se corrige lui-même s'il fait une erreur.

C'est comme passer d'un éléphant qui doit tout apprendre par cœur à un détective agile qui sait utiliser sa bibliothèque pour résoudre n'importe quel mystère culinaire, même les plus récents.

Each language version is independently generated for its own context, not a direct translation.

Voici un résumé technique détaillé du papier de recherche « Beyond Fine-Tuning: Robust Food Entity Linking under Ontology Drift with FoodOntoRAG », rédigé en français.

1. Problématique

L'analyse des données alimentaires (étiquettes de produits, menus, listes d'ingrédients) est entravée par la complexité du langage naturel : synonymes multiples (ex: « sucre glace » vs « sucre en poudre »), variations culturelles, formulations basées sur le rôle (ex: « acidifiant » vs « acide citrique ») et dérivés multilingues.
Le défi principal réside dans le Named Entity Linking (NEL) : mapper ces mentions textuelles vers des identifiants de concepts normalisés dans des ontologies (comme FoodOn, SNOMED-CT, FoodEx2).
Les approches actuelles reposent principalement sur le fine-tuning de modèles de langage (LLM) sur des corpus spécifiques. Cependant, cette méthode présente trois limites majeures :

Coût computationnel élevé pour l'entraînement et la maintenance.
Rigidité face à la dérive des ontologies (Ontology Drift) : les modèles sont liés à une version spécifique de l'ontologie et se dégradent lorsque celle-ci évolue.
Manque de généralisation : les modèles entraînés sur un domaine (ex: recettes) peinent à s'adapter à d'autres (ex: listes d'ingrédients de produits industriels).

2. Méthodologie : FoodOntoRAG

Le papier propose FoodOntoRAG, un pipeline agnostique (indépendant du modèle et de l'ontologie) basé sur la Génération Augmentée par Récupération (RAG). Au lieu d'entraîner le modèle, le système récupère des preuves structurées depuis l'ontologie pour guider un LLM.

Le système est composé de quatre agents interconnectés dans une boucle de rétroaction :

Agent de Récupération Hybride (Hybrid Retriever) :
- Il combine une recherche lexicale (via l'index Whoosh utilisant BM25 sur les labels, synonymes et définitions) et une recherche sémantique (via FAISS utilisant des embeddings denses générés par le modèle all-MiniLM-L6-v2).
- Il retourne un ensemble restreint de candidats (environ 30) pour réduire l'espace de recherche avant l'invocation du LLM.
Agent Sélecteur (Selector Agent) :
- C'est un LLM qui reçoit la requête utilisateur et la liste des candidats récupérés.
- Il applique des règles strictes via le prompting : privilégier les correspondances exactes (labels/synonymes) et choisir le terme le plus spécifique (éviter les hyperonymes trop larges).
- Il produit un identifiant unique (CURIE) et une justification JSON.
Agent Évaluateur de Confiance (LLM Scorer) :
- Agent distinct du sélecteur, il évalue la pertinence de la sélection avec un score de confiance continu [0, 1].
- Il pénalise les incohérences d'identité (ex: confondre une nationalité avec un aliment) et vérifie les indicateurs de formulation.
- Si le score est inférieur à un seuil $\tau$ , il déclenche une boucle de réessai.
Agent Générateur de Synonymes (Synonym Generator) :
- Déclenché uniquement en cas de faible confiance. Il reformule la requête initiale en proposant de nouvelles variantes (synonymes directs, termes scientifiques, paraphrases) pour relancer la récupération.
- Cette boucle est limitée à une seule itération (one-hop) pour éviter la dérive sémantique.

3. Contributions Clés

Architecture sans Fine-Tuning : Démontre qu'un pipeline RAG peut atteindre des performances compétitives sans entraînement spécifique, réduisant les coûts et facilitant la mise à jour des connaissances.
Robustesse à la Dérive des Ontologies : Le système s'adapte dynamiquement aux nouvelles versions des ontologies en récupérant les données à la volée, contrairement aux modèles statiques.
Interprétabilité et Justification : Chaque décision est accompagnée d'une justification explicite (rationale) et d'un score de confiance, permettant une validation humaine facile.
Outils Open Source : Mise à disposition de l'ensemble des artefacts (données, code, scripts de prétraitement, et une application interactive de comparaison) pour assurer la reproductibilité.

4. Résultats Expérimentaux

Les évaluations ont été menées sur deux jeux de données :

CafeteriaFCD (Recettes annotées) :
- Sur un corpus de 948 mentions uniques, FoodOntoRAG atteint une précision (Acc@1) d'environ 58-60% avec un seuil de confiance optimal ( $\tau \approx 0.6-0.7$ ).
- Analyse des erreurs : Une réévaluation manuelle a révélé que la majorité des "erreurs" initiales (76,9%) étaient en réalité des correspondances exactes ou des variations sémantiques valides (ex: choix entre un taxon biologique et un produit alimentaire) non prises en compte par les annotations de référence. Après ajustement pour ces variations d'ontologie, la précision réelle s'élève à 97%.
- Le taux de réessai (retry) reste faible (7-12%), indiquant que la plupart des bonnes réponses sont trouvées au premier passage.
Open Food Facts (Produits de marque) :
- Évaluation sur 119 ingrédients de produits commerciaux (incluant additifs et colorants, absents des données d'entraînement de modèles concurrents).
- FoodOntoRAG : 90,7% de précision.
- FoodSEM (Modèle de l'état de l'art fine-tuné) : 36,9% de précision.
- Analyse : La performance supérieure de FoodOntoRAG s'explique par sa capacité à gérer des entités non vues lors de l'entraînement (additifs chimiques) grâce à la récupération dynamique, tandis que le modèle fine-tuné échoue face à cette dérive de domaine.

5. Signification et Conclusion

Ce travail démontre que l'approche RAG est une alternative viable et durable au fine-tuning pour le lien d'entités dans des domaines à évolution rapide comme l'alimentation.

Avantages : Réduction des coûts de calcul, adaptabilité aux mises à jour des ontologies, et décisions transparentes.
Limites et Perspectives : La qualité dépend du modèle d'embedding utilisé et du nombre de candidats récupérés. Les travaux futurs viseront l'intégration de domaines supplémentaires (médicaments, maladies) et l'optimisation dynamique des poids du récupérateur.

En conclusion, FoodOntoRAG offre un cadre robuste pour l'interopérabilité des données alimentaires, répondant aux principes FAIR (Findable, Accessible, Interoperable, Reusable) sans la lourdeur des modèles entraînés de manière supervisée.