Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement

Le papier présente CoFiCot, un cadre adaptatif de raffinement grossier-à-fin qui alloue dynamiquement des ressources de calcul en fonction de la difficulté des requêtes, en triant les questions via un classificateur multi-métrique et en appliquant une correction contextuelle étatique pour éviter la fragmentation du contexte tout en assurant la cohérence logique.

Dongxu Zhang, Hongqiang Lin, Yiding Sun, Pengyu Wang, Qirui Wang, Ning Yang, Jihua Zhu

Publié 2026-03-10
📖 5 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

🧠 Le Problème : Le Dilemme du "Tout ou Rien"

Imaginez que vous avez un assistant très intelligent (une Intelligence Artificielle) pour résoudre des énigmes. Jusqu'à présent, on lui donnait le même traitement pour tout :

  • Si on lui demande "Combien font 2 + 2 ?", il réfléchit pendant 10 minutes, écrit un roman, et finit par se tromper parce qu'il a trop pensé ! C'est ce qu'on appelle la sur-réflexion.
  • Si on lui demande de résoudre un problème de physique complexe, on lui donne le même petit temps de réflexion. Il s'arrête en cours de route, épuisé, et donne une réponse incomplète. C'est la réflexion insuffisante.

C'est le paradoxe : donner la même énergie à une tâche facile et à une tâche difficile ne fonctionne pas bien.

💡 La Solution : CoFiCot (Le Chef de Cuisine Adaptatif)

Les auteurs de ce papier proposent une nouvelle méthode appelée CoFiCot. Imaginez un chef de cuisine très organisé qui gère un restaurant. Au lieu de faire cuire tous les plats de la même façon, il adapte sa stratégie selon la difficulté de la commande.

Voici comment CoFiCot fonctionne, étape par étape :

1. Le Tri Rapide (La Classification "Grossière")

Dès qu'une question arrive, le chef ne se lance pas tout de suite dans la cuisson. Il lance d'abord un tri rapide (comme un trieur de courrier).

  • Il demande à plusieurs "cuisiniers" (le modèle de base) de donner une première ébauche de réponse.
  • Il regarde ces ébauches avec trois lunettes différentes :
    • La Confiance : Est-ce que tout le monde est d'accord ? (Si oui, c'est probablement facile).
    • La Fiabilité : Est-ce que l'accord est logique ou juste une erreur commune ?
    • La Complexité : Le chef estime mentalement combien d'étapes sont nécessaires.
  • Résultat : Il classe la question en Facile, Moyenne ou Difficile.

2. La Stratégie Différenciée (Le Cuisson "Fine")

Une fois la difficulté connue, le chef agit différemment :

  • Pour les questions FACILES (ex: "2+2") :

    • L'analogie : C'est comme commander un café. Le chef dit : "Ok, tout le monde est d'accord, c'est facile."
    • Action : Il prend la réponse la plus populaire et la sert immédiatement. Zéro gaspillage de temps. Il évite de faire rôtir le café !
  • Pour les questions MOYENNES ou DIFFICILES (ex: un problème de mathématiques complexe) :

    • L'analogie : C'est comme préparer un gâteau à plusieurs étages. Si une étape rate, tout le gâteau est fichu.
    • Action : Le chef lance un cycle de correction. Il ne jette pas tout le gâteau par terre pour recommencer (ce qui serait lent). Au lieu de cela, il utilise un mécanisme "État de Mémoire".

3. Le Secret : La Correction "Souvenez-vous de l'Histoire"

C'est ici que CoFiCot brille.

  • Les anciennes méthodes : Si une étape est fausse, elles effacent tout et recommencent de zéro. C'est comme si un écrivain effaçait tout son livre pour corriger une faute de frappe au début.
  • La méthode CoFiCot : Elle agit comme un éditeur de livre intelligent.
    1. Il repère l'erreur précise (ex: "Tu as oublié de diviser par 2 à l'étape 3").
    2. Il garde les étapes 1 et 2 qui étaient correctes (il ne les touche pas).
    3. Il réécrit uniquement l'étape 3 et toutes celles qui suivent, en se basant sur ce qui a été validé avant.
    4. Il vérifie que la nouvelle histoire reste logique du début à la fin.

C'est ce qu'ils appellent une révision séquentielle avec état. Le modèle se souvient de ce qui a déjà été prouvé vrai et ne corrige que ce qui est cassé, en assurant que la suite du raisonnement s'adapte parfaitement.

🏆 Pourquoi c'est génial ?

  1. Économie d'énergie : Pour les questions faciles, il ne perd pas de temps à réfléchir. Pour les difficiles, il ne s'arrête pas trop tôt.
  2. Moins d'erreurs : En ne jetant pas tout le raisonnement, il évite de créer de nouvelles erreurs en réécrivant des parties qui étaient déjà bonnes.
  3. Résultats : Sur des tests de mathématiques et de logique, cette méthode bat les anciennes techniques (qui utilisent soit beaucoup de temps, soit peu de temps) en obtenant de meilleures réponses avec moins de "mots" générés.

En résumé

CoFiCot, c'est comme avoir un directeur de projet ultra-efficace.

  • Il ne fait pas travailler tout le monde sur tout.
  • Il identifie vite ce qui est simple pour le régler immédiatement.
  • Pour les problèmes complexes, il intervient chirurgicalement pour corriger les erreurs sans tout casser, en gardant une mémoire de ce qui a déjà été réussi.

C'est la fin du "tout faire de la même façon" pour les intelligences artificielles : enfin, elles apprennent à adapter leur effort à la difficulté de la tâche.