A Two-Stage Detection-Tracking Framework for Stable Apple Quality Inspection in Dense Conveyor-Belt Environments

Cet article présente un cadre de détection et de suivi en deux étapes combinant YOLOv8, ByteTrack et un classificateur ResNet18 pour assurer une inspection stable et temporellement cohérente de la qualité des pommes sur des convoyeurs industriels denses.

Keonvin Park, Aditya Pal, Jin Hong Mok

Publié 2026-02-24
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

🍎 Le Problème : La Foire aux Pommes en Mouvement

Imaginez un tapis roulant d'usine rempli de pommes qui défilent à toute vitesse. C'est comme une foule compacte où les pommes se bousculent, se cachent les unes derrière les autres, et où la lumière change tout le temps.

Jusqu'à présent, les systèmes automatiques fonctionnaient comme un photographe qui prend une photo à chaque seconde.

  • Le souci ? Si une pomme bouge vite, elle est floue sur la photo. Si une feuille cache un peu de la pomme, le photographe panique. Résultat : la machine dit "C'est une pomme parfaite !" à la seconde 1, puis "C'est une pomme pourrie !" à la seconde 2, juste parce que l'angle a changé. C'est le chaos pour décider si la pomme est bonne ou mauvaise.

🚀 La Solution : Le Système "Deux Étapes"

Les chercheurs (Keonvin, Aditya et Jin Hong) ont créé une nouvelle méthode en deux étapes pour transformer ce chaos en une décision stable. Imaginez que ce n'est plus un photographe, mais un système de surveillance avec un chef d'équipe.

Étape 1 : Le Détective et le Gardien (Détection et Suivi)

Au lieu de juste prendre des photos, le système utilise deux outils magiques :

  1. Le Détective (YOLOv8) : C'est un expert formé dans les vergers (en plein air) pour repérer les pommes. Même si le décor change (l'usine), il arrive à dire : "Tiens, il y a une pomme ici !"
  2. Le Gardien (ByteTrack) : C'est le vrai héros de l'histoire. Dès qu'une pomme est repérée, le Gardien lui colle une étiquette invisible (un numéro d'identité) et la suit tout au long du tapis.
    • L'analogie : Imaginez que chaque pomme porte un badge "Je m'appelle Pomme A". Même si la Pomme A passe derrière une autre pomme ou devient floue, le Gardien sait toujours que c'est bien elle. Il ne la perd pas de vue.

Étape 2 : Le Juge et le Conseil de Sagesse (Classification et Agrégation)

Une fois qu'on a suivi la pomme, on doit juger sa qualité.

  1. Le Juge (ResNet18) : C'est un expert en maladies des fruits. Il regarde la pomme (quand elle est bien visible) et dit : "Elle a une tache" ou "Elle est saine".
  2. Le Conseil de Sagesse (Agrégation) : C'est ici que la magie opère. Au lieu de se fier à une seule opinion du Juge (qui peut se tromper si la pomme bouge), le système écoute toutes les opinions du Juge sur la durée du suivi de la pomme.
    • L'analogie : Imaginez que vous devez juger un candidat. Si vous ne le voyez que pendant 1 seconde, vous pouvez vous tromper. Mais si vous le regardez pendant 10 secondes, vous voyez son vrai visage.
    • Le système dit : "Sur les 20 fois où le Juge a regardé la Pomme A, il a dit 'Saine' 18 fois et 'Malade' 2 fois. La décision finale est donc Saine."

📊 Pourquoi c'est génial ?

Avant, les machines étaient comme des gens nerveux qui changent d'avis toutes les secondes. Avec ce nouveau système :

  • Stabilité : La décision ne change plus d'une seconde à l'autre. C'est calme et fiable.
  • Robustesse : Même si la pomme est cachée un instant ou floue, le système ne panique pas car il se souvient de son identité.
  • Industrie : Ils ont créé de nouvelles règles pour mesurer la réussite, non pas sur une seule image, mais sur le comportement de la pomme pendant tout son voyage sur le tapis.

En résumé

Cette recherche nous dit que pour trier des pommes sur un tapis roulant, il ne suffit pas de bien voir, il faut bien se souvenir. En donnant une identité à chaque pomme et en prenant une décision basée sur son histoire complète (et non pas sur un instantané), on obtient un triage beaucoup plus juste et industriel. C'est passer d'une "photo floue" à un "film complet" pour prendre la bonne décision.

Recevez des articles comme celui-ci dans votre boîte mail

Digests quotidiens ou hebdomadaires personnalisés selon vos intérêts. Résumés Gist ou techniques, dans votre langue.

Essayer Digest →