A Two-Stage Detection-Tracking Framework for Stable Apple Quality Inspection in Dense Conveyor-Belt Environments

Este artigo apresenta um framework de dois estágios que combina detecção YOLOv8, rastreamento ByteTrack e classificação ResNet18 para garantir inspeção de qualidade estável e temporalmente consistente de maçãs em esteiras rolantes industriais densas.

Keonvin Park, Aditya Pal, Jin Hong Mok

Publicado 2026-02-24
📖 3 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é o gerente de uma fábrica de maçãs. O objetivo é simples: separar as maçãs perfeitas das que estão estragadas (com manchas, podres ou machucadas) enquanto elas passam rapidamente numa esteira rolante.

O problema é que a esteira está superlotada. As maçãs estão muito juntas, se movem rápido, às vezes uma esconde a outra e a luz muda. Se você usar apenas uma câmera que tira fotos rápidas (quadro a quadro), o sistema pode ficar confuso: "Será que essa maçã aqui é boa? Não, espera, na foto seguinte parece ruim... agora parece boa de novo!" Isso gera erros e maçãs boas sendo jogadas fora.

Este artigo apresenta uma solução inteligente para esse caos, funcionando como um sistema de vigilância com memória. Vamos dividir em três partes simples:

1. O "Detetive" que encontra as maçãs (Detecção)

Primeiro, o sistema usa um "olho" muito esperto chamado YOLOv8. Pense nele como um detetive treinado em um pomar, onde as maçãs estão entre as árvores e a luz é natural. Mesmo que ele nunca tenha visto uma fábrica antes, ele é tão bom que consegue apontar para cada maçã na esteira e dizer: "Ei, tem uma maçã ali!". Ele desenha uma caixinha ao redor de cada uma.

2. O "Guarda-Costas" que não perde o rastro (Rastreamento)

Aqui está a mágica. Em vez de tratar cada foto como um evento isolado, o sistema usa um "guarda-costas" chamado ByteTrack.

  • Sem ele: Seria como tentar seguir uma pessoa em uma multidão apenas olhando fotos soltas. Você perde a pessoa e acha que é outra.
  • Com ele: O sistema dá um nome (ou um número de identificação) para cada maçã assim que a vê. Se a maçã 101 passa por trás de outra, o sistema sabe: "Ok, a maçã 101 está escondida, mas ela ainda é a maçã 101". Ele mantém a identidade da maçã o tempo todo enquanto ela viaja na esteira.

3. O "Especialista" que toma a decisão final (Classificação e Consolidação)

Agora que sabemos quem é quem, o sistema corta a imagem de cada maçã e manda para um "especialista" (um modelo chamado ResNet18) para ver se ela está estragada.

  • O problema: Às vezes, a maçã está tremendo ou com sombra, e o especialista pode ter um "branco" e dizer "estragada" num segundo e "boa" no outro.
  • A solução: O sistema não toma a decisão baseada em apenas uma foto. Ele junta todas as opiniões que teve sobre a mesma maçã enquanto ela passou pela esteira. É como se você perguntasse a 10 pessoas sobre a qualidade de uma maçã e seguisse a opinião da maioria. Se 9 disseram "boa" e 1 disse "estragada" (porque a maçã estava embaçada), o sistema decide: "É uma maçã boa!".

Por que isso é importante?

Antes, as fábricas tentavam julgar a qualidade maçã por maçã, foto por foto, o que gerava muita confusão e erro.
Este novo método é como ter um chefe de qualidade que tem memória. Ele não julga a maçã pelo que vê num único instante de confusão; ele observa a maçã inteira durante sua viagem na esteira e só toma a decisão final quando tem certeza.

Resumo da Ópera:
O artigo diz: "Não olhe apenas para a foto; olhe para a história da maçã". Ao combinar a detecção (achar a maçã), o rastreamento (não perdê-la) e a votação (tirar a média das opiniões), eles criaram um sistema muito mais estável e confiável para garantir que apenas maçãs de alta qualidade cheguem ao consumidor, mesmo em esteiras superlotadas e rápidas.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →