Deep-Learning-Based Markerless Pose Estimation Systems in Gait Analysis: DeepLabCut Custom Training and the Refinement Function

Este estudo demonstra que o sistema de estimativa de pose sem marcadores DeepLabCut, quando submetido a treinamento personalizado e função de refinamento, supera tanto o OpenPose quanto modelos pré-treinados, oferecendo uma solução precisa e de baixo custo para a análise da marcha em ambientes naturais.

Giulia Panconi, Stefano Grasso, Sara Guarducci, Lorenzo Mucchi, Diego Minciacchi, Riccardo Bravi

Publicado 2026-02-24
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você quer estudar como as pessoas andam. Antigamente, para fazer isso com precisão, os cientistas tinham que "vestir" o paciente com uma roupa cheia de bolinhas coloridas (marcadores) e usar câmeras supercaras em um laboratório fechado. Era como tentar filmar um show de rock, mas o cantor tivesse que usar um capacete cheio de luzes e só pudesse se mover em um palco específico. Funcionava bem, mas era caro, chato e pouco natural.

Hoje, a tecnologia de Inteligência Artificial (Deep Learning) mudou o jogo. Agora, podemos usar câmeras comuns para "ver" o movimento sem precisar de nenhuma roupa especial. É como se a câmera tivesse olhos mágicos que conseguem desenhar o esqueleto da pessoa apenas olhando para o vídeo.

Este artigo compara três "olhos mágicos" diferentes para ver quem é o melhor em analisar a caminhada:

1. Os Três Competidores

  • O "Pronto para Usar" (OpenPose - OPPT): Imagine que você comprou um robô que já nasceu sabendo andar e ver o mundo. Ele foi treinado com milhões de fotos de pessoas diferentes. Ele é rápido e fácil de usar, mas como ele viu de tudo um pouco, ele não é um especialista em sua situação específica. É como um generalista que sabe um pouco de tudo, mas não é um mestre em nada.
  • O "Pré-Treinado" (DeepLabCut Padrão - DLCPT): Este é outro robô que também nasceu sabendo um pouco de tudo, mas foi treinado de uma forma um pouco diferente. Ele é bom, mas ainda não foi "personalizado" para o seu caso.
  • O "Personalizado" (DeepLabCut Customizado - DLCCT): Aqui está a mágica. Em vez de usar o robô pronto, os cientistas pegaram um robô inteligente e o "treinaram" especificamente para o que eles precisavam. Eles mostraram 400 fotos de pessoas caminhando e disseram: "Olhe, este é o joelho, este é o tornozelo, este é o dedo do pé". O robô aprendeu com esses exemplos e se tornou um especialista na tarefa. É como transformar um estudante universitário em um médico especialista apenas mostrando a ele milhares de casos reais.

2. O Segredo do "Refinamento" (A Lição Extra)

O artigo descobre algo incrível: mesmo com o robô personalizado, ele ainda comete alguns erros de vez em quando. Então, os cientistas usaram uma função chamada "Refinamento".

Pense nisso como um professor particular. Depois que o aluno (o robô) faz uma prova, o professor pega as questões que ele errou, corrige a resposta e faz o aluno estudar apenas aquelas questões erradas novamente.

  • Sem refinamento: O robô estuda 400 fotos e aprende.
  • Com refinamento: O robô estuda 400 fotos, o cientista corrige os 80 erros que ele cometeu, e o robô estuda essas correções também.

O resultado? O robô com "lição extra" ficou muito mais preciso do que aquele que apenas estudou o material original, e até melhor do que robôs que estudaram mais fotos sem receber a correção.

3. O Veredito Final

Os cientistas fizeram 40 pessoas caminharem em uma passarela enquanto mediam o tempo de cada passo com câmeras e com sensores de força no chão (que são o "padrão ouro", ou seja, a régua perfeita).

  • O "Pronto para Usar" (OpenPose) foi muito bom, superando o "Pré-Treinado" padrão.
  • O "Personalizado" (DeepLabCut) foi o campeão absoluto. Ele foi mais preciso que todos os outros.
  • O "Personalizado com Refinamento" foi o campeão de todos os campeões. Ele conseguiu medir o tempo da caminhada com uma precisão quase igual àquela régua perfeita do laboratório, mas usando apenas uma câmera comum e sem marcar o corpo das pessoas.

Por que isso é importante para você?

Imagine um fisioterapeuta em um posto de saúde simples, sem dinheiro para equipamentos de milhões de reais. Com essa tecnologia, ele pode pegar um celular ou uma câmera barata, instalar um software gratuito, treinar o sistema por algumas horas (como se estivesse ensinando um cachorro a sentar) e começar a analisar a marcha de pacientes com precisão de laboratório.

Resumo da ópera:
A inteligência artificial já é boa, mas quando você a "personaliza" para o seu problema específico e ainda dá uma "lição extra" (refinamento) nos erros, ela se torna uma ferramenta poderosa, barata e precisa. Isso significa que, no futuro, analisar como você anda pode ser tão simples quanto tirar um vídeo com o celular, ajudando médicos a diagnosticar e tratar problemas de movimento em qualquer lugar do mundo, não apenas em laboratórios de luxo.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →