Sintonize na YOLO Vision 2025!
25 de setembro de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glossário

Estimativa de pose

Descubra a estimativa da pose: como funcionam os modelos de pontos-chave (de cima para baixo ou de baixo para cima), utilizações reais desde os cuidados de saúde ao desporto, bem como as principais vantagens e desafios.

A estimativa de pose é uma tarefa de visão por computador que identifica a posição e a orientação de uma pessoa ou objeto através da localização de pontos-chave, tais como articulações, pontos de referência ou outras caraterísticas distintas. O resultado é um conjunto de coordenadas que podem ser ligadas para formar uma estrutura esquelética, fornecendo uma compreensão detalhada da postura e do movimento de um objeto numa imagem ou vídeo. Esta tecnologia é fundamental para aplicações que requerem uma perceção do movimento, gestos ou configurações corporais específicas, desde o seguimento da condição física à robótica.

Como funciona a estimativa de pose

Os modelos de estimativa de pose analisam dados visuais para prever a localização de pontos-chave predefinidos. Para a estimativa da pose humana, estes são normalmente as principais articulações, como os ombros, cotovelos, ancas e joelhos. Estes pontos são depois ligados para criar um esqueleto, que representa a estrutura do corpo e a pose atual. Existem dois métodos principais para este processo:

  • Abordagem de cima para baixo: Este método utiliza primeiro um detetor de objectos para identificar e isolar cada pessoa ou objeto numa imagem com uma caixa delimitadora. De seguida, analisa o conteúdo de cada caixa individualmente para localizar os pontos-chave para essa instância específica. Embora intuitivo, o seu desempenho depende muito da deteção inicial de objectos.
  • Abordagem de baixo para cima: Esta abordagem começa por detetar todos os pontos-chave em toda a imagem - por exemplo, todos os cotovelos e todos os joelhos - e depois agrupa estes pontos em esqueletos distintos. Este método pode ser mais eficiente em cenas com muita gente, uma vez que o seu tempo de processamento não está ligado ao número de pessoas presentes.

As arquitecturas modernas, como as utilizadas no Ultralytics YOLO11, combinam frequentemente os pontos fortes de ambas as abordagens para alcançar um equilíbrio entre velocidade e precisão nas aplicações em tempo real.

Estimativa de pose vs. outras tarefas de visão computacional

A estimativa de pose proporciona um nível de análise mais granular em comparação com outras tarefas comuns de visão computacional. Embora relacionadas, estas tarefas têm objectivos diferentes:

  • Deteção de objectos centra-se na identificação e localização de objectos, desenhando uma caixa retangular à sua volta. Responde às perguntas "O que é o objeto?" e "Onde está?", mas não fornece informações sobre a postura ou articulação do objeto.
  • Segmentação de instâncias leva a deteção um passo à frente, delineando a forma precisa de cada objeto ao nível do pixel. No entanto, tal como a deteção de objectos, não descreve a configuração interna do objeto.

A estimativa de pose é única na sua capacidade de interpretar a forma como um objeto ou pessoa está posicionado e em movimento, o que é crucial para uma compreensão mais profunda das acções e comportamentos.

Aplicações no Mundo Real

A capacidade de analisar o movimento abre uma vasta gama de aplicações em muitos sectores.

  • IA nos cuidados de saúde e fisioterapia: Os sistemas de estimativa de pose ajudam a monitorizar os pacientes que realizam exercícios de reabilitação, garantindo a forma correta e acompanhando o progresso ao longo do tempo. Ao analisar os movimentos de um paciente através de uma simples câmara, estes sistemas podem oferecer feedback em tempo real, ajudando a prevenir lesões e a melhorar os resultados da recuperação sem a necessidade de avaliações manuais.
  • Análise desportiva e fitness: Os treinadores e atletas utilizam a estimativa de pose para efetuar uma análise biomecânica detalhada dos movimentos. Por exemplo, pode acompanhar o swing de um golfista, a forma de remate de um jogador de basquetebol ou a marcha de um corredor para identificar áreas a melhorar e reduzir o risco de lesões. Esta tecnologia também está integrada em aplicações de monitorização de exercícios para orientar os utilizadores através de exercícios com a técnica adequada.
  • Captura de movimento e animação: Na indústria do entretenimento, a estimativa de pose oferece uma alternativa sem marcadores às técnicas tradicionais de captura de movimento, que muitas vezes exigem que os actores usem fatos especiais com sensores. Isto simplifica o processo de animação de personagens digitais, tornando-o mais acessível e eficiente.
  • Monitorização do comportamento animal: Os investigadores aplicam a estimativa de pose para estudar animais nos seus habitats naturais sem etiquetas intrusivas. Ao seguir as posturas e os movimentos de diferentes espécies, os cientistas podem obter informações sobre interações sociais e outros comportamentos vitais para os esforços de conservação da vida selvagem.

Principais benefícios e desafios

A estimativa de pose oferece vantagens significativas, mas também tem algumas limitações.

Benefícios

  • Económica: Baseia-se em câmaras padrão, eliminando a necessidade de hardware ou sensores caros e especializados.
  • Não invasivo: permite o seguimento do movimento de pessoas e animais sem marcadores físicos ou etiquetas.
  • Dados ricos: Fornece informações pormenorizadas sobre a postura e o movimento que não estão disponíveis noutras tarefas de visão por computador.

Desafios

  • Oclusão: A precisão pode diminuir significativamente quando as partes do corpo são bloqueadas da vista ou se sobrepõem a outros objectos ou pessoas.
  • Factores ambientais: As más condições de iluminação, a desfocagem do movimento e os fundos desordenados podem afetar negativamente o desempenho do modelo.
  • Requisitos de dados: O treino de modelos exactos requer conjuntos de dados grandes e diversificados, como o conjunto de dados COCO-Pose, e os modelos podem não se generalizar bem para poses ou sujeitos não bem representados nos dados de treino.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora
Link copiado para a área de transferência