O que é estimativa de pose e onde ela pode ser usada?
Aprenda como funciona a estimativa de pose, suas aplicações no mundo real e como modelos como o Ultralytics YOLO11 permitem que máquinas interpretem o movimento e a postura corporal.

Quando vês alguém curvado ou de pé, com os ombros para trás, é imediatamente claro se tem uma postura má ou confiante. Ninguém precisa de te explicar isso. Isto acontece porque, ao longo do tempo, aprendemos naturalmente a interpretar a linguagem corporal.
Através da experiência e observação, os nossos cérebros tornaram-se muito bons a reconhecer a postura de vários objetos, incluindo humanos. Graças aos recentes avanços na inteligência artificial (IA) e visão computacional, um campo que permite às máquinas interpretar informação visual do mundo, as máquinas estão agora a começar a aprender e a replicar esta capacidade também.
Estimativa de pose é uma tarefa de visão computacional que ajuda as máquinas a determinar a posição e orientação de uma pessoa ou objeto ao analisar imagens ou vídeos. Faz isto identificando pontos-chave no corpo, como articulações e membros, para compreender como alguém, ou até algo, se está a mover.
Esta tecnologia está a ser amplamente utilizada em áreas como fitness, cuidados de saúde e animação. Em ambientes de trabalho, por exemplo, pode ser usada para monitorizar a postura dos funcionários e apoiar iniciativas de segurança e bem-estar. Modelos de visão computacional como o Ultralytics YOLO11 tornam isto possível ao estimar poses humanas em tempo real.

Fig 1. Um exemplo da utilização de YOLO11 para monitorizar a postura de trabalhadores.
Neste artigo, vamos analisar mais de perto a estimativa de pose e como funciona, juntamente com casos de uso no mundo real onde está a fazer a diferença. Vamos começar!
Link to this sectionA evolução da estimativa de pose#
A investigação sobre a estimativa de pose começou no final da década de 1960 e 70. Ao longo dos anos, as abordagens a esta tarefa de visão computacional mudaram da matemática e geometria básicas para métodos mais avançados impulsionados pela inteligência artificial.
Inicialmente, as técnicas dependiam de ângulos de câmara fixos e pontos de referência conhecidos. Mais tarde, evoluíram para incluir modelos 3D e correspondência de características. Hoje, modelos de deep learning como o YOLO11 podem detetar posições corporais em tempo real a partir de imagens ou vídeo, tornando a estimativa de pose mais rápida e precisa do que nunca.
À medida que a tecnologia melhorou, os investigadores viram as potenciais aplicações de poder monitorizar e seguir as poses de vários objetos, especialmente humanos e animais. A estimativa de pose é especialmente importante porque permite que as ferramentas de IA compreendam e meçam a postura e o movimento de formas que não eram possíveis antes.
Por exemplo, permite que os computadores reconheçam gestos para interação sem contacto manual, analisem os movimentos de atletas para melhorar o desempenho, potenciem animações realistas em videojogos e até apoiem os cuidados de saúde ao acompanhar o progresso da recuperação de pacientes.
Link to this sectionComo é diferente de outras tarefas de visão computacional?#
A estimativa de pose é diferente de outras tarefas de visão computacional como deteção de objetos e segmentação de instâncias. Estas tarefas focam-se principalmente em identificar e localizar objetos dentro de uma imagem.
A deteção de objetos, por exemplo, desenha caixas delimitadoras em torno de itens como pessoas, veículos ou animais para indicar a sua presença e posição. A segmentação de instâncias leva isto um passo mais além, delineando a forma precisa de cada objeto ao nível do pixel.
No entanto, ambos os métodos preocupam-se principalmente com o que é o objeto e onde ele está - não fornecem qualquer informação sobre como o objeto está posicionado ou o que pode estar a fazer. É aqui que a estimativa de pose se torna crucial.
Ao identificar pontos-chave no corpo, como cotovelos, joelhos ou até uma cauda, a estimativa de pose pode interpretar a postura e o movimento. Isto permite uma compreensão mais profunda de ações, gestos e dinâmicas corporais, incluindo o movimento no espaço 3D.
Link to this sectionCompreender como funciona a estimativa de pose#
Modelos de estimativa de pose seguem geralmente duas abordagens principais: bottom-up e top-down. Na abordagem bottom-up, o modelo deteta primeiro pontos-chave individuais, como cotovelos, joelhos ou ombros, e depois agrupa-os para descobrir a que pessoa ou objeto pertencem. Em contraste, a abordagem top-down começa por detetar cada objeto primeiro (como uma pessoa na imagem) e depois localiza os pontos-chave para esse objeto específico.

Fig 2. Métodos de estimativa de pose bottom-up vs. top-down.
Alguns modelos mais recentes, como o YOLO11, combinam os benefícios de ambas as abordagens. Mantém a eficiência do método bottom-up ao saltar o passo de agrupamento manual, enquanto também aproveita a precisão dos sistemas top-down ao detetar pessoas e estimar as suas poses de uma só vez - num processo único e simplificado.
Link to this sectionTreino personalizado do YOLO11 para estimativa de pose#
À medida que analisamos como funcionam os modelos de estimativa de pose, podes estar a perguntar-te: como é que estes modelos aprendem realmente a estimar a pose de diferentes objetos? É aí que entra a ideia de treino personalizado.
O treino personalizado significa ensinar um modelo a reconhecer pontos-chave específicos usando os teus próprios dados. Uma vez que construir um modelo de raiz requer uma grande quantidade de imagens etiquetadas e tempo significativo, muitas pessoas optam pelo transfer learning. Isto envolve começar com um modelo que já foi treinado num grande conjunto de dados, tal como o modelo de estimativa de pose YOLO11, que é pré-treinado no conjunto de dados COCO-Pose, e depois ajustá-lo com os teus próprios dados para uma tarefa ou caso de uso específico.
Digamos que estás a trabalhar com poses de ioga - podes ajustar o YOLO11 usando imagens onde cada pose está etiquetada com pontos-chave específicos dessa atividade. Para o fazer, vais precisar de um conjunto de dados personalizado de imagens anotadas com as quais o modelo possa aprender.
Durante o treino, podes ajustar definições como batch size (o número de imagens processadas de uma vez), learning rate (quão rapidamente o modelo atualiza a sua aprendizagem) e épocas (quantas vezes o modelo percorre o conjunto de dados) para melhorar a precisão. Isto torna muito mais fácil construir modelos de estimativa de pose adaptados às tuas necessidades específicas.
Link to this sectionAplicações de estimativa de pose no mundo real#
Agora que discutimos o que é a estimativa de pose e como funciona, vamos observar mais de perto alguns dos seus casos de uso no mundo real.
Link to this sectionUsar a estimativa de pose para fisioterapia#
A estimativa de pose está gradualmente a tornar-se uma ferramenta fiável na indústria da saúde, especialmente na fisioterapia. Usando IA e visão computacional, estes sistemas podem seguir a postura e movimentos em tempo real e fornecer feedback, semelhante ao que um fisioterapeuta ofereceria.
Por exemplo, um paciente a recuperar de uma cirurgia ao joelho pode usar um sistema de estimativa de pose para garantir que está a fazer os seus exercícios de reabilitação corretamente. O sistema pode detetar quaisquer movimentos incorretos e oferecer sugestões de melhoria, ajudando o paciente a manter o rumo e a evitar lesões.

Fig 3. Um exemplo de utilização de YOLO11 para fisioterapia.
Para além da reabilitação, a estimativa de pose também está a entrar em aplicações de fitness. Por exemplo, alguém que treine em casa pode usar a aplicação para verificar a sua forma durante os exercícios. A aplicação pode fornecer feedback em tempo real, como ajustar o ângulo de um agachamento ou garantir que as costas estão direitas durante um peso morto. Isto ajuda os utilizadores a melhorar a sua forma e a prevenir lesões sem precisarem de um treinador.
Link to this sectionCaptura de movimento para entretenimento ativada por estimativa de pose#
A estimativa de pose mudou a forma como a captura de movimento funciona no entretenimento, tornando-a mais simples e acessível. No passado, a captura de movimento exigia a colocação de marcadores no corpo de uma pessoa e o seu seguimento com câmaras especiais, o que podia ser complicado e caro.
Agora, com os avanços em IA e visão computacional, podemos usar câmaras comuns e algoritmos para seguir movimentos corporais sem precisar de marcadores, tornando o processo mais eficiente e preciso, mesmo em tempo real.
Um ótimo exemplo disto é o AR (Realidade Aumentada) Poser da Disney. Esta ferramenta divertida permite-te tirar uma fotografia com o teu telemóvel e ter uma personagem digital a copiar a tua pose em realidade aumentada. Funciona analisando a tua pose na fotografia e combinando-a com uma personagem 3D, criando uma selfie de RA divertida e personalizada.

Fig 4. Uma personagem de RA imita a pose de uma pessoa usando estimativa de pose.
Link to this sectionInvestigação sobre comportamento social impulsionada pela estimativa de pose animal#
Estudar o comportamento animal ajuda os cientistas a compreender como os animais comunicam, encontram parceiros, cuidam das suas crias e vivem em grupo. Este conhecimento é vital para proteger a vida selvagem e obter uma compreensão mais profunda do mundo natural.
A estimativa de pose simplifica este processo ao seguir os movimentos e a postura de animais usando imagens e vídeos, sem prender sensores ou etiquetas aos animais. Estes sistemas podem monitorizar automaticamente as suas poses, fornecendo informações sobre comportamentos como cuidar da pelagem, brincar ou lutar.
Um exemplo interessante disto é o uso, por parte de cientistas, da estimativa de pose para estudar o comportamento dos símios. De facto, os investigadores compilaram conjuntos de dados como o OpenApePose, que contém mais de 71.000 imagens etiquetadas de seis espécies de símios.

Fig 5. Estimativa de pose de símios.
Link to this sectionPrós e contras da estimativa de pose#
Aqui estão alguns dos principais benefícios que a estimativa de pose pode trazer a várias indústrias:
- Escalabilidade: Os sistemas de estimativa de pose podem ser implementados numa vasta gama de dispositivos, desde smartphones a configurações de câmara avançadas, tornando-os altamente escaláveis e acessíveis para diferentes casos de uso e ambientes.
- Económico: Como a estimativa de pose depende de câmaras comuns e não requer sensores ou etiquetas caros, pode ser uma solução mais económica para seguir movimentos tanto em investigação como em aplicações comerciais.
- Monitorização contínua: Os sistemas de estimativa de pose podem fornecer seguimento contínuo em tempo real, permitindo a monitorização de alterações ao longo do tempo, seja para o progresso do paciente na reabilitação ou para seguir o comportamento animal na vida selvagem.
Embora as vantagens da estimativa de pose sejam claras em várias áreas, existem também alguns desafios a considerar. Aqui estão algumas limitações importantes a ter em conta:
-
Generalização limitada: Muitos modelos treinados em conjuntos de dados humanos não generalizam bem para animais ou estruturas corporais pouco comuns sem re-treino em conjuntos de dados específicos.
-
Limitações ambientais: O desempenho pode degradar-se sob má iluminação, desfoque de movimento rápido ou fundos desordenados.
-
Alta sensibilidade à oclusão: A precisão pode cair quando partes do corpo estão bloqueadas ou fora de enquadramento, especialmente em cenas lotadas ou seguimento de várias pessoas.
Link to this sectionPrincipais pontos#
A estimativa de pose percorreu um longo caminho desde os seus primeiros dias, evoluindo de sistemas que usavam marcadores para ferramentas impactantes impulsionadas por modelos de deep learning como o YOLO11. Quer se trate de melhorar a fisioterapia, potenciar experiências interativas de RA ou ajudar na investigação da vida selvagem, a estimativa de pose está a mudar a forma como as máquinas compreendem o movimento e a postura. À medida que a tecnologia continua a avançar, abordar as suas limitações será fundamental para desbloquear ainda mais usos práticos e tornar as máquinas melhores a compreender como nós e outros seres vivos nos movemos.
Curioso sobre IA? Explora o nosso repositório GitHub, liga-te à nossa comunidade e verifica as nossas opções de licenciamento para dar um impulso ao teu projeto de visão computacional. Sabe mais sobre inovações como IA no retalho e visão computacional na logística nas nossas páginas de soluções.






