O que é o OpenPose? Explorando um marco na estimação de pose

Abirami Vina

5 min. de leitura

17 de junho de 2025

Descubra como o OpenPose pode ser utilizado para a estimação de pose em aplicações de visão por computador. Aprenda sobre as suas características e a sua importância na IA de Visão.

Hoje em dia, as imagens e as câmaras estão por todo o lado — embutidas nos nossos telemóveis, casas e até mesmo em espaços públicos. Contamos com elas não só para captar momentos, mas também para nos ajudar a compreender e interagir com o mundo que nos rodeia. 

Nos bastidores, a visão computacional , um subcampo da inteligência artificial (IA), torna isto possível ao permitir que as máquinas interpretem dados visuais. Permite que os sistemas detetem objetos, reconheçam rostos e rastreiem movimentos, desempenhando um papel fundamental em muitas das tecnologias que utilizamos diariamente. 

Graças aos recentes avanços na IA, os modelos de visão computacional podem agora analisar e extrair dados e insights mais complexos. Exemplo disso é a pose estimation , uma tarefa de visão por computador focada na compreensão do movimento humano. 

Funciona através da identificação de pontos-chave do corpo, como ombros, cotovelos e joelhos, em imagens ou vídeos. Isto permite analisar como as pessoas se movimentam, possibilitando aplicações na monitorização de fitness, animação, saúde e muito mais.

Entre as muitas ferramentas desenvolvidas para a estimativa de poses, o OpenPose destaca-se como um grande avanço. Criado por investigadores do Laboratório de Computação Perceptiva da Universidade Carnegie Mellon, foi um dos primeiros sistemas de código aberto capaz de detetar poses de corpo inteiro, incluindo mãos, pés e pontos-chave faciais, para várias pessoas em tempo real, utilizando apenas uma câmara (com até 135 pontos-chave por pessoa).

Neste artigo, iremos explorar o OpenPose, como funciona e a sua importância como marco na visão computacional.

Fig 1. Estimativa de pose de várias pessoas usando o OpenPose.

Uma análise da história da estimativa de pose

Antes da ampla adoção da IA, o rastreio do movimento humano em vídeos implicava o uso de equipamento especializado. Em indústrias como o cinema e a animação , os atores usavam frequentemente fatos com marcadores refletores para que as câmaras pudessem captar os seus movimentos num ambiente de estúdio controlado. 

Embora estas técnicas de captura de movimento baseadas em marcadores fossem precisas, eram também dispendiosas e limitadas a configurações específicas. Com o avanço da visão computacional, os investigadores procuraram formas de rastrear o movimento corporal sem o uso de marcadores. Usaram bordas, contornos e modelos para encontrar formas humanas em imagens.

Estes primeiros sistemas funcionavam em situações simples e diretas, mas tinham dificuldades em cenários do mundo real. Frequentemente, apresentavam maus resultados quando as pessoas se moviam de formas inesperadas ou quando mais do que uma pessoa aparecia num quadro.

No final da década de 2010, a aprendizagem profunda trouxe uma grande mudança para a estimação de poses. Os modelos de IA de visão puderam ser treinados em grandes conjuntos de dados de poses humanas. Em vez de dependerem de arestas e modelos, os modelos aprenderam a reconhecer articulações e estruturas corporais estudando milhares de imagens rotuladas. Isto tornou a estimativa de poses mais precisa, flexível e impactante numa gama mais ampla de cenários.

Fig 2. A evolução dos modelos de estimação da pose humana de 2017 a 2023.

OpenPose: onde a estimativa de pose moderna arrancou

O OpenPose foi lançado em 2017 e é capaz de estimar as poses de várias pessoas em simultâneo numa única imagem. Ao contrário dos sistemas mais antigos, o OpenPose não requer fatos ou marcadores especiais. Funciona com câmaras comuns e pode processar imagens e vídeos em tempo real. Estas características tornaram a estimativa de poses mais acessível para os desenvolvedores e investigadores.

A base que o OpenPose estabeleceu para a visão computacional ajudou outros a construir arquiteturas mais recentes para uma variedade de outras aplicações. Hoje em dia, os modelos de IA de visão, como o Ultralytics YOLO8 e o Ultralytics YOLO11, que suportam tarefas de estimação de pose, oferecem resultados mais rápidos e menor latência. 

Fig 3. Utilização do YOLO11 para a estimativa de pose.

No entanto, o OpenPose é um excelente ponto de partida se estiver curioso sobre como a estimativa de pose evoluiu. Introduziu ideias-chave nas quais muitos sistemas mais recentes ainda se baseiam hoje. 

Principais características do OpenPose

Agora que já percebemos melhor porque é que o OpenPose é importante, vamos analisar mais de perto o que pode realmente fazer.

No centro das características do OpenPose está algo chamado deteção de pontos-chave . Os pontos-chave são pontos de referência específicos no corpo humano, como a ponta do nariz, o centro dos ombros, os cotovelos, os pulsos, as ancas, os joelhos e os tornozelos. O OpenPose pode detetar até 135 destes pontos por pessoa, incluindo áreas detalhadas como os dedos e as características faciais.

Quando estes pontos são ligados, formam uma representação simplificada do corpo humano — pode pensar nele como um esqueleto digital. Este contorno esquelético mostra não só onde a pessoa está, mas também como está posicionada: se está sentada, de pé, a acenar, a sorrir ou a caminhar. Os computadores podem interpretar o movimento humano visualmente utilizando estes esqueletos, tal como nós compreendemos instintivamente a linguagem corporal de alguém.

O rastreio esquelético é especialmente útil porque elimina o ruído de fundo e as distrações, permitindo que o sistema se concentre exclusivamente na postura e no movimento humano. Em vez de analisar cada pixel, o OpenPose concentra-se em pontos significativos que contam a história de como uma pessoa se está a mover ou a interagir.

Ao extrair esta informação estruturada de imagens ou vídeos do quotidiano, o OpenPose permite criar aplicações que respondem a gestos, monitorizam atividades físicas, avaliam sinais emocionais ou até animam personagens digitais.

Como funciona o OpenPose? 

Aqui está uma visão geral de como o OpenPose deteta e liga pontos-chave no corpo humano a partir da entrada visual:

  • Começa com uma imagem: o OpenPose tira uma única imagem de uma fotografia, vídeo ou transmissão de câmara em direto.
  • Identifica partes importantes do corpo: o sistema procura pontos-chave no corpo, como o nariz, os cotovelos, os pulsos, os joelhos e os tornozelos. Estão marcados onde o sistema acredita que uma parte do corpo está localizada.
  • Descobrir quais as partes que se encaixam: Em seguida, o OpenPose verifica como os pontos-chave estão ligados. Utiliza cálculos matemáticos para decidir quais as articulações que pertencem à mesma pessoa — por exemplo, associar um pulso ao cotovelo e ao ombro direitos.
  • Desenha um esqueleto para cada pessoa: após agrupar os pontos-chave, o OpenPose liga-os num "boneco palito" que mostra a pose de cada pessoa. Isto funciona mesmo quando aparecem várias pessoas no mesmo quadro.
  • Retorna os dados de pose: por fim, fornece as posições exatas de todos os pontos-chave detetados. Podem ser utilizados para rastrear movimentos, reconhecer gestos ou criar ferramentas interativas — tudo em tempo real.
Fig 4. Detecção e seguimento de pontos-chave humanos usando OpenPose.

Aplicações de estimação de pose em todos os setores usando OpenPose 

O OpenPose foi uma das primeiras ferramentas avançadas a tornar a estimação de pose prática para uma variedade de casos de utilização no mundo real. Embora não seja comummente utilizado em soluções de visão computacional em tempo real atualmente, desempenhou um papel importante na formação de trabalhos iniciais em áreas como desporto, entretenimento, educação e segurança. 

Vamos analisar mais de perto como é que ajudou a abrir caminho nestas áreas.

Estimativa de pose com OpenPose para fitness e desporto

Ao assistir a um jogo de basebol, é fácil perceber o que está a acontecer – pode reconhecer instantaneamente um lançamento, uma batida ou uma base roubada. Como humanos, lemos intuitivamente os movimentos do corpo e interpretamo-los sem grande esforço. Mas, para as máquinas, reconhecer estas ações é muito mais complexo. Necessitam de informações precisas sobre como cada parte do corpo se move no espaço.

O OpenPose representou um avanço substancial nesta área da visão por computador. Era uma ferramenta prática para analisar a forma atlética em diversos cenários.

Muitos projetos de investigação utilizaram o OpenPose para decompor movimentos como swings e saltos, chegando a classificar ações específicas do basebol com base na movimentação dos jogadores. Como funcionava em ambientes abertos com vídeo padrão, permitiu aos investigadores testar como estes sistemas poderiam funcionar em cenários reais de treino ou coaching.

Estes primeiros estudos ajudaram a estabelecer as bases para as ferramentas de monitorização do desempenho agora utilizadas na tecnologia desportiva avançada.

Fig 5. Uma vista de olhos a um pipeline de classificação de ações de basebol usando o OpenPose.

Utilização do OpenPose em sistemas de segurança e proteção

Da mesma forma, os investigadores também utilizaram o OpenPose para explorar como o rastreio de poses baseado em vídeo poderia auxiliar na monitorização de segurança. A funcionalidade foi testada na deteção de comportamentos como quedas, gestos inesperados ou padrões de movimento em áreas públicas.

Por funcionar com câmaras padrão, o OpenPose tornou a experimentação inicial mais acessível em ambientes como hospitais e centros de transporte. Estes estudos ajudaram a impulsionar o desenvolvimento de modelos mais recentes, agora utilizados em sistemas de vigilância, deteção de quedas e resposta a emergências.

Fig 6. Detecção de quedas activada pelo OpenPose.

Prós e contras do OpenPose

Eis uma amostra de algumas das vantagens que o OpenPose oferece:

  • Útil para investigação e prototipagem: Tem sido amplamente utilizado em investigação académica, especialmente em áreas como a interação humano-computador, biomecânica e análise comportamental.
  • Suporte multiplataforma: pode ser executado em Windows, Linux e macOS, com suporte para unidades centrais de processamento (CPUs) e unidades de processamento gráfico (GPUs) .
  • Capacidade de processamento offline : pode ser executado em ambientes sem acesso à Internet, o que o torna ideal para ambientes com privacidade restrita, como cuidados de saúde ou educação.

Embora o OpenPose tenha sido um grande avanço, também apresenta limitações técnicas que é importante considerar. Eis alguns dos principais desafios associados ao OpenPose: 

  • Elevados requisitos de processamento: a execução do OpenPose em tempo real requer uma GPU potente e recursos de computação significativos.
  • Sensível ao ambiente: o desempenho pode diminuir em locais com pouca luz, cheios de gente ou quando os ângulos da câmara não são os ideais.
  • Pesado em comparação com os modelos mais recentes: Comparado com os modelos de estimativa de pose mais recentes, o OpenPose é relativamente grande e lento. Não é adequado para implementação em dispositivos com recursos limitados, como smartphones, tablets ou sistemas embebidos.

Principais conclusões

O OpenPose desempenhou um papel importante para tornar a estimativa de pose mais acessível. Mostrou que o rastreio dos movimentos corporais podia ser feito com uma câmara simples, sem depender de fatos ou equipamentos especializados.

Lançou as bases para muitas aplicações práticas na saúde, educação, entretenimento e investigação. Embora os modelos mais recentes ofereçam velocidades mais rápidas e um desempenho mais leve, o OpenPose continua a ser uma referência fundamental para compreender como a estimativa de pose evoluiu. 

Junte-se à nossa comunidade e visite o nosso repositório GitHub para saber mais sobre IA. Se procura desenvolver as suas próprias soluções de visão por computador, explore as nossas opções de licenciamento . Confira também como a visão computacional na área da saúde e a IA na logística estão a causar impacto!

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência