Descubra como o OpenPose pode ser utilizado para a estimação de pose em aplicações de visão por computador. Aprenda sobre as suas características e a sua importância na IA de Visão.

Descubra como o OpenPose pode ser utilizado para a estimação de pose em aplicações de visão por computador. Aprenda sobre as suas características e a sua importância na IA de Visão.
Hoje em dia, as imagens e as câmaras estão por todo o lado — embutidas nos nossos telemóveis, casas e até mesmo em espaços públicos. Contamos com elas não só para captar momentos, mas também para nos ajudar a compreender e interagir com o mundo que nos rodeia.
Nos bastidores, a visão computacional , um subcampo da inteligência artificial (IA), torna isto possível ao permitir que as máquinas interpretem dados visuais. Permite que os sistemas detetem objetos, reconheçam rostos e rastreiem movimentos, desempenhando um papel fundamental em muitas das tecnologias que utilizamos diariamente.
Graças aos recentes avanços na IA, os modelos de visão computacional podem agora analisar e extrair dados e insights mais complexos. Exemplo disso é a pose estimation , uma tarefa de visão por computador focada na compreensão do movimento humano.
Funciona através da identificação de pontos-chave do corpo, como ombros, cotovelos e joelhos, em imagens ou vídeos. Isto permite analisar como as pessoas se movimentam, possibilitando aplicações na monitorização de fitness, animação, saúde e muito mais.
Entre as muitas ferramentas desenvolvidas para a estimativa de poses, o OpenPose destaca-se como um grande avanço. Criado por investigadores do Laboratório de Computação Perceptiva da Universidade Carnegie Mellon, foi um dos primeiros sistemas de código aberto capaz de detetar poses de corpo inteiro, incluindo mãos, pés e pontos-chave faciais, para várias pessoas em tempo real, utilizando apenas uma câmara (com até 135 pontos-chave por pessoa).
Neste artigo, iremos explorar o OpenPose, como funciona e a sua importância como marco na visão computacional.
Antes da ampla adoção da IA, o rastreio do movimento humano em vídeos implicava o uso de equipamento especializado. Em indústrias como o cinema e a animação , os atores usavam frequentemente fatos com marcadores refletores para que as câmaras pudessem captar os seus movimentos num ambiente de estúdio controlado.
Embora estas técnicas de captura de movimento baseadas em marcadores fossem precisas, eram também dispendiosas e limitadas a configurações específicas. Com o avanço da visão computacional, os investigadores procuraram formas de rastrear o movimento corporal sem o uso de marcadores. Usaram bordas, contornos e modelos para encontrar formas humanas em imagens.
Estes primeiros sistemas funcionavam em situações simples e diretas, mas tinham dificuldades em cenários do mundo real. Frequentemente, apresentavam maus resultados quando as pessoas se moviam de formas inesperadas ou quando mais do que uma pessoa aparecia num quadro.
No final da década de 2010, a aprendizagem profunda trouxe uma grande mudança para a estimação de poses. Os modelos de IA de visão puderam ser treinados em grandes conjuntos de dados de poses humanas. Em vez de dependerem de arestas e modelos, os modelos aprenderam a reconhecer articulações e estruturas corporais estudando milhares de imagens rotuladas. Isto tornou a estimativa de poses mais precisa, flexível e impactante numa gama mais ampla de cenários.
O OpenPose foi lançado em 2017 e é capaz de estimar as poses de várias pessoas em simultâneo numa única imagem. Ao contrário dos sistemas mais antigos, o OpenPose não requer fatos ou marcadores especiais. Funciona com câmaras comuns e pode processar imagens e vídeos em tempo real. Estas características tornaram a estimativa de poses mais acessível para os desenvolvedores e investigadores.
A base que o OpenPose estabeleceu para a visão computacional ajudou outros a construir arquiteturas mais recentes para uma variedade de outras aplicações. Hoje em dia, os modelos de IA de visão, como o Ultralytics YOLO8 e o Ultralytics YOLO11, que suportam tarefas de estimação de pose, oferecem resultados mais rápidos e menor latência.
No entanto, o OpenPose é um excelente ponto de partida se estiver curioso sobre como a estimativa de pose evoluiu. Introduziu ideias-chave nas quais muitos sistemas mais recentes ainda se baseiam hoje.
Agora que já percebemos melhor porque é que o OpenPose é importante, vamos analisar mais de perto o que pode realmente fazer.
No centro das características do OpenPose está algo chamado deteção de pontos-chave . Os pontos-chave são pontos de referência específicos no corpo humano, como a ponta do nariz, o centro dos ombros, os cotovelos, os pulsos, as ancas, os joelhos e os tornozelos. O OpenPose pode detetar até 135 destes pontos por pessoa, incluindo áreas detalhadas como os dedos e as características faciais.
Quando estes pontos são ligados, formam uma representação simplificada do corpo humano — pode pensar nele como um esqueleto digital. Este contorno esquelético mostra não só onde a pessoa está, mas também como está posicionada: se está sentada, de pé, a acenar, a sorrir ou a caminhar. Os computadores podem interpretar o movimento humano visualmente utilizando estes esqueletos, tal como nós compreendemos instintivamente a linguagem corporal de alguém.
O rastreio esquelético é especialmente útil porque elimina o ruído de fundo e as distrações, permitindo que o sistema se concentre exclusivamente na postura e no movimento humano. Em vez de analisar cada pixel, o OpenPose concentra-se em pontos significativos que contam a história de como uma pessoa se está a mover ou a interagir.
Ao extrair esta informação estruturada de imagens ou vídeos do quotidiano, o OpenPose permite criar aplicações que respondem a gestos, monitorizam atividades físicas, avaliam sinais emocionais ou até animam personagens digitais.
Aqui está uma visão geral de como o OpenPose deteta e liga pontos-chave no corpo humano a partir da entrada visual:
O OpenPose foi uma das primeiras ferramentas avançadas a tornar a estimação de pose prática para uma variedade de casos de utilização no mundo real. Embora não seja comummente utilizado em soluções de visão computacional em tempo real atualmente, desempenhou um papel importante na formação de trabalhos iniciais em áreas como desporto, entretenimento, educação e segurança.
Vamos analisar mais de perto como é que ajudou a abrir caminho nestas áreas.
Ao assistir a um jogo de basebol, é fácil perceber o que está a acontecer – pode reconhecer instantaneamente um lançamento, uma batida ou uma base roubada. Como humanos, lemos intuitivamente os movimentos do corpo e interpretamo-los sem grande esforço. Mas, para as máquinas, reconhecer estas ações é muito mais complexo. Necessitam de informações precisas sobre como cada parte do corpo se move no espaço.
O OpenPose representou um avanço substancial nesta área da visão por computador. Era uma ferramenta prática para analisar a forma atlética em diversos cenários.
Muitos projetos de investigação utilizaram o OpenPose para decompor movimentos como swings e saltos, chegando a classificar ações específicas do basebol com base na movimentação dos jogadores. Como funcionava em ambientes abertos com vídeo padrão, permitiu aos investigadores testar como estes sistemas poderiam funcionar em cenários reais de treino ou coaching.
Estes primeiros estudos ajudaram a estabelecer as bases para as ferramentas de monitorização do desempenho agora utilizadas na tecnologia desportiva avançada.
Da mesma forma, os investigadores também utilizaram o OpenPose para explorar como o rastreio de poses baseado em vídeo poderia auxiliar na monitorização de segurança. A funcionalidade foi testada na deteção de comportamentos como quedas, gestos inesperados ou padrões de movimento em áreas públicas.
Por funcionar com câmaras padrão, o OpenPose tornou a experimentação inicial mais acessível em ambientes como hospitais e centros de transporte. Estes estudos ajudaram a impulsionar o desenvolvimento de modelos mais recentes, agora utilizados em sistemas de vigilância, deteção de quedas e resposta a emergências.
Eis uma amostra de algumas das vantagens que o OpenPose oferece:
Embora o OpenPose tenha sido um grande avanço, também apresenta limitações técnicas que é importante considerar. Eis alguns dos principais desafios associados ao OpenPose:
O OpenPose desempenhou um papel importante para tornar a estimativa de pose mais acessível. Mostrou que o rastreio dos movimentos corporais podia ser feito com uma câmara simples, sem depender de fatos ou equipamentos especializados.
Lançou as bases para muitas aplicações práticas na saúde, educação, entretenimento e investigação. Embora os modelos mais recentes ofereçam velocidades mais rápidas e um desempenho mais leve, o OpenPose continua a ser uma referência fundamental para compreender como a estimativa de pose evoluiu.
Junte-se à nossa comunidade e visite o nosso repositório GitHub para saber mais sobre IA. Se procura desenvolver as suas próprias soluções de visão por computador, explore as nossas opções de licenciamento . Confira também como a visão computacional na área da saúde e a IA na logística estão a causar impacto!