Yolo Vision Shenzhen
Shenzhen
Junte-se agora

Como utilizar Ultralytics YOLO11 para a estimativa da pose

Abirami Vina

Leitura de 3 minutos

14 de outubro de 2024

Saiba como utilizar o modelo Ultralytics YOLO11 para uma estimativa precisa da pose. Abordaremos a inferência em tempo real e a formação de modelos personalizados para várias aplicações.

A investigação relacionada com a visão computacional, um ramo da inteligência artificial (IA), remonta à década de 1960. No entanto, só na década de 2010, com o surgimento da aprendizagem profunda, é que assistimos a grandes avanços na forma como as máquinas compreendem as imagens. Um dos mais recentes avanços na visão computacional é a tecnologia de ponta Ultralytics YOLO11 da Ultralytics. Os modelosYOLO11 , apresentados pela primeira vez no evento híbrido anual da Ultralytics, o YOLO Vision 2024 (YV24), suportam uma série de tarefas de visão computacional, incluindo a estimativa de pose.

A estimativa de pose pode ser utilizada para detect pontos-chave de uma pessoa ou objeto numa imagem ou vídeo para compreender a sua posição, postura ou movimento. É amplamente utilizada em aplicações como análise desportiva, monitorização do comportamento animal e robótica para ajudar as máquinas a interpretar acções físicas em tempo real. Graças à sua maior precisão, eficiência e velocidade em relação aos modelos anteriores da sérieYOLO (You Only Look Once), YOLO11 é adequado para tarefas de estimativa de pose em tempo real.

__wf_reserved_inherit
Fig. 1. Um exemplo de utilização do Ultralytics YOLO11 para a estimativa da pose.

Neste artigo, vamos explorar o que é a estimativa de pose, discutir algumas das suas aplicações e mostrar como pode utilizar o YOLO11 com o pacoteUltralytics Python para estimativa de pose. Também veremos como você pode usar o Ultralytics HUB para experimentar YOLO11 e a estimativa de pose com apenas alguns cliques. Vamos começar!

O que é estimativa de pose?

Antes de nos debruçarmos sobre a forma de utilizar o novo modeloUltralytics YOLO11 para a estimativa de pose, vamos compreender melhor o que é a estimativa de pose.

A estimativa de pose é uma técnica de visão por computador utilizada para analisar a pose de uma pessoa ou objeto numa imagem ou vídeo. Modelos de aprendizagem profunda como YOLO11 podem identificar, localizar e track pontos-chave num determinado objeto ou pessoa. Para objectos, estes pontos-chave podem incluir cantos, arestas ou marcas de superfície distintas, enquanto que para humanos, estes pontos-chave representam articulações principais como o cotovelo, joelho ou ombro. 

A estimativa de pose é única e mais complexa quando comparada a outras tarefas de visão computacional, como a detecção de objetos. Enquanto a detecção de objetos localiza objetos em uma imagem desenhando uma caixa ao redor deles, a estimativa de pose vai além, prevendo as posições exatas dos pontos-chave no objeto.

__wf_reserved_inherit
Fig. 2. Utilização do YOLO11 para detect e estimar as poses das pessoas num escritório.

Quando se trata de estimativa de pose, existem duas maneiras principais de funcionar: bottom-up e top-down. A abordagem bottom-up detecta pontos-chave individuais e os agrupa em esqueletos, enquanto a abordagem top-down se concentra primeiro em detectar objetos e, em seguida, estimar os pontos-chave dentro deles. 

YOLO11 combina os pontos fortes dos métodos de cima para baixo e de baixo para cima. Tal como a abordagem de baixo para cima, mantém as coisas simples e rápidas sem necessidade de agrupar manualmente os pontos-chave. Ao mesmo tempo, utiliza a precisão do método descendente ao detetar pessoas e estimar as suas poses num único passo.

Casos de utilização da estimativa de pose para o YOLO11 

As capacidades versáteis do YOLO11 para a estimativa de pose abrem uma vasta gama de aplicações possíveis em muitos sectores. Vejamos mais de perto alguns casos de utilização da estimativa de pose do YOLO11.

Estimativa de pose em tempo real com YOLO11: melhorar a segurança dos trabalhadores

A segurança é um aspeto importante de qualquer projeto de construção. Isto é especialmente verdade, uma vez que, estatisticamente, os locais de construção registam um maior número de lesões relacionadas com o trabalho. Em 2021, cerca de 20% de todas as lesões fatais relacionadas com o trabalho ocorreram em ou perto de locais de construção. Com riscos diários como equipamento pesado e sistemas elétricos, medidas de segurança rigorosas são essenciais para manter os trabalhadores seguros. Os métodos tradicionais, como a utilização de sinais, barricadas e monitorização manual por supervisores, nem sempre são eficazes e, muitas vezes, afastam os supervisores de tarefas mais críticas.

A IA pode intervir para melhorar a segurança e o risco de acidentes pode ser reduzido através da utilização de um sistema de monitorização dos trabalhadores baseado na estimativa da pose. Os modelos Ultralytics YOLO11 podem ser utilizados para track movimentos e as posturas dos trabalhadores. Quaisquer riscos potenciais, como trabalhadores demasiado próximos de equipamento perigoso ou a execução incorrecta de tarefas, podem ser rapidamente detectados. Se for detectado um risco, os supervisores podem ser notificados ou um alarme pode alertar o trabalhador. Um sistema de monitorização contínua pode tornar os locais de construção mais seguros, estando sempre atento aos perigos e protegendo os trabalhadores

__wf_reserved_inherit
Fig. 3. Um exemplo de estimativa de pose num estaleiro de construção utilizando YOLO11.

Estimativa de pose com YOLO11 para monitorização de gado

Os agricultores e investigadores podem utilizar YOLO11 para estudar o movimento e o comportamento dos animais de criação, como o gado, para detect sinais precoces de doenças como a claudicação. A claudicação é uma condição em que um animal tem dificuldade em mover-se corretamente devido a dores nas pernas ou nos pés. No gado, doenças como a claudicação não só afectam a sua saúde e bem-estar, como também conduzem a problemas de produção nas explorações leiteiras. Estudos mostram que a claudicação afecta entre 8% dos bovinos em sistemas baseados em pastagens e 15% a 30% em sistemas confinados em toda a indústria leiteira global. Detetar e tratar a claudicação precocemente pode ajudar a melhorar o bem-estar dos animais e reduzir as perdas de produção associadas a esta condição.

As funcionalidades de estimativa de pose do YOLO11podem ajudar os agricultores a track padrões de marcha dos animais e a identificar rapidamente quaisquer anomalias que possam indicar problemas de saúde, como problemas nas articulações ou infecções. A deteção precoce destes problemas permite um tratamento mais rápido, reduzindo o desconforto dos animais e ajudando os agricultores a evitar perdas económicas.

Os sistemas de monitorização ativados por IA de visão também podem ajudar a analisar o comportamento de repouso, as interações sociais e os padrões de alimentação. Os agricultores também podem usar a estimativa de pose para obter observações sobre sinais de stress ou agressão. Estes conhecimentos podem ser usados para cultivar melhores condições de vida para os animais e aumentar o seu bem-estar.

__wf_reserved_inherit
Fig. 4. Uma visualização da estimativa de pose de vacas.

Casos de utilização do YOLO11 na indústria do fitness

A estimativa de pose também pode ajudar as pessoas a melhorar a sua postura em tempo real durante o exercício físico. Com o YOLO11, os instrutores de ginásio e de ioga podem monitorizar e track os movimentos do corpo das pessoas que estão a fazer exercício, concentrando-se em pontos-chave como as articulações e os membros para avaliar a sua postura. Os dados recolhidos podem ser comparados com as posturas e técnicas de treino ideais, e os instrutores podem receber alertas se alguém estiver a executar um movimento incorretamente, ajudando a evitar lesões.

__wf_reserved_inherit
Fig. 5. Utilização da estimativa de pose para analisar um treino.

Por exemplo, durante uma aula de ioga, a estimativa de pose pode ajudar a monitorizar se todos os alunos estão a manter o equilíbrio e o alinhamento adequados. As aplicações móveis integradas com visão computacional e estimativa de pose podem tornar o fitness mais acessível para pessoas que se exercitam em casa ou que não têm acesso a personal trainers. Este feedback contínuo em tempo real ajuda os utilizadores a melhorar a sua técnica e a atingir os seus objetivos de fitness, reduzindo ao mesmo tempo o risco de lesões.

Experimentar a estimativa de pose em tempo real com o modelo YOLO11

Agora que já explorámos o que é a estimativa de pose e discutimos algumas das suas aplicações. Vamos ver como pode experimentar a estimativa de pose com o novo modelo YOLO11 . Para começar, existem duas formas convenientes de o fazer: utilizando o pacote Ultralytics Python ou através do Ultralytics HUB. Vamos dar uma olhadela a ambas as opções.

Execução de inferências com YOLO11

A execução de uma inferência implica que o modelo YOLO11 processe novos dados fora dos seus conjuntos de treino e utilize os padrões que aprendeu para fazer previsões com base nesses dados. É possível executar inferências através de código com o pacote Ultralytics Python . Tudo o que precisa de fazer para começar é instalar o pacote Ultralytics utilizando pip, conda ou Docker. Se você enfrentar algum desafio durante a instalação, nosso Guia de Problemas Comuns oferece dicas úteis de solução de problemas. 

Depois de instalar o pacote com sucesso, o código seguinte descreve como carregar um modelo e usá-lo para prever poses de objetos numa imagem.

__wf_reserved_inherit
Fig. 6. Um fragmento de código que mostra a execução de inferências utilizando o YOLO11.

Treinar um modelo YOLO11 personalizado

Digamos que está a trabalhar num projeto de visão por computador e tem um conjunto de dados específico para uma determinada aplicação que envolve a estimativa de pose. Pode então afinar e treinar um modelo YOLO11 personalizado para se adequar à sua aplicação. Por exemplo, pode utilizar um conjunto de dados de pontos-chave para analisar e compreender a pose de um tigre em imagens, identificando caraterísticas-chave como a posição dos seus membros, cabeça e cauda.

Você pode usar o seguinte trecho de código para carregar e treinar um modelo de estimativa de pose YOLO11 . O modelo pode ser criado a partir de uma configuração YAML, ou você pode carregar um modelo pré-treinado para treinamento. Esse script também permite transferir pesos e começar a treinar o modelo usando um conjunto de dados especificado, como o conjunto de dadosCOCO para estimativa de pose.

__wf_reserved_inherit
Fig. 7. Treino personalizado YOLO11.

Usando o modelo personalizado recém-treinado, pode executar inferências em imagens não vistas relacionadas com a sua solução de visão computacional. O modelo treinado também pode ser convertido para outros formatos usando o modo de exportação.

Experimente YOLO11 no Ultralytics HUB

Até agora, analisámos os métodos de utilização do YOLO11 que requerem alguns conhecimentos básicos de programação. Se não é isso que procura, ou se não está familiarizado com a codificação, existe outra opção: Ultralytics HUB. O Ultralytics HUB é uma plataforma de fácil utilização concebida para simplificar o processo de formação e implementação de modelos YOLO . O HUB permite gerenciar facilmente conjuntos de dados, treinar modelos e implantá-los sem a necessidade de conhecimento técnico.

Para executar inferências em imagens, pode criar uma conta, navegar para a secção "Models" (Modelos) e escolher o modelo de estimativa de pose YOLO11 em que está interessado. Na secção de pré-visualização, pode carregar uma imagem e ver os resultados da previsão, como se mostra abaixo. 

__wf_reserved_inherit
Fig. 8. Estimativa de pose no Ultralytics HUB com YOLO11.

Avanços YOLO11 na deteção da pose humana

YOLO11 Ultralytics YOLO11 oferece soluções precisas e flexíveis para tarefas como a estimativa de pose numa vasta gama de aplicações. Desde a melhoria da segurança dos trabalhadores em estaleiros de construção até à monitorização da saúde do gado e à assistência na correção da postura em rotinas de fitness, YOLO11 proporciona precisão e feedback em tempo real através de tecnologia avançada de visão por computador. 

A sua versatilidade, com múltiplas variantes de modelos e a capacidade de formação personalizada para casos de utilização específicos, torna-o uma ferramenta muito valiosa tanto para programadores como para empresas. Seja através da codificação com o pacote Ultralytics Python ou utilizando o Ultralytics HUB para uma implementação mais fácil, YOLO11 torna a estimativa de pose acessível e impactante.

Para explorar mais, visite nosso repositório no GitHub e interaja com nossa comunidade. Explore aplicações de IA em manufatura e agricultura em nossas páginas de soluções. 🚀

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente