Treino personalizado do Ultralytics YOLO11 para estimativa da pose do cão

Abirami Vina

4 min ler

3 de fevereiro de 2025

Saiba como treinar o Ultralytics YOLO11 de forma personalizada para estimar a pose de cães e tirar partido do modelo treinado para aplicações práticas, tais como cuidados com animais de estimação.

E se a postura do seu cão lhe pudesse dar uma ideia de como ele se está a sentir? Monitorizá-los manualmente a toda a hora não é fácil. No entanto, graças aos avanços da inteligência artificial (IA) e da visão por computador, podemos analisar as imagens de vídeo em tempo real para compreender melhor o seu comportamento.

Especificamente, os modelos de visão por computador como o Ultralytics YOLO11 podem ajudar a estimar a postura de um cão e a seguir os seus movimentos, fornecendo informações valiosas sobre o seu bem-estar. Como é que isto funciona? A capacidade de estimativa de pose do YOLO11 pode identificar pontos-chave no corpo de um indivíduo para compreender a sua postura e movimento. 

Além disso, o YOLO11 pode ser treinado de forma personalizada num conjunto de dados concebido para a estimativa da pose de cães, tornando possível analisar com precisão a linguagem corporal do seu animal de estimação. O pacote Ultralytics Python suporta um conjunto de dados de pose de cão que facilita o treino e a implementação de modelos de IA de visão para cães. Essa tecnologia faz parte do crescente mercado de tecnologia para animais de estimação, avaliado em US $ 9,4 bilhões em 2024 e projetado para atingir US $ 64 bilhões em 2037.

A inspiração por detrás deste artigo é o Blues, o nosso Dog Executive Officer (DEO). Se consultar a nossa página Sobre nós, verá que o Blues é um membro valioso da equipa e desempenha um papel importante para manter as coisas divertidas na Ultralytics! 

Neste artigo, discutiremos como treinar o YOLO11 de forma personalizada usando o Dog-Pose Dataset para estimar a pose de cães. Também exploraremos suas aplicações práticas em cuidados com animais de estimação e análise de comportamento.

__wf_reserved_inherit
Figura 1. Conheça Blues, o Diretor Executivo (DEO) da Ultralytics.

Uma visão geral do conjunto de dados Dog-Pose

Um conjunto de dados é uma coleção de dados utilizada para treinar modelos de aprendizagem automática. Para a estimativa de pose, um conjunto de dados ideal inclui imagens com pontos-chave etiquetados para mapear as posições do corpo. Também deve ter uma variedade de poses, ângulos, condições de iluminação e fundos para ajudar o modelo a aprender a reconhecer e prever poses com precisão. Esta diversidade torna o modelo mais fiável para utilização no mundo real.

O conjunto de dados Dog-Pose, suportado pela Ultralytics, foi especificamente concebido para ajudar os modelos a aprender e a reconhecer eficazmente as poses dos cães. Inclui mais de 8.400 imagens anotadas de várias raças de cães, com etiquetas detalhadas para 24 pontos-chave, como a cauda, as orelhas e as patas.

__wf_reserved_inherit
Fig. 2. Uma visão geral do conjunto de dados Dog-Pose.

Como treinar o YOLO11 de forma personalizada com o conjunto de dados Dog-Pose

O treino personalizado do YOLO11 com o conjunto de dados Dog-Pose é um processo simples. Para começar, terá de configurar o seu ambiente instalando o pacote Ultralytics Python, que inclui todas as ferramentas necessárias para a formação e avaliação. 

O Ultralytics tem suporte integrado para o Dog-Pose Dataset, o que elimina a necessidade de rotulagem manual, permitindo-lhe passar diretamente para o treino. Depois de tudo estar configurado, pode treinar o YOLO11 no conjunto de dados Dog-Pose utilizando apenas algumas linhas de código, como mostra a imagem abaixo. 

Durante o treino, o modelo aprende a detetar e a seguir as poses dos cães em diferentes raças, condições de iluminação e ambientes. Após o treino, pode visualizar os resultados e afinar o modelo para melhorar a precisão e o desempenho.

__wf_reserved_inherit
Fig. 3. Um excerto de código que mostra o treino personalizado do YOLO11 no conjunto de dados Dog-Pose.

Se tiver algum problema durante o treino do seu modelo, eis algumas sugestões de resolução de problemas para o ajudar a resolvê-los rapidamente:

  • Verifique a sua ligação à Internet: O Dog-Pose Dataset é descarregado automaticamente quando executa o script de treino. Certifique-se de que tem uma ligação estável à Internet para evitar falhas na transferência.
  • Atualizar Ultralytics: Certifique-se de que está a utilizar a versão mais recente do pacote Ultralytics Python.
  • Verifique se existem erros na consola: Leia atentamente todas as mensagens de erro, uma vez que estas fornecem frequentemente pistas sobre o que precisa de ser corrigido.

Você pode conferir o Guia de problemas comuns do Ultralytics para obter mais dicas de solução de problemas.

O que acontece durante o treino de modelos personalizados?

Poderá estar a perguntar-se o que acontece nos bastidores quando treina o YOLO11 no conjunto de dados Dog-Pose. Vamos dar uma olhada mais de perto no processo.

Em vez de começar do zero, utilizamos um modelo YOLO11-pose pré-treinado, que já foi treinado no conjunto de dados COCO-Pose. Este modelo pré-treinado pode detetar pontos-chave humanos, uma vez que o COCO-Pose foi concebido para estimar a pose humana. De facto, sem qualquer formação adicional, pode utilizar o YOLO11-Pose para efetuar a estimativa da pose humana imediatamente.

Através da aprendizagem por transferência, adaptamos este modelo especificamente para a estimativa da pose do cão, ajudando-o a reconhecer pontos-chave como as pernas, a cauda e a cabeça. Ao expor o modelo a exemplos específicos de cães, ele aprende a concentrar-se nestas caraterísticas essenciais.

Durante o treino, algumas partes do modelo permanecem inalteradas, retendo o conhecimento geral obtido a partir do conjunto de dados COCO. Outras partes são treinadas novamente para melhorar a precisão na estimativa das poses dos cães. O modelo aprende comparando as suas previsões com os pontos-chave reais no conjunto de dados e ajustando-os para reduzir os erros. Ao longo do tempo, este processo torna-o melhor a seguir os movimentos de um cão com precisão.

‍Aaprendizagem por transferência também permite que o modelo se adapte a diferentes raças, tamanhos e padrões de movimento, garantindo um desempenho fiável em cenários do mundo real.

__wf_reserved_inherit
Fig. 4. Deteção dos pontos-chave de Blues e da sua irmã Happy.

As vantagens do YOLO11 na estimativa da pose do cão

Existem vários modelos de visão por computador, por isso, o que faz do YOLO11 a escolha certa para a estimativa da pose do cão? 

O YOLO11 destaca-se pela sua velocidade e precisão em tempo real, o que o torna uma óptima opção para a estimativa da pose de cães. Tem um desempenho melhor do que as versões anteriores, tanto em termos de precisão como de velocidade. Com menos 22% de parâmetros do que o YOLOv8, atinge uma precisão média superior (mAP) no conjunto de dados COCO, o que significa que detecta objectos de forma mais precisa e eficiente. A sua rápida velocidade de processamento torna-o perfeito para aplicações em tempo real, onde a deteção rápida e fiável é essencial.

Para além da estimativa de pose, o YOLO11 também suporta tarefas de visão computacional como a segmentação de instâncias e o seguimento de objectos, o que pode ajudar a criar uma solução de IA de visão mais abrangente para monitorizar o seu cão. Estas funcionalidades podem melhorar o seguimento de movimentos, a análise do comportamento e os cuidados gerais com o animal de estimação.

__wf_reserved_inherit
Fig. 5. YOLO11 em ação: segmentar o Blues sem esforço!

Aplicações da estimativa da pose do cão e YOLO11

Em seguida, vamos discutir as aplicações reais da estimativa da pose do cão e o seu impacto nos cuidados com os animais de estimação. 

Melhorar o treino de animais de companhia com a estimativa da pose do cão

A estimativa da pose do cão pode tornar o treino do cão mais inteligente e mais eficaz. Digamos que está a ser utilizada uma câmara para captar os movimentos do cão, e é aqui que o YOLO11 pode intervir. Pode detetar pontos-chave como as pernas, a cauda e a cabeça, analisando-os para reconhecer acções como sentar, ficar ou deitar. 

Se o cão não executar a ação corretamente, o sistema pode fornecer feedback instantâneo através de uma aplicação, ajudando o treinador em tempo real. Isto torna o treino mais eficiente, preciso e sensível ao progresso do cão.

Por exemplo, considere a possibilidade de ensinar o seu cão a sentar-se à ordem. O sistema pode monitorizar a postura do cão e detetar se ele está totalmente sentado. Se o cão baixar o corpo mas não se sentar completamente, o sistema pode detetar a ação incompleta e enviar feedback instantâneo através de uma aplicação. O treinador pode ser alterado para fazer pequenos ajustes ao treino, como reforçar o comando ou orientar o cão para a posição correta.

__wf_reserved_inherit
Fig. 6. Blues a ajudar a equipa com a estimativa da pose do cão utilizando o YOLO11.

Avançar nos cuidados veterinários com modelos de estimativa de pose

A visão por computador pode transformar a forma como os veterinários abordam os cuidados com os animais. A capacidade da estimativa da pose do cão para analisar os detalhes com precisão facilita a deteção de padrões de movimento invulgares e a identificação de potenciais problemas de saúde. 

Por exemplo, um veterinário que monitorize um cão a recuperar de uma lesão nos ligamentos pode confiar no YOLO11, treinado no Dog-Pose Dataset, para uma análise automatizada. O coxear ou as alterações no posicionamento das pernas podem ser facilmente detectados. A monitorização contínua, 24 horas por dia, 7 dias por semana, possibilitada pela visão, fornece informações claras sobre a recuperação do cão, ajudando-os a determinar se o tratamento está a funcionar ou se são necessários ajustes

O caminho a seguir para a estimativa da pose do cão 

À medida que a tecnologia continua a evoluir, soluções como a estimativa da pose do cão com o YOLO11 irão provavelmente desempenhar um papel mais importante na monitorização e bem-estar dos animais. De facto, o YOLO11 pode ser integrado em tecnologia vestível, como coleiras inteligentes e rastreadores de saúde, para monitorizar indicadores-chave de saúde como o ritmo cardíaco, os níveis de atividade e os padrões de mobilidade.

Por exemplo, uma coleira inteligente equipada com sensores de movimento pode registar a marcha de um cão a caminhar ou a correr, enquanto a estimativa de pose do YOLO11 analisa a postura em tempo real. Se o sistema detetar movimentos irregulares, como claudicação ou rigidez, pode correlacionar estes dados com o ritmo cardíaco e os níveis de atividade para avaliar o potencial desconforto ou lesão. Os donos de animais e os veterinários podem utilizar estas informações para identificar problemas precocemente e tomar medidas proactivas.

Com estes avanços, a estimativa da pose do cão está a evoluir para além do simples rastreio de movimentos - está a tornar-se uma parte fundamental de um sistema abrangente de cuidados com animais de estimação orientado para a IA, ajudando os cães a manterem-se mais saudáveis, mais seguros e melhor monitorizados em tempo real.

Principais conclusões

Com inovações como o YOLO11 e o Dog-Pose Dataset, estamos a abrir novas possibilidades na visão computacional. Estes avanços ajudam-nos a compreender melhor o comportamento e a saúde dos cães de uma forma que não era possível antes.

Ao seguir com precisão as posturas dos cães, podemos melhorar o treino, monitorizar a saúde e tornar os cuidados com os animais de estimação mais eficazes. Quer seja na investigação, nos cuidados veterinários ou no treino de cães, a Vision AI está a criar formas mais inteligentes de cuidar dos nossos cães e melhorar o seu bem-estar.

Junte-se à nossa comunidade e explore o nosso repositório GitHub para saber mais sobre IA. Descubra como inovações como a visão computacional nos cuidados de saúde e a IA em carros autónomos estão a moldar o futuro. Veja as nossas opções de licenciamento para começar hoje os seus projectos de IA de visão.

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência