Saiba como a estimativa de pose usa pontos-chave para track . Explore aplicações do mundo real e comece a usar Ultralytics para obter resultados rápidos e precisos.
A estimativa de pose é uma técnica especializada de visão computacional que vai além da simples detecção da presença de objetos para compreender a sua estrutura geométrica e orientação física. Enquanto a detecção padrão de objetos desenha uma caixa retangular simples ao redor de um objeto, a estimativa de pose identifica pontos semânticos específicos, conhecidos como pontos-chave, como articulações no corpo humano (cotovelos, joelhos, ombros) ou cantos estruturais em um veículo. Ao mapear esses pontos de referência, os modelos de aprendizagem automática podem reconstruir uma representação esquelética do objeto, permitindo que os sistemas interpretem a linguagem corporal, a dinâmica dos movimentos e o posicionamento preciso no espaço 2D ou 3D.
A estimativa de pose moderna depende fortemente de sofisticadas arquiteturas de aprendizagem profunda, frequentemente utilizando Redes Neurais Convolucionais (CNNs) para processar dados visuais. Os algoritmos geralmente seguem uma de duas estratégias principais para identificar pontos-chave:
Modelos de última geração, como o YOLO26, utilizam arquiteturas avançadas de ponta a ponta que equilibram essas necessidades, fornecendo estimativa de pose em alta velocidade adequada para implantação em dispositivos de IA de ponta e plataformas móveis.
É útil diferenciar a estimativa de pose de outras tarefas de reconhecimento visual para compreender o seu valor único nos fluxos de trabalho de visão computacional:
A capacidade de digitalizar o movimento humano e de objetos levou a aplicações transformadoras em vários setores, frequentemente treinadas usando ferramentas como a Ultralytics para gerenciar grandes conjuntos de dados de pontos-chave anotados.
Na área médica, a IA na saúde utiliza a estimativa de postura para monitorizar remotamente a reabilitação do paciente. Ao rastrear os ângulos das articulações e a amplitude de movimento, os sistemas automatizados podem garantir que os pacientes realizem os exercícios de fisioterapia corretamente em casa. Isso reduz o risco de nova lesão e permite que os médicos quantifiquem o progresso da recuperação sem a necessidade de equipamentos laboratoriais caros.
Treinadores e atletas utilizam análises desportivas para otimizar o desempenho. Modelos de estimativa de pose podem analisar o plano de swing de um jogador de golfe, o comprimento da passada de um corredor ou a biomecânica de um lançador sem a necessidade de fatos com marcadores intrusivos usados na captura de movimento tradicional . Isso fornece feedback imediato e baseado em dados para melhorar a técnica e prevenir lesões por uso excessivo.
Em ambientes comerciais, a IA em sistemas de retalho utiliza a deteção de poses para compreender o comportamento dos clientes, como alcançar produtos em prateleiras altas ou permanecer em corredores específicos . Esses dados ajudam a otimizar o layout das lojas e melhorar a gestão de inventário , correlacionando ações físicas com decisões de compra.
A implementação da estimativa de pose é simples com os modernos Python estruturas.
O exemplo a seguir demonstra como usar o ultralytics pacote para carregar um pré-treinado
YOLO26 modelo (o sucessor do
YOLO11) e detect pontos-chave detect numa imagem.
from ultralytics import YOLO
# Load the YOLO26 pose model (nano version for speed)
model = YOLO("yolo26n-pose.pt")
# Perform inference on an image source
# The model identifies bounding boxes and specific keypoints (joints)
results = model("https://ultralytics.com/images/bus.jpg")
# Print the xy coordinates of detected keypoints
print(results[0].keypoints.xy)
# Visualize the skeletal results directly
results[0].show()