Descubra os pontos-chave da visão computacional: estimativa de pose com o Ultralytics YOLO11 para fitness, reconhecimento de gestos e rastreio rápido e preciso.
Na visão por computador, os pontos-chave são pontos de interesse específicos numa imagem que são distintos e repetíveis. Estes pontos funcionam como marcos estruturais compactos que representam um objeto ou uma cena, permitindo às máquinas compreender e analisar o conteúdo visual com maior detalhe. Em vez de processar cada pixel, os algoritmos concentram-se nestes pontos-chave - como cantos, arestas ou as articulações de um corpo humano - para realizar tarefas complexas, como seguir movimentos, reconhecer objectos e reconstruir cenas 3D. Ao concentrarem-se nestes pontos informativos, os modelos de visão por computador podem atingir uma elevada eficiência e precisão.
A principal aplicação dos pontos-chave é a estimativa de pose, uma tarefa de visão por computador centrada na identificação da posição e orientação de um objeto ou pessoa. Na estimativa da pose humana, os pontos-chave correspondem às principais articulações do corpo, como os ombros, cotovelos, joelhos e pulsos. Ao detetar estes pontos numa imagem ou vídeo, um modelo pode construir uma representação esquelética do corpo humano. Este "esqueleto digital" permite que um sistema de IA analise a postura, os gestos e os movimentos sem necessitar de compreender a aparência da pessoa, o vestuário ou o ambiente circundante.
Modelos avançados de aprendizagem profunda, como o Ultralytics YOLO11, são treinados em grandes conjuntos de dados anotados, como o COCO, para prever com precisão a localização desses pontos-chave em tempo real. Os primeiros sistemas, como o OpenPose, abriram caminho ao demonstrar a capacidade de detetar simultaneamente pontos-chave de corpo inteiro, mãos e rosto de várias pessoas. As arquitecturas modernas foram construídas sobre estas bases para fornecer resultados mais rápidos e precisos para uma vasta gama de aplicações.
É importante distinguir a deteção de pontos-chave de outras tarefas relacionadas com a visão por computador:
A capacidade de detetar e seguir pontos-chave permitiu avanços significativos em vários sectores. Eis dois exemplos importantes:
Outras aplicações incluem a deteção de marcas faciais para análise de emoções e filtros de RA, a estimativa da pose de animais para estudos comportamentais na conservação da vida selvagem e a robótica para ajudar as máquinas a navegar e interagir com o seu ambiente.