Descubra los puntos clave de la visión por ordenador: estimación de la pose con Ultralytics YOLO11 para fitness, reconocimiento de gestos y seguimiento rápido y preciso.
En visión por ordenador, los puntos clave son puntos de interés específicos en una imagen que son distintivos y repetibles. Estos puntos sirven como puntos de referencia compactos y estructurales que representan un objeto o una escena, lo que permite a las máquinas comprender y analizar el contenido visual con mayor detalle. En lugar de procesar cada píxel, los algoritmos se centran en estos puntos clave -como esquinas, bordes o las articulaciones de un cuerpo humano- para realizar tareas complejas como rastrear movimientos, reconocer objetos y reconstruir escenas en 3D. Al concentrarse en estos puntos informativos, los modelos de visión por ordenador pueden lograr una gran eficacia y precisión.
La principal aplicación de los puntos clave es la estimación de la pose, una tarea de visión por ordenador centrada en la identificación de la posición y orientación de un objeto o persona. En la estimación de la pose humana, los puntos clave corresponden a las principales articulaciones del cuerpo, como hombros, codos, rodillas y muñecas. Al detectar estos puntos en una imagen o vídeo, un modelo puede construir una representación esquelética del cuerpo humano. Este "esqueleto digital" permite a un sistema de IA analizar la postura, los gestos y los movimientos sin necesidad de conocer el aspecto de la persona, su ropa o el entorno que la rodea.
Los modelos avanzados de aprendizaje profundo, como Ultralytics YOLO11, se entrenan en grandes conjuntos de datos anotados como COCO para predecir con precisión la ubicación de estos puntos clave en tiempo real. Los primeros sistemas, como OpenPose, allanaron el camino al demostrar la capacidad de detectar puntos clave en todo el cuerpo, las manos y la cara de varias personas a la vez. Las arquitecturas modernas se han basado en estos fundamentos para ofrecer resultados más rápidos y precisos en una amplia gama de aplicaciones.
Es importante diferenciar la detección de puntos clave de otras tareas relacionadas en visión por ordenador:
La capacidad de detectar y rastrear puntos clave ha permitido importantes avances en diversos sectores. He aquí dos ejemplos destacados:
Otras aplicaciones son la detección de puntos de referencia faciales para el análisis de emociones y los filtros de RA, la estimación de la postura de animales para estudios de comportamiento en la conservación de la fauna salvaje y la robótica para ayudar a las máquinas a navegar e interactuar con su entorno.