Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Puntos clave

Descubra los puntos clave de la visión por ordenador: estimación de la pose con Ultralytics YOLO11 para fitness, reconocimiento de gestos y seguimiento rápido y preciso.

Los puntos clave son ubicaciones espaciales precisas e informativas dentro de una imagen que definen características distintivas de un objeto o una escena. escena. En el campo de la visión por ordenador, estas coordenadas -típicamente representadas como valores X e Y- marcan puntos de interés significativos, como las esquinas de un edificio, el centro de un ojo o las articulaciones de un cuerpo humano. de un edificio, el centro de un ojo o las articulaciones de un cuerpo humano. A diferencia del procesamiento de cada píxel de una imagen, centrarse en estos puntos dispersos y semánticamente ricos permite modelos de inteligencia artificial (IA) comprender la geometría, analizar las formas y track movimiento con gran precisión. Este concepto es fundamental para tareas avanzadas que requieren una comprensión estructural del sujeto, en lugar de sólo su presencia o ubicación.

El papel de los puntos clave en la IA visual

Los puntos clave sirven como bloques de construcción fundamentales para mapear la estructura de los objetos dinámicos. Cuando se detectan y conectan varios Cuando se detectan y conectan varios puntos clave, forman un gráfico esquelético o alámbrico que representa la pose del objeto. Este Esto se aplica sobre todo a la estimación de la algoritmos predicen la ubicación de las articulaciones anatómicas -hombros, codos, caderas y rodillas- para reconstruir la postura humana.

Aprovechando arquitecturas de aprendizaje profundo como YOLO11los sistemas pueden recuperar estas coordenadas directamente a partir de las imágenes de entrada. Este proceso implica extracción de características complejas en las que la red a identificar patrones locales invariables a la iluminación, la rotación y la escala. Los datos resultantes son ligeros y computacionalmente eficientes, lo que los hace ideales para la inferencia en tiempo real en dispositivos periféricos.

Distinguir los puntos clave de los conceptos relacionados

Para comprender la utilidad específica de los puntos clave, resulta útil compararlos con otras tareas primarias de visión por ordenador informática:

  • Puntos clave frente a detección de objetos: La detección estándar identifica qué y dónde está un objeto encerrándolo en un cuadro delimitador. Sin embargo, la caja trata el objeto como como un rectángulo rígido. Los puntos clave miran dentro de la caja para identificar la articulación interna y la postura.
  • Puntos clave vs. Segmentación de instancias Segmentación por instancias: La segmentación crea una máscara de píxeles perfectos de la silueta del objeto. Aunque la segmentación proporciona detalle de los límites, a menudo es más pesada computacionalmente. Los puntos clave proporcionan un resumen estructural simplificado, a menudo se prefiere cuando se analiza la cinemática o la dinámica del movimiento.
  • Puntos clave frente a anotación de datos: La anotación es el proceso humano de etiquetado de datos, mientras que la detección de puntos clave es la predicción del modelo. La creación de un de datos implica hacer clic manualmente en puntos específicos (por ejemplo, "muñeca izquierda") para entrenar el modelo.

Aplicaciones en el mundo real

La capacidad de track puntos concretos de un tema abre la puerta a diversas aplicaciones en distintos sectores:

  • Analítica deportiva: Entrenadores y atletas utilizan la detección de puntos clave para analizar la biomecánica. Mediante el seguimiento de los ángulos entre las articulaciones durante un swing de golf o un sprint, los sistemas pueden proporcionar información automatizada para optimizar el rendimiento y prevenir lesiones. Este a menudo implica calcular grados de libertad para comprender la amplitud de movimiento.
  • IA en robótica: Los robots se basan en puntos clave para agarrar y manipular objetos. La identificación de puntos de agarre específicos en un objeto permite a un brazo robótico calcular calcular la cinemática inversa y correctamente su efector final.
  • La IA en la sanidad: Física Las aplicaciones de fisioterapia controlan a distancia los ejercicios de los pacientes. Mediante el seguimiento de los puntos de referencia corporales, el sistema garantiza que los ejercicios se realicen de la forma correcta, lo que contribuye a una rehabilitación eficaz. forma correcta, lo que contribuye a una rehabilitación eficaz.
  • Realidad Aumentada (RA): En los filtros En los filtros de redes sociales y las aplicaciones de pruebas virtuales, los puntos clave de la cara (puntos de referencia faciales) permiten que las máscaras digitales o las gafas se alineen perfectamente con los movimientos del usuario. se alineen perfectamente con los movimientos del usuario.

Aplicación de la detección de puntos clave

Las bibliotecas modernas facilitan la detección de puntos clave mediante modelos preentrenados. El sitio ultralytics proporciona acceso instantáneo a YOLO11 modelos entrenados en conjuntos de datos masivos como COCO para identificar articulaciones humanas.

El siguiente ejemplo muestra cómo cargar un modelo de estimación de pose y visualizar los puntos clave detectados:

from ultralytics import YOLO

# Load a pretrained YOLO11n-pose model
model = YOLO("yolo11n-pose.pt")

# Run inference on a local image or URL
results = model("https://docs.ultralytics.com/tasks/detect/")

# Visualize the results, showing the skeletal keypoints
results[0].show()

En este flujo de trabajo, el modelo produce un Keypoints que contiene las coordenadas y un objeto puntuación de confianza para cada punto detectado. Los desarrolladores pueden extraer estos x, y valores para construir una lógica personalizada, como contar repeticiones en una aplicación de gimnasia o controlar un personaje de juego mediante interacción persona-ordenador.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora