Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Puntos clave

Descubra cómo los puntos clave definen la geometría y la postura de los objetos en la IA. Explore la estimación de posturas con Ultralytics y comience a utilizar nuestro Python , muy fácil de usar.

Los puntos clave son ubicaciones espaciales o puntos de referencia distintivos dentro de una imagen que definen las características significativas de un objeto o sujeto. En el contexto de la visión por computadora y el aprendizaje automático, un punto clave se representa normalmente mediante un conjunto de coordenadas (X, Y) que señalan una parte específica de un objeto, como el codo de una persona, la esquina de un edificio o el centro de la rueda de un coche. A diferencia de tareas más simples que solo identifican la presencia de un objeto, la identificación de puntos clave permite a los modelos de inteligencia artificial (IA) comprender la geometría, la postura y la disposición estructural del sujeto. Esta capacidad es fundamental para el análisis visual avanzado, ya que permite a las máquinas interpretar el lenguaje corporal, track movimientos track y alinear superposiciones digitales con objetos del mundo real.

El papel de los puntos clave en los modelos de IA

Los puntos clave sirven como datos fundamentales para la estimación de la postura, una técnica que mapea la estructura esquelética de un ser humano o un animal. Al detectar un conjunto predefinido de puntos, como hombros, rodillas y tobillos, los algoritmos pueden reconstruir la postura completa de un sujeto en tiempo real. Este proceso va más allá de la detección estándar de objetos, que normalmente genera un cuadro delimitador alrededor de un objeto sin comprender su forma interna.

Las arquitecturas modernas, como la vanguardista Ultralytics , han evolucionado para predecir estos puntos clave con gran precisión y rapidez. Estos modelos utilizan redes de aprendizaje profundo (DL) entrenadas con enormes conjuntos de datos anotados, como COCO , para aprender los patrones visuales asociados a las articulaciones y los rasgos faciales. Durante la inferencia, el modelo regresa las coordenadas de cada punto clave, a menudo incluyendo una puntuación de confianza para indicar la fiabilidad de la predicción.

Puntos clave frente a conceptos relacionados

Es útil distinguir los puntos clave de otros resultados comunes de la visión artificial para comprender su utilidad única:

  • Puntos clave frente a cuadros delimitadores: un cuadro delimitador proporciona una localización aproximada, encerrando todo el objeto en un rectángulo. Los puntos clave proporcionan una localización detallada de partes específicas dentro de ese objeto.
  • Puntos clave frente a segmentación de imágenes: La segmentación de imágenes clasifica cada píxel para crear una máscara precisa de la forma del objeto. Mientras que la segmentación ofrece información detallada sobre los límites, los puntos clave ofrecen un resumen estructural (un «esqueleto») que suele ser más eficaz para analizar el movimiento y la cinemática.
  • Puntos clave frente a descriptores de características: En el procesamiento de imágenes tradicional, como SIFT (Scale-Invariant Feature Transform), los puntos clave son puntos de interés (esquinas, manchas) que se utilizan para la coincidencia de imágenes. En la estimación de la pose mediante DL moderna, los puntos clave son etiquetas semánticas (por ejemplo, «muñeca izquierda») aprendidas por la red.

Aplicaciones en el mundo real

La capacidad de track partes track del cuerpo o características de objetos abre la puerta a diversas aplicaciones en todos los sectores:

  • Análisis deportivo: Los entrenadores y los atletas utilizan la estimación de posturas para analizar la biomecánica. Mediante el seguimiento de puntos clave en las articulaciones, los sistemas pueden calcular ángulos y velocidades para mejorar la técnica en deportes como el golf, el tenis o el sprint. Vea cómo YOLO Ultralytics track para proporcionar información útil.
  • Atención sanitaria y rehabilitación: Las plataformas de fisioterapia aprovechan puntos clave para supervisar los ejercicios de los pacientes de forma remota. El sistema garantiza que los pacientes mantengan una postura correcta durante las rutinas de rehabilitación, lo que reduce el riesgo de lesiones y permite realizar un seguimiento del progreso de la recuperación.
  • Realidad aumentada (RA): Los filtros de las redes sociales y las aplicaciones de prueba virtual se basan en puntos clave del rostro (contornos de los ojos, la nariz y la boca) para fijar máscaras o gafas digitales de forma segura al rostro del usuario, manteniendo la alineación incluso cuando se mueven.
  • Monitorización del conductor: los sistemas de seguridad automovilística track los rasgos track para detect de somnolencia o distracción, alertando al conductor si cierra los ojos o si la posición de su cabeza indica falta de atención.

Implementación de la detección de puntos clave con YOLO26

Mediante la Ultralytics o el Python , los desarrolladores pueden implementar fácilmente la detección de puntos clave. El siguiente ejemplo muestra cómo cargar un modelo YOLO26-pose preentrenado y ejecutar la inferencia en una imagen para detect esqueletos detect .

from ultralytics import YOLO

# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results showing detected keypoints and skeletons
for result in results:
    result.show()  # Display the image with keypoints drawn

    # Access keypoint coordinates (x, y, confidence)
    keypoints = result.keypoints.data
    print(f"Detected keypoints shape: {keypoints.shape}")

Este sencillo flujo de trabajo permite el rápido despliegue de sofisticadas aplicaciones de visión artificial (CV). Para los usuarios que deseen entrenar sus propios modelos de puntos clave personalizados —por ejemplo, para detect puntos detect en maquinaria industrial o especies animales—, la Ultralytics simplifica el proceso de anotación de datos y entrenamiento de modelos en la nube.

Consideraciones avanzadas

Para implementar con éxito la detección de puntos clave es necesario hacer frente a retos como la oclusión (cuando una parte del cuerpo queda oculta) y las diversas condiciones de iluminación. Los modelos modernos abordan esto mediante un sólido aumento de datos durante el entrenamiento, exponiendo la red a diversos escenarios. Además, la integración de puntos clave con algoritmos de seguimiento de objetos permite una identificación coherente de las personas a lo largo del tiempo en las transmisiones de vídeo, lo que resulta esencial para aplicaciones como la seguridad o el análisis del comportamiento .

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora