Descubra cómo los puntos clave definen la geometría y la postura de los objetos en la IA. Explore la estimación de posturas con Ultralytics y comience a utilizar nuestro Python , muy fácil de usar.
Los puntos clave son ubicaciones espaciales o puntos de referencia distintivos dentro de una imagen que definen las características significativas de un objeto o sujeto. En el contexto de la visión por computadora y el aprendizaje automático, un punto clave se representa normalmente mediante un conjunto de coordenadas (X, Y) que señalan una parte específica de un objeto, como el codo de una persona, la esquina de un edificio o el centro de la rueda de un coche. A diferencia de tareas más simples que solo identifican la presencia de un objeto, la identificación de puntos clave permite a los modelos de inteligencia artificial (IA) comprender la geometría, la postura y la disposición estructural del sujeto. Esta capacidad es fundamental para el análisis visual avanzado, ya que permite a las máquinas interpretar el lenguaje corporal, track movimientos track y alinear superposiciones digitales con objetos del mundo real.
Los puntos clave sirven como datos fundamentales para la estimación de la postura, una técnica que mapea la estructura esquelética de un ser humano o un animal. Al detectar un conjunto predefinido de puntos, como hombros, rodillas y tobillos, los algoritmos pueden reconstruir la postura completa de un sujeto en tiempo real. Este proceso va más allá de la detección estándar de objetos, que normalmente genera un cuadro delimitador alrededor de un objeto sin comprender su forma interna.
Las arquitecturas modernas, como la vanguardista Ultralytics , han evolucionado para predecir estos puntos clave con gran precisión y rapidez. Estos modelos utilizan redes de aprendizaje profundo (DL) entrenadas con enormes conjuntos de datos anotados, como COCO , para aprender los patrones visuales asociados a las articulaciones y los rasgos faciales. Durante la inferencia, el modelo regresa las coordenadas de cada punto clave, a menudo incluyendo una puntuación de confianza para indicar la fiabilidad de la predicción.
Es útil distinguir los puntos clave de otros resultados comunes de la visión artificial para comprender su utilidad única:
La capacidad de track partes track del cuerpo o características de objetos abre la puerta a diversas aplicaciones en todos los sectores:
Mediante la Ultralytics o el Python , los desarrolladores pueden implementar fácilmente la detección de puntos clave. El siguiente ejemplo muestra cómo cargar un modelo YOLO26-pose preentrenado y ejecutar la inferencia en una imagen para detect esqueletos detect .
from ultralytics import YOLO
# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results showing detected keypoints and skeletons
for result in results:
result.show() # Display the image with keypoints drawn
# Access keypoint coordinates (x, y, confidence)
keypoints = result.keypoints.data
print(f"Detected keypoints shape: {keypoints.shape}")
Este sencillo flujo de trabajo permite el rápido despliegue de sofisticadas aplicaciones de visión artificial (CV). Para los usuarios que deseen entrenar sus propios modelos de puntos clave personalizados —por ejemplo, para detect puntos detect en maquinaria industrial o especies animales—, la Ultralytics simplifica el proceso de anotación de datos y entrenamiento de modelos en la nube.
Para implementar con éxito la detección de puntos clave es necesario hacer frente a retos como la oclusión (cuando una parte del cuerpo queda oculta) y las diversas condiciones de iluminación. Los modelos modernos abordan esto mediante un sólido aumento de datos durante el entrenamiento, exponiendo la red a diversos escenarios. Además, la integración de puntos clave con algoritmos de seguimiento de objetos permite una identificación coherente de las personas a lo largo del tiempo en las transmisiones de vídeo, lo que resulta esencial para aplicaciones como la seguridad o el análisis del comportamiento .