Keypoints
Aprende cómo los puntos clave definen la geometría y la postura de un objeto en IA. Explora la estimación de pose con Ultralytics YOLO26 y empieza a usar nuestro SDK de Python fácil de usar.
Los keypoints son ubicaciones espaciales o puntos de referencia distintos dentro de una imagen que definen características significativas de un objeto o sujeto. En el contexto de la visión por ordenador y el aprendizaje automático, un keypoint suele representarse mediante un conjunto de coordenadas (X, Y) que señalan una parte específica de un objeto, como el codo de una persona, la esquina de un edificio o el centro de la rueda de un coche. A diferencia de las tareas más sencillas que solo identifican la presencia de un objeto, identificar keypoints permite a los modelos de inteligencia artificial (IA) comprender la geometría, la postura y la disposición estructural del sujeto. Esta capacidad es fundamental para el análisis visual avanzado, ya que permite a las máquinas interpretar el lenguaje corporal, realizar un seguimiento de movimientos precisos y alinear superposiciones digitales con objetos del mundo real.
Link to this sectionEl papel de los keypoints en los modelos de IA#
Los keypoints sirven como datos fundamentales para la estimación de pose, una técnica que mapea la estructura esquelética de un humano o animal. Al detectar un conjunto predefinido de puntos (como hombros, rodillas y tobillos), los algoritmos pueden reconstruir la postura completa de un sujeto en tiempo real. Este proceso va más allá de la detección de objetos estándar, que normalmente genera un cuadro delimitador alrededor de un objeto sin comprender su forma interna.
Las arquitecturas modernas, como el Ultralytics YOLO26 de vanguardia, han evolucionado para predecir estos keypoints con alta precisión y velocidad. Estos modelos utilizan redes de deep learning (DL) entrenadas en conjuntos de datos anotados masivos, como COCO Keypoints, para aprender los patrones visuales asociados con las articulaciones y los rasgos faciales. Durante la inferencia, el modelo realiza una regresión de las coordenadas para cada keypoint, incluyendo a menudo una puntuación de confianza para indicar la fiabilidad de la predicción.
Link to this sectionKeypoints frente a conceptos relacionados#
Es útil distinguir los keypoints de otros resultados comunes de la visión por ordenador para comprender su utilidad única:
- Keypoints frente a cuadros delimitadores (bounding boxes): Un bounding box proporciona una localización aproximada, encerrando el objeto completo en un rectángulo. Los keypoints proporcionan una localización precisa de partes específicas dentro de ese objeto.
- Keypoints frente a segmentación de imágenes: La segmentación de imágenes clasifica cada píxel para crear una máscara precisa de la forma del objeto. Mientras que la segmentación ofrece información detallada de los límites, los keypoints ofrecen un resumen estructural (un "esqueleto") que a menudo es más eficiente para analizar el movimiento y la cinemática.
- Keypoints frente a descriptores de características: En el procesamiento de imágenes tradicional como SIFT (Scale-Invariant Feature Transform), los keypoints son puntos de interés (esquinas, blobs) utilizados para la coincidencia de imágenes. En la estimación de pose mediante DL moderna, los keypoints son etiquetas semánticas (por ejemplo, "muñeca izquierda") aprendidas por la red.
Link to this sectionAplicaciones en el mundo real#
La capacidad de rastrear partes específicas del cuerpo o características de los objetos abre diversas aplicaciones en todas las industrias:
- Análisis deportivo: Los entrenadores y atletas utilizan la estimación de pose para analizar la biomecánica. Al rastrear los keypoints en las articulaciones, los sistemas pueden calcular ángulos y velocidades para mejorar la técnica en deportes como el golf, el tenis o las carreras de velocidad. Mira cómo los modelos Ultralytics YOLO rastrean swings de golf para proporcionar información práctica.
- Atención sanitaria y rehabilitación: Las plataformas de fisioterapia aprovechan los keypoints para controlar los ejercicios de los pacientes de forma remota. El sistema asegura que los pacientes mantengan una forma correcta durante las rutinas de rehabilitación, reduciendo el riesgo de lesiones y haciendo un seguimiento del progreso de recuperación.
- Realidad aumentada (RA): Los filtros de redes sociales y las aplicaciones de prueba virtual dependen de los keypoints faciales (contornos de ojos, nariz, boca) para anclar máscaras digitales o gafas de forma segura al rostro del usuario, manteniendo la alineación incluso mientras se mueve.
- Monitorización del conductor: Los sistemas de seguridad automotriz rastrean puntos de referencia faciales para detectar signos de somnolencia o distracción, alertando al conductor si sus ojos se cierran o si la posición de su cabeza indica falta de atención.
Link to this sectionImplementación de detección de keypoints con YOLO26#
Usando la plataforma Ultralytics o el SDK de Python, los desarrolladores pueden implementar fácilmente la detección de keypoints. El siguiente ejemplo demuestra cómo cargar un modelo YOLO26-pose preentrenado y ejecutar la inferencia en una imagen para detectar esqueletos humanos.
from ultralytics import YOLO
# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results showing detected keypoints and skeletons
for result in results:
result.show() # Display the image with keypoints drawn
# Access keypoint coordinates (x, y, confidence)
keypoints = result.keypoints.data
print(f"Detected keypoints shape: {keypoints.shape}")Este flujo de trabajo sencillo permite el despliegue rápido de aplicaciones sofisticadas de visión por ordenador (CV). Para los usuarios que buscan entrenar sus propios modelos de keypoints personalizados (por ejemplo, para detectar puntos específicos en maquinaria industrial o especies animales), la plataforma Ultralytics simplifica el proceso de anotación de datos y entrenamiento de modelos en la nube.
Link to this sectionConsideraciones avanzadas#
El despliegue exitoso de la detección de keypoints requiere manejar desafíos como la oclusión (cuando una parte del cuerpo está oculta) y diversas condiciones de iluminación. Los modelos modernos abordan esto mediante una sólida aumentación de datos durante el entrenamiento, exponiendo la red a escenarios variados. Además, la integración de keypoints con algoritmos de seguimiento de objetos permite una identificación consistente de individuos a lo largo del tiempo en transmisiones de vídeo, algo esencial para aplicaciones como la seguridad o el análisis de comportamiento.






