Yolo Vision Shenzhen
Shenzhen
Únete ahora

¿Cómo usar Ultralytics YOLO11 para la estimación de pose?

Abirami Vina

3 minutos de lectura

14 de octubre de 2024

Aprenda a utilizar el modelo Ultralytics YOLO11 para una estimación precisa de la pose. Cubriremos la inferencia en tiempo real y el entrenamiento de modelos personalizados para diversas aplicaciones.

La investigación relacionada con la visión artificial, una rama de la inteligencia artificial (IA), se remonta a la década de 1960. Sin embargo, no fue hasta la década de 2010, con el auge del aprendizaje profundo, que vimos grandes avances en la forma en que las máquinas entienden las imágenes. Uno de los últimos avances en visión artificial son los modelos de vanguardia Ultralytics YOLO11. Los modelos YOLO11, presentados por primera vez en el evento híbrido anual de Ultralytics, YOLO Vision 2024 (YV24), admiten una variedad de tareas de visión artificial, incluida la estimación de pose.

La estimación de pose se puede utilizar para detectar puntos clave en una persona u objeto en una imagen o vídeo para comprender su posición, postura o movimiento. Se utiliza ampliamente en aplicaciones como análisis deportivo, monitorización del comportamiento animal y robótica para ayudar a las máquinas a interpretar las acciones físicas en tiempo real. Gracias a su mayor precisión, eficiencia y velocidad con respecto a los modelos anteriores de la serie YOLO (You Only Look Once), YOLO11 es muy adecuado para tareas de estimación de pose en tiempo real.

__wf_reserved_inherit
Fig. 1. Un ejemplo del uso de Ultralytics YOLO11 para la estimación de pose.

En este artículo, exploraremos qué es la estimación de pose, analizaremos algunas de sus aplicaciones y explicaremos cómo puede utilizar YOLO11 con el paquete de Python de Ultralytics para la estimación de pose. También echaremos un vistazo a cómo puede utilizar Ultralytics HUB para probar YOLO11 y la estimación de pose con unos simples clics. ¡Empecemos!

¿Qué es la estimación de pose?

Antes de profundizar en cómo utilizar el nuevo modelo Ultralytics YOLO11 para la estimación de poses, vamos a comprender mejor qué es la estimación de poses.

La estimación de la pose es una técnica de visión artificial utilizada para analizar la pose de una persona u objeto en una imagen o vídeo. Los modelos de aprendizaje profundo como YOLO11 pueden identificar, localizar y rastrear puntos clave en un objeto o persona dada. Para los objetos, estos puntos clave pueden incluir esquinas, bordes o marcas superficiales distintas, mientras que para los humanos, estos puntos clave representan las principales articulaciones como el codo, la rodilla o el hombro. 

La estimación de la pose es única y más compleja en comparación con otras tareas de visión artificial como la detección de objetos. Mientras que la detección de objetos localiza objetos en una imagen dibujando un cuadro alrededor de ellos, la estimación de la pose va más allá al predecir las posiciones exactas de los puntos clave en el objeto.

__wf_reserved_inherit
Fig. 2. Uso de YOLO11 para detectar y estimar las poses de personas en una oficina.

Cuando se trata de la estimación de la pose, hay dos formas principales en que funciona: de abajo arriba y de arriba abajo. El enfoque de abajo arriba detecta puntos clave individuales y los agrupa en esqueletos, mientras que el enfoque de arriba abajo se centra primero en detectar objetos y luego en estimar los puntos clave dentro de ellos. 

YOLO11 combina las fortalezas de los métodos tanto top-down como bottom-up. Al igual que el enfoque bottom-up, mantiene las cosas simples y rápidas sin necesidad de agrupar los puntos clave manualmente. Al mismo tiempo, utiliza la precisión del método top-down al detectar personas y estimar sus poses en un solo paso.

Casos de uso de la estimación de la pose para YOLO11 

Las versátiles capacidades de YOLO11 para la estimación de poses abren una amplia gama de posibles aplicaciones en muchas industrias. Echemos un vistazo más de cerca a algunos casos de uso de la estimación de poses de YOLO11.

Estimación de la pose en tiempo real con YOLO11: Mejora de la seguridad de los trabajadores

La seguridad es un aspecto importante de cualquier proyecto de construcción. Esto es especialmente cierto, ya que, estadísticamente, las obras de construcción registran un mayor número de lesiones relacionadas con el trabajo. En 2021, alrededor del 20% de todas las lesiones mortales relacionadas con el trabajo ocurrieron en o cerca de obras de construcción. Con riesgos diarios como equipo pesado y sistemas eléctricos, es esencial contar con medidas de seguridad sólidas para mantener a los trabajadores seguros. Los métodos tradicionales, como el uso de señales, barricadas y la supervisión manual por parte de los supervisores, no siempre son eficaces y, a menudo, alejan a los supervisores de tareas más críticas.

La IA puede intervenir para mejorar la seguridad, y el riesgo de accidentes puede reducirse mediante el uso de un sistema de monitorización de trabajadores basado en la estimación de la pose. Los modelos YOLO11 de Ultralytics pueden utilizarse para rastrear los movimientos y posturas de los trabajadores. Cualquier peligro potencial, como trabajadores que estén demasiado cerca de equipos peligrosos o que realicen tareas incorrectamente, puede detectarse rápidamente. Si se detecta un riesgo, se puede notificar a los supervisores o una alarma puede alertar al trabajador. Un sistema de monitorización continua puede hacer que las obras de construcción sean más seguras al estar siempre atento a los peligros y proteger a los trabajadores

__wf_reserved_inherit
Fig. 3. Un ejemplo de estimación de pose en una obra en construcción utilizando YOLO11.

Estimación de la pose con YOLO11 para la monitorización del ganado

Los agricultores e investigadores pueden usar YOLO11 para estudiar el movimiento y el comportamiento de los animales de granja, como el ganado, para detectar signos tempranos de enfermedades como la cojera. La cojera es una afección en la que un animal tiene dificultades para moverse correctamente debido al dolor en las patas o los pies. En el ganado, enfermedades como la cojera no solo afectan su salud y bienestar, sino que también provocan problemas de producción en las granjas lecheras. Los estudios demuestran que la cojera afecta entre el 8% del ganado en sistemas basados en pastos y entre el 15% y el 30% en sistemas confinados en toda la industria láctea mundial. Detectar y abordar la cojera de forma temprana puede ayudar a mejorar el bienestar animal y reducir las pérdidas de producción asociadas con esta afección.

Las funciones de estimación de pose de YOLO11 pueden ayudar a los agricultores a rastrear los patrones de marcha de los animales e identificar rápidamente cualquier anomalía que pueda indicar problemas de salud, como problemas articulares o infecciones. La detección temprana de estos problemas permite un tratamiento más rápido, lo que reduce las molestias de los animales y ayuda a los agricultores a evitar pérdidas económicas.

Los sistemas de monitorización habilitados con IA de visión también pueden ayudar a analizar el comportamiento de descanso, las interacciones sociales y los patrones de alimentación. Los agricultores también pueden utilizar la estimación de la pose para obtener observaciones sobre signos de estrés o agresión. Estos conocimientos se pueden utilizar para cultivar mejores condiciones de vida para los animales y aumentar su bienestar.

__wf_reserved_inherit
Fig 4. Una visualización de la estimación de la pose de una vaca.

Casos de uso de YOLO11 en la industria del fitness

La estimación de la pose también puede ayudar a las personas a mejorar su postura en tiempo real mientras hacen ejercicio. Con YOLO11, los instructores de gimnasia y yoga pueden supervisar y rastrear los movimientos del cuerpo de las personas que se ejercitan, centrándose en puntos clave como las articulaciones y las extremidades para evaluar su postura. Los datos recogidos pueden compararse con las poses y técnicas de entrenamiento ideales, y los instructores pueden recibir alertas si alguien está realizando un movimiento incorrectamente, lo que ayuda a prevenir lesiones.

__wf_reserved_inherit
Fig 5. Uso de la estimación de pose para analizar un entrenamiento.

Por ejemplo, durante una clase de yoga, la estimación de la pose puede ayudar a controlar si todos los estudiantes mantienen el equilibrio y la alineación adecuados. Las aplicaciones móviles integradas con visión artificial y estimación de la pose pueden hacer que el fitness sea más accesible para las personas que hacen ejercicio en casa o para aquellas que no tienen acceso a entrenadores personales. Esta retroalimentación continua en tiempo real ayuda a los usuarios a mejorar su técnica y alcanzar sus objetivos de fitness al tiempo que reduce el riesgo de lesiones.

Probando la estimación de pose en tiempo real con el modelo YOLO11

Ahora que hemos explorado qué es la estimación de pose y hemos analizado algunas de sus aplicaciones, veamos cómo puedes probar la estimación de pose con el nuevo modelo YOLO11. Para empezar, hay dos formas convenientes de hacerlo: usando el paquete de Python de Ultralytics o a través de Ultralytics HUB. Echemos un vistazo a ambas opciones.

Ejecución de inferencias usando YOLO11

Ejecutar una inferencia implica que el modelo YOLO11 procese nuevos datos fuera de sus conjuntos de entrenamiento y utilice los patrones que aprendió para hacer predicciones basadas en esos datos. Puede ejecutar inferencias a través del código con el paquete de Python Ultralytics. Todo lo que necesita hacer para empezar es instalar el paquete Ultralytics usando pip, conda o Docker. Si se enfrenta a algún desafío durante la instalación, nuestra Guía de problemas comunes ofrece consejos útiles para la resolución de problemas. 

Una vez que haya instalado el paquete correctamente, el siguiente código describe cómo cargar un modelo y utilizarlo para predecir las poses de los objetos en una imagen.

__wf_reserved_inherit
Fig. 6. Fragmento de código que muestra la ejecución de inferencias utilizando YOLO11.

Entrenamiento de un modelo YOLO11 personalizado

Digamos que está trabajando en un proyecto de visión artificial y tiene un conjunto de datos específico para una aplicación particular que involucra la estimación de la pose. Entonces puede ajustar y entrenar un modelo YOLO11 personalizado para que se adapte a su aplicación. Por ejemplo, puede utilizar un conjunto de datos de puntos clave para analizar y comprender la pose de un tigre en las imágenes identificando características clave como la posición de sus extremidades, cabeza y cola.

Puede utilizar el siguiente fragmento de código para cargar y entrenar un modelo de estimación de pose YOLO11. El modelo puede construirse a partir de una configuración YAML, o puede cargar un modelo pre-entrenado para el entrenamiento. Este script también le permite transferir pesos e iniciar el entrenamiento del modelo utilizando un conjunto de datos especificado, como el conjunto de datos COCO para la estimación de la pose.

__wf_reserved_inherit
Fig 7. Entrenamiento personalizado de YOLO11.

Usando el modelo personalizado recién entrenado, puedes ejecutar inferencias en imágenes no vistas relacionadas con tu solución de visión artificial. El modelo entrenado también se puede convertir a otros formatos utilizando el modo de exportación.

Prueba YOLO11 en Ultralytics HUB

Hasta ahora, hemos analizado métodos para usar YOLO11 que requieren algunos conocimientos básicos de codificación. Si eso no es lo que está buscando, o no está familiarizado con la codificación, hay otra opción: Ultralytics HUB. Ultralytics HUB es una plataforma fácil de usar diseñada para simplificar el proceso de entrenamiento e implementación de modelos YOLO. HUB le permite administrar fácilmente conjuntos de datos, entrenar modelos e implementarlos sin la necesidad de experiencia técnica.

Para ejecutar inferencias en imágenes, puede crear una cuenta, navegar a la sección 'Modelos' y elegir el modelo de estimación de pose YOLO11 que le interese. En la sección de vista previa, puede cargar una imagen y ver los resultados de la predicción como se muestra a continuación. 

__wf_reserved_inherit
Fig 8. Estimación de pose en Ultralytics HUB con YOLO11.

Avances de YOLO11 en la detección de la pose humana

Ultralytics YOLO11 ofrece soluciones precisas y flexibles para tareas como la estimación de pose en una amplia gama de aplicaciones. Desde mejorar la seguridad de los trabajadores en obras de construcción hasta monitorizar la salud del ganado y ayudar con la corrección de la postura en rutinas de fitness, YOLO11 aporta precisión y retroalimentación en tiempo real a través de tecnología avanzada de visión artificial. 

Su versatilidad, con múltiples variantes de modelos y la capacidad de entrenar de forma personalizada para casos de uso específicos, la convierte en una herramienta muy valiosa tanto para desarrolladores como para empresas. Ya sea mediante la codificación con el paquete Ultralytics Python o mediante el uso de Ultralytics HUB para una implementación más sencilla, YOLO11 hace que la estimación de la pose sea accesible e impactante.

Para explorar más, visite nuestro repositorio de GitHub e interactúe con nuestra comunidad. Explore las aplicaciones de IA en fabricación y agricultura en nuestras páginas de soluciones. 🚀

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis
Enlace copiado al portapapeles