Yolo Vision Shenzhen
Shenzhen
Únete ahora

Cómo utilizar Ultralytics YOLO11 para la estimación de la pose

Abirami Vina

3 minutos de lectura

14 de octubre de 2024

Aprenda a utilizar el modeloYOLO11 Ultralytics para una estimación precisa de la pose. Cubriremos la inferencia en tiempo real y el entrenamiento de modelos personalizados para diversas aplicaciones.

La investigación relacionada con la visión por ordenador, una rama de la inteligencia artificial (IA), se remonta a la década de 1960. Sin embargo, no fue hasta la década de 2010, con el auge del aprendizaje profundo, cuando vimos grandes avances en la forma en que las máquinas entienden las imágenes. Uno de los últimos avances en visión por computador son las vanguardistas Ultralytics YOLO11 de Ultralytics. Los modelosYOLO11 , presentados por primera vez en el evento híbrido anual de Ultralytics, YOLO Vision 2024 (YV24), admiten una serie de tareas de visión por ordenador, incluida la estimación de poses.

La estimación de la pose se puede utilizar para detect puntos clave de una persona u objeto en una imagen o vídeo para comprender su posición, postura o movimiento. Se utiliza mucho en aplicaciones como la analítica deportiva, la monitorización del comportamiento animal y la robótica para ayudar a las máquinas a interpretar acciones físicas en tiempo real. Gracias a su precisión, eficacia y velocidad mejoradas con respecto a los modelos anteriores de la serieYOLO (You Only Look Once), YOLO11 es idóneo para tareas de estimación de la pose en tiempo real.

__wf_reserved_inherit
Fig. 1. Ejemplo de utilización de Ultralytics YOLO11 para la estimación de la pose.

En este artículo, exploraremos qué es la estimación de pose, discutiremos algunas de sus aplicaciones y veremos cómo se puede utilizar YOLO11 con el paqueteUltralytics Python para la estimación de la pose. También veremos cómo utilizar Ultralytics HUB para probar YOLO11 y la estimación de la pose con unos pocos clics. Pongámonos manos a la obra.

¿Qué es la estimación de pose?

Antes de sumergirnos en cómo utilizar el nuevo modeloYOLO11 de Ultralytics para la estimación de la pose, vamos a comprender mejor la estimación de la pose.

La estimación de la pose es una técnica de visión por ordenador utilizada para analizar la pose de una persona u objeto en una imagen o vídeo. Los modelos de aprendizaje profundo como YOLO11 pueden identificar, localizar y track puntos clave en un objeto o persona determinados. En el caso de los objetos, estos puntos clave pueden incluir esquinas, bordes o marcas superficiales distintivas, mientras que en el caso de los humanos, estos puntos clave representan articulaciones importantes como el codo, la rodilla o el hombro. 

La estimación de la pose es única y más compleja en comparación con otras tareas de visión artificial como la detección de objetos. Mientras que la detección de objetos localiza objetos en una imagen dibujando un cuadro alrededor de ellos, la estimación de la pose va más allá al predecir las posiciones exactas de los puntos clave en el objeto.

__wf_reserved_inherit
Fig. 2. Uso de YOLO11 para detect y estimar las poses de las personas en una oficina.

Cuando se trata de la estimación de la pose, hay dos formas principales en que funciona: de abajo arriba y de arriba abajo. El enfoque de abajo arriba detecta puntos clave individuales y los agrupa en esqueletos, mientras que el enfoque de arriba abajo se centra primero en detectar objetos y luego en estimar los puntos clave dentro de ellos. 

YOLO11 combina las ventajas de los métodos descendente y ascendente. Al igual que el método ascendente, mantiene las cosas sencillas y rápidas sin necesidad de agrupar manualmente los puntos clave. Al mismo tiempo, aprovecha la precisión del método descendente al detectar a las personas y estimar sus poses en un solo paso.

Casos prácticos de estimación de poses para YOLO11 

Las versátiles capacidades de YOLO11 para la estimación de la pose abren un amplio abanico de posibles aplicaciones en muchos sectores. Veamos con más detalle algunos casos de uso de YOLO11 para la estimación de poses.

Estimación de la postura en tiempo real con YOLO11: mejora de la seguridad de los trabajadores

La seguridad es un aspecto importante de cualquier proyecto de construcción. Esto es especialmente cierto, ya que, estadísticamente, las obras de construcción registran un mayor número de lesiones relacionadas con el trabajo. En 2021, alrededor del 20% de todas las lesiones mortales relacionadas con el trabajo ocurrieron en o cerca de obras de construcción. Con riesgos diarios como equipo pesado y sistemas eléctricos, es esencial contar con medidas de seguridad sólidas para mantener a los trabajadores seguros. Los métodos tradicionales, como el uso de señales, barricadas y la supervisión manual por parte de los supervisores, no siempre son eficaces y, a menudo, alejan a los supervisores de tareas más críticas.

La IA puede intervenir para mejorar la seguridad, y el riesgo de accidentes puede reducirse utilizando un sistema de seguimiento de los trabajadores basado en la estimación de posturas. Los modelosYOLO11 Ultralytics pueden utilizarse para track los movimientos y posturas de los trabajadores. De este modo, se puede detectar rápidamente cualquier peligro potencial, como trabajadores que se sitúan demasiado cerca de equipos peligrosos o que realizan tareas de forma incorrecta. Si se detecta un riesgo, se puede avisar a los supervisores, o una alarma puede alertar al trabajador. Un sistema de supervisión continua puede hacer que las obras sean más seguras, al estar siempre atento a los peligros y proteger a los trabajadores

__wf_reserved_inherit
Fig. 3. Ejemplo de estimación de la pose en una obra utilizando YOLO11.

Estimación de la pose con YOLO11 para la vigilancia del ganado

Los ganaderos y los investigadores pueden utilizar YOLO11 para estudiar el movimiento y el comportamiento de los animales de granja, como el ganado vacuno, para detect signos precoces de enfermedades como la cojera. La cojera es una afección por la que un animal tiene dificultades para moverse correctamente debido a dolores en las patas o pies. En el ganado vacuno, enfermedades como la cojera no sólo afectan a su salud y bienestar, sino que también provocan problemas de producción en las explotaciones lecheras. Los estudios muestran que la cojera afecta a entre el 8% del ganado en sistemas basados en pastos y entre el 15% y el 30% en sistemas confinados en toda la industria láctea mundial. La detección y el tratamiento precoz de las cojeras pueden contribuir a mejorar el bienestar de los animales y a reducir las pérdidas de producción asociadas a esta enfermedad.

Las funciones de estimación de la postura de YOLO11pueden ayudar a los ganaderos a track los patrones de marcha del animal e identificar rápidamente cualquier anomalía que pueda indicar problemas de salud, como problemas articulares o infecciones. La detección precoz de estos problemas permite un tratamiento más rápido, reduciendo las molestias de los animales y ayudando a los ganaderos a evitar pérdidas económicas.

Los sistemas de monitorización habilitados con IA de visión también pueden ayudar a analizar el comportamiento de descanso, las interacciones sociales y los patrones de alimentación. Los agricultores también pueden utilizar la estimación de la pose para obtener observaciones sobre signos de estrés o agresión. Estos conocimientos se pueden utilizar para cultivar mejores condiciones de vida para los animales y aumentar su bienestar.

__wf_reserved_inherit
Fig 4. Una visualización de la estimación de la pose de una vaca.

Casos de uso de YOLO11 en la industria del fitness

La estimación de posturas también puede ayudar a las personas a mejorar su postura en tiempo real mientras hacen ejercicio. Con YOLO11, los instructores de gimnasia y yoga pueden monitorizar y track los movimientos corporales de las personas que hacen ejercicio, centrándose en puntos clave como las articulaciones y las extremidades para evaluar su postura. Los datos recogidos pueden compararse con las posturas y técnicas de entrenamiento ideales, y los instructores pueden recibir alertas si alguien realiza un movimiento de forma incorrecta, lo que ayuda a prevenir lesiones.

__wf_reserved_inherit
Fig 5. Uso de la estimación de pose para analizar un entrenamiento.

Por ejemplo, durante una clase de yoga, la estimación de la pose puede ayudar a controlar si todos los estudiantes mantienen el equilibrio y la alineación adecuados. Las aplicaciones móviles integradas con visión artificial y estimación de la pose pueden hacer que el fitness sea más accesible para las personas que hacen ejercicio en casa o para aquellas que no tienen acceso a entrenadores personales. Esta retroalimentación continua en tiempo real ayuda a los usuarios a mejorar su técnica y alcanzar sus objetivos de fitness al tiempo que reduce el riesgo de lesiones.

Probando la estimación de la pose en tiempo real con el modelo YOLO11

Ahora que hemos explorado qué es la estimación de la pose y discutido algunas de sus aplicaciones. Veamos cómo probar la estimación de la pose con el nuevo modelo YOLO11 . Para empezar, hay dos formas de hacerlo: utilizando el paquetePython Ultralytics o a través de Ultralytics HUB. Veamos ambas opciones.

Ejecutar inferencias con YOLO11

Ejecutar una inferencia implica que el modelo YOLO11 procese nuevos datos fuera de sus conjuntos de entrenamiento y utilice los patrones que aprendió para hacer predicciones basadas en esos datos. Puede ejecutar inferencias mediante código con el paquete Ultralytics Python . Todo lo que necesitas hacer para empezar es instalar el paquete Ultralytics usando pip, conda o Docker. Si se enfrenta a algún problema durante la instalación, nuestra Guía de problemas comunes ofrece consejos útiles para la solución de problemas. 

Una vez que haya instalado el paquete correctamente, el siguiente código describe cómo cargar un modelo y utilizarlo para predecir las poses de los objetos en una imagen.

__wf_reserved_inherit
Fig. 6. Fragmento de código que muestra la ejecución de inferencias con YOLO11.

Entrenamiento de un modelo YOLO11 personalizado

Digamos que estás trabajando en un proyecto de visión por ordenador y tienes un conjunto de datos específico para una aplicación concreta que implica la estimación de la pose. Entonces puedes ajustar y entrenar un modelo YOLO11 personalizado para adaptarlo a tu aplicación. Por ejemplo, puedes utilizar un conjunto de datos de puntos clave para analizar y comprender la pose de un tigre en imágenes identificando características clave como la posición de sus extremidades, cabeza y cola.

Puede utilizar el siguiente fragmento de código para cargar y entrenar un modelo de estimación de pose YOLO11 . El modelo puede construirse a partir de una configuración YAML, o puede cargar un modelo preentrenado para el entrenamiento. Este script también le permite transferir pesos y comenzar a entrenar el modelo utilizando un conjunto de datos especificado, como el conjunto de datosCOCO para la estimación de la pose.

__wf_reserved_inherit
Fig 7. Entrenamiento personalizado YOLO11.

Usando el modelo personalizado recién entrenado, puedes ejecutar inferencias en imágenes no vistas relacionadas con tu solución de visión artificial. El modelo entrenado también se puede convertir a otros formatos utilizando el modo de exportación.

Pruebe YOLO11 en Ultralytics HUB

Hasta ahora, hemos visto métodos para utilizar YOLO11 que requieren algunos conocimientos básicos de codificación. Si eso no es lo que estás buscando, o no estás familiarizado con la codificación, hay otra opción: Ultralytics HUB. Ultralytics HUB es una plataforma fácil de usar diseñada para simplificar el proceso de formación y despliegue de modelos YOLO . HUB le permite gestionar fácilmente conjuntos de datos, entrenar modelos y desplegarlos sin necesidad de conocimientos técnicos.

Para realizar inferencias sobre imágenes, puede crear una cuenta, navegar hasta la sección "Modelos" y elegir el modelo de estimación de la pose YOLO11 que le interese. En la sección de vista previa, puede cargar una imagen y ver los resultados de la predicción, como se muestra a continuación. 

__wf_reserved_inherit
Fig. 8. Estimación de la pose en Ultralytics HUB con YOLO11.

Avances de YOLO11 en la detección de la pose humana

Ultralytics YOLO11 ofrece soluciones precisas y flexibles para tareas como la estimación de la postura en una amplia gama de aplicaciones. Desde mejorar la seguridad de los trabajadores en las obras de construcción hasta controlar la salud del ganado y ayudar a corregir la postura en rutinas de fitness, YOLO11 aporta precisión e información en tiempo real gracias a su avanzada tecnología de visión por ordenador. 

Su versatilidad, con múltiples variantes de modelos y la posibilidad de realizar entrenamientos personalizados para casos de uso específicos, la convierten en una herramienta muy valiosa tanto para desarrolladores como para empresas. Ya sea mediante la codificación con el paquetePython Ultralytics o utilizando el HUB de Ultralytics para una implementación más sencilla, YOLO11 hace que la estimación de la pose sea accesible e impactante.

Para explorar más, visite nuestro repositorio de GitHub e interactúe con nuestra comunidad. Explore las aplicaciones de IA en fabricación y agricultura en nuestras páginas de soluciones. 🚀

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis