Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Guías

¿Qué es OpenPose? Explorando un hito en la estimación de poses

Explora cómo se puede utilizar OpenPose para la estimación de poses en aplicaciones de visión artificial. Aprende sobre sus características y su importancia en la IA de visión.

ABAbirami Vina
5 min read
Estimación de poses de varias personas usando OpenPose

Hoy en día, las imágenes y las cámaras están en todas partes: integradas en nuestros teléfonos, hogares e incluso espacios públicos. Confiamos en ellas no solo para capturar momentos, sino para ayudarnos a entender e interactuar con el mundo que nos rodea.

Entre bastidores, la visión artificial, un subcampo de la inteligencia artificial (IA), lo hace posible permitiendo que las máquinas interpreten datos visuales. Esto permite a los sistemas detectar objetos, reconocer rostros y seguir movimientos, desempeñando un papel clave en muchas de las tecnologías que usamos a diario.

Gracias a los recientes avances en IA, los modelos de visión artificial ahora pueden analizar y extraer datos e información más complejos. Un ejemplo de esto es la estimación de poses, una tarea de visión artificial centrada en entender el movimiento humano.

Funciona identificando puntos clave en el cuerpo, como hombros, codos y rodillas, en imágenes o vídeos. Esto hace posible analizar cómo se mueven las personas, permitiendo aplicaciones en seguimiento de fitness, animación, atención sanitaria y más.

Entre las muchas herramientas desarrolladas para la estimación de poses, OpenPose destaca como un avance importante. Creado por investigadores del Perceptual Computing Lab de la Carnegie Mellon University, fue uno de los primeros sistemas de código abierto capaz de detectar poses de cuerpo completo, incluyendo manos, pies y puntos clave faciales, para múltiples personas en tiempo real usando solo una cámara (con hasta 135 puntos clave por persona).

En este artículo, exploraremos OpenPose, cómo funciona y su importancia como hito en la visión artificial.

Estimación de poses de varias personas usando OpenPose

Fig 1. Estimación de poses de varias personas usando OpenPose.

Link to this sectionUna mirada a la historia de la estimación de poses#

Antes de que la IA fuera adoptada ampliamente, el seguimiento del movimiento humano en vídeos implicaba el uso de equipos especializados. En sectores como el cine y la animación, los actores solían llevar trajes con marcadores reflectantes para que las cámaras pudieran capturar sus movimientos en un entorno de estudio controlado.

Aunque estas técnicas de captura de movimiento basadas en marcadores eran precisas, también eran costosas y limitadas a configuraciones específicas. A medida que avanzó la visión artificial, los investigadores buscaron formas de seguir el movimiento corporal sin usar marcadores. Utilizaron bordes, contornos y plantillas para encontrar formas humanas en imágenes.

Estos primeros sistemas funcionaban en casos simples y directos, pero tenían dificultades con escenarios del mundo real. A menudo daban resultados pobres cuando las personas se movían de formas inesperadas o cuando aparecía más de una persona en un cuadro.

A finales de la década de 2010, el aprendizaje profundo trajo un cambio importante a la estimación de poses. Los modelos de visión por IA podían entrenarse con grandes conjuntos de datos de poses humanas. En lugar de depender de bordes y plantillas, los modelos aprendieron a reconocer articulaciones y estructuras corporales estudiando miles de imágenes etiquetadas. Esto hizo que la estimación de poses fuera más precisa, flexible y eficaz en una gama más amplia de entornos.

Cronología de modelos de estimación de poses humanas de 2017 a 2023

Fig 2. La evolución de los modelos de estimación de poses humanas de 2017 a 2023.

Link to this sectionOpenPose: donde despegó la estimación de poses moderna#

OpenPose se lanzó por primera vez en 2017 y es capaz de estimar las poses de varias personas simultáneamente en una sola imagen. A diferencia de los sistemas antiguos, OpenPose no requiere trajes ni marcadores especiales. Funciona con cámaras estándar y puede procesar imágenes y vídeos en tiempo real. Estas características hicieron que la estimación de poses fuera más accesible para desarrolladores e investigadores.

La base que sentó OpenPose para la visión artificial ayudó a otros a construir arquitecturas más nuevas para una variedad de otras aplicaciones. Hoy en día, los modelos de IA de visión como Ultralytics YOLOv8 y Ultralytics YOLO11, que soportan tareas de estimación de poses, ofrecen resultados más rápidos y menor latencia.

Uso de Ultralytics YOLO11 para estimación de poses

Fig 3. Uso de YOLO11 para la estimación de poses.

Sin embargo, OpenPose es un gran lugar por donde empezar si tienes curiosidad sobre cómo ha evolucionado la estimación de poses. Introdujo ideas clave de las que muchos sistemas más nuevos siguen dependiendo hoy en día.

Link to this sectionCapacidades clave de OpenPose#

Ahora que entendemos mejor por qué OpenPose es importante, echemos un vistazo más de cerca a lo que realmente puede hacer.

En el corazón de las capacidades de OpenPose hay algo llamado detección de puntos clave. Los puntos clave son puntos de referencia específicos en el cuerpo humano, como la punta de la nariz, el centro de los hombros, los codos, las muñecas, las caderas, las rodillas y los tobillos. OpenPose puede detectar hasta 135 de estos puntos por persona, incluyendo áreas detalladas como los dedos y los rasgos faciales.

Cuando estos puntos se conectan, forman una representación simplificada del cuerpo humano; puedes pensarlo como un esqueleto digital. Este esquema esquelético muestra no solo dónde está una persona, sino cómo está posada: si está sentada, de pie, saludando, sonriendo o caminando. Las computadoras pueden interpretar el movimiento humano visualmente usando estos esqueletos, de forma muy parecida a como entendemos instintivamente el lenguaje corporal de alguien.

El seguimiento esquelético es especialmente útil porque elimina el ruido de fondo y las distracciones, permitiendo que el sistema se centre puramente en la postura y el movimiento humanos. En lugar de analizar cada píxel, OpenPose se concentra en puntos significativos que cuentan la historia de cómo una persona se está moviendo o interactuando.

Al extraer esta información estructurada de imágenes o vídeos cotidianos, OpenPose hace posible construir aplicaciones que responden a gestos, monitorizan la actividad física, evalúan señales emocionales o incluso animan personajes digitales.

Link to this section¿Cómo funciona OpenPose?#

Aquí tienes una visión general de cómo OpenPose detecta y conecta puntos clave en el cuerpo humano a partir de información visual:

  • Comienza con una imagen: OpenPose toma una sola imagen de una foto, un vídeo o una transmisión de cámara en directo.
  • Localiza partes importantes del cuerpo: El sistema busca puntos clave en el cuerpo, como la nariz, los codos, las muñecas, las rodillas y los tobillos. Se marcan dondequiera que el sistema tenga la seguridad de que se encuentra una parte del cuerpo.
  • Determina qué partes van juntas: A continuación, OpenPose comprueba cómo se conectan los puntos clave. Utiliza cálculos matemáticos para decidir qué articulaciones pertenecen a la misma persona; por ejemplo, emparejando una muñeca con el codo y el hombro derechos.
  • Dibuja un esqueleto para cada persona: Después de agrupar los puntos clave, OpenPose los conecta en una "figura de palitos" que muestra la pose de cada persona. Esto funciona incluso cuando aparecen varias personas en el mismo cuadro.
  • Devuelve los datos de la pose: Finalmente, proporciona las posiciones exactas de todos los puntos clave detectados. Estos se pueden utilizar para el seguimiento del movimiento, el reconocimiento de gestos o la construcción de herramientas interactivas, todo en tiempo real.

Detección y seguimiento de puntos clave humanos usando OpenPose

Fig 4. Detección y seguimiento de puntos clave humanos usando OpenPose.

Link to this sectionAplicaciones de estimación de poses en todas las industrias usando OpenPose#

OpenPose fue una de las primeras herramientas avanzadas que hizo que la estimación de poses fuera práctica para una variedad de casos de uso en el mundo real. Aunque no se usa comúnmente en soluciones de visión artificial en tiempo real hoy en día, desempeñó un papel importante en la configuración del trabajo inicial en campos como el deporte, el entretenimiento, la educación y la seguridad.

Echemos un vistazo más de cerca a cómo ayudó a allanar el camino en estas áreas.

Link to this sectionEstimación de poses con OpenPose para fitness y deportes#

Cuando ves béisbol, es fácil entender lo que está pasando; puedes reconocer al instante un lanzamiento, un swing o un robo de base. Como humanos, leemos intuitivamente los movimientos corporales y les damos sentido sin mucho esfuerzo. Pero para las máquinas, reconocer estas acciones es mucho más complejo. Necesitan información precisa sobre cómo cada parte del cuerpo se mueve a través del espacio.

OpenPose fue un paso adelante sustancial en esta área de la visión artificial. Fue una herramienta práctica para analizar la forma atlética en una variedad de entornos.

Muchos proyectos de investigación utilizaron OpenPose para desglosar movimientos como swings y saltos, clasificando incluso acciones específicas de béisbol basadas en cómo se movían los jugadores. Debido a que funcionaba en entornos abiertos con vídeo estándar, permitió a los investigadores probar cómo podrían funcionar tales sistemas en escenarios de entrenamiento o coaching del mundo real.

Estos primeros estudios ayudaron a sentar las bases de las herramientas de seguimiento del rendimiento que ahora se utilizan en la avanzada tecnología deportiva.

Pipeline de clasificación de acciones de béisbol usando OpenPose

Fig 5. Una mirada a un pipeline de clasificación de acciones de béisbol usando OpenPose.

Link to this sectionUso de OpenPose en sistemas de seguridad y protección#

Del mismo modo, los investigadores también utilizaron OpenPose para explorar cómo el seguimiento de poses basado en vídeo podría apoyar la monitorización de la seguridad. Se probó en la detección de comportamientos como caídas, gestos inesperados o patrones de movimiento en áreas públicas.

Debido a que funcionaba con cámaras estándar, OpenPose hizo que la experimentación temprana fuera más accesible en entornos como hospitales y centros de transporte. Estos estudios ayudaron a impulsar el desarrollo de modelos más nuevos que ahora se utilizan en vigilancia, detección de caídas y sistemas de respuesta a emergencias.

Detección de caídas habilitada por OpenPose

Fig 6. Detección de caídas habilitada por OpenPose.

Link to this sectionVentajas e inconvenientes de OpenPose#

Aquí tienes un vistazo a algunas de las ventajas que ofrece OpenPose:

  • Útil para investigación y creación de prototipos: Ha sido ampliamente utilizado en investigación académica, especialmente en campos como la interacción humano-computadora, la biomecánica y el análisis del comportamiento.
  • Soporte multiplataforma: Puede ejecutarse en Windows, Linux y macOS, con soporte tanto para unidades centrales de procesamiento (CPUs) como para unidades de procesamiento gráfico (GPUs).
  • Capacidad de procesamiento sin conexión: Puede funcionar en entornos sin acceso a Internet, lo que lo hace ideal para entornos sensibles a la privacidad como la atención sanitaria o la educación.

Aunque OpenPose fue un gran paso adelante, también tiene limitaciones técnicas que es importante tener en cuenta. Aquí tienes algunos de los desafíos clave asociados con OpenPose:

  • Altos requisitos de procesamiento: Ejecutar OpenPose en tiempo real requiere una GPU potente y recursos informáticos significativos.
  • Sensible al entorno: El rendimiento puede disminuir con poca luz, en espacios concurridos o cuando los ángulos de la cámara no son ideales.
  • Pesado en comparación con modelos más nuevos: En comparación con los modelos de estimación de poses más nuevos, OpenPose es relativamente grande y más lento. No es adecuado para su despliegue en dispositivos con recursos limitados como teléfonos inteligentes, tabletas o sistemas integrados.

Link to this sectionConclusiones clave#

OpenPose desempeñó un papel importante en hacer que la estimación de poses fuera más accesible. Demostró que el seguimiento de los movimientos corporales podía realizarse con una cámara sencilla, sin depender de trajes o equipos especializados.

Sentó las bases para muchas aplicaciones prácticas en la atención sanitaria, la educación, el entretenimiento y la investigación. Aunque los modelos más nuevos ofrecen ahora velocidades más rápidas y un rendimiento más ligero, OpenPose sigue siendo un punto de referencia clave para entender cómo ha evolucionado la estimación de poses.

Únete a nuestra comunidad y visita nuestro repositorio en GitHub para aprender más sobre IA. Si buscas construir tus propias soluciones de visión artificial, explora nuestras opciones de licencia. Además, ¡descubre cómo la visión artificial en la atención sanitaria y la IA en la logística están marcando la diferencia!

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático