Yolo Vision Shenzhen
Shenzhen
Únete ahora

Integración de la visión por ordenador en la robótica con Ultralytics YOLO11

Abirami Vina

5 minutos de lectura

18 de marzo de 2025

Descubra cómo los modelos de visión por ordenador como Ultralytics YOLO11 hacen que los robots sean más inteligentes y dan forma al futuro de la robótica.

Los robots han recorrido un largo camino desde Unimate, el primer robot industrial, que se inventó en la década de 1950. Lo que comenzó como máquinas preprogramadas basadas en reglas ahora ha avanzado a sistemas inteligentes capaces de realizar tareas complejas e interactuar sin problemas con el mundo real. 

Hoy en día, los robots se utilizan en diversas industrias, desde la manufactura y la atención médica hasta la agricultura, para diversas automatizaciones de procesos. Un factor clave en la evolución de la robótica es la IA y la visión artificial, una rama de la IA que ayuda a las máquinas a comprender e interpretar la información visual.

Por ejemplo, modelos de visión por ordenador como Ultralytics YOLO11 están mejorando la inteligencia de los sistemas robóticos. Cuando se integra en estos sistemas, Vision AI permite a los robots reconocer objetos, navegar por entornos y tomar decisiones en tiempo real.

En este artículo veremos cómo YOLO11 puede mejorar los robots con funciones avanzadas de visión por ordenador y exploraremos sus aplicaciones en diversos sectores.

Una visión general de la IA y la visión artificial en la robótica

La funcionalidad principal de un robot depende de lo bien que comprenda su entorno. Esta percepción conecta su hardware físico con la toma de decisiones inteligente. Sin ella, los robots solo pueden seguir instrucciones fijas y tienen dificultades para adaptarse a entornos cambiantes o manejar tareas complejas. Al igual que los humanos dependemos de la vista para navegar, los robots utilizan la visión artificial para interpretar su entorno, comprender la situación y tomar las medidas adecuadas.

Fig. 1. Un robot jugando al tres en raya usando visión artificial para interpretar el tablero y hacer movimientos estratégicos.

De hecho, la visión por ordenador es fundamental para la mayoría de las tareas robóticas. Ayuda a los robots a detect objetos y evitar obstáculos mientras se desplazan. Sin embargo, para ello no basta con ver el mundo; los robots también tienen que ser capaces de reaccionar con rapidez. En situaciones reales, incluso un ligero retraso puede provocar costosos errores. Modelos como Ultralytics YOLO11 permiten a los robots obtener información en tiempo real y responder al instante, incluso en situaciones complejas o desconocidas.

Conocer Ultralytics YOLO11

Antes de adentrarnos en el modo en que YOLO11puede integrarse en los sistemas robóticos, exploremos primero las principales características de YOLO11.

Los modelosYOLO Ultralytics admiten varias tareas de visión por ordenador que ayudan a obtener información rápida y en tiempo real. En concreto, Ultralytics YOLO11 ofrece un rendimiento más rápido, menores costes computacionales y una mayor precisión. Por ejemplo, puede utilizarse para detect objetos en imágenes y vídeos con gran precisión, lo que lo hace perfecto para aplicaciones en campos como la robótica, la sanidad y la fabricación. 

He aquí algunas características impactantes que hacen de YOLO11 una gran opción para la robótica:

  • Facilidad de implementación: Es fácil de implementar y se integra perfectamente en una amplia gama de plataformas de software y hardware.
  • Adaptabilidad: YOLO11 funciona bien en diferentes entornos y configuraciones de hardware, ofreciendo un rendimiento constante incluso en condiciones dinámicas.

Fácil de usar: la documentación y la interfaz de fácil comprensión deYOLO11ayudan a reducir la curva de aprendizaje, lo que facilita su integración en sistemas robotizados.

Fig. 2. Ejemplo de análisis de la pose de personas en una imagen mediante YOLO11.

Exploración de las tareas de visión por ordenador que permite YOLO11

A continuación te mostramos algunas de las tareas de visión por ordenador que admite YOLO11 : 

  • Detección de objetos: La capacidad de detección de objetos en tiempo real de YOLO11 permite a los robots identificar y localizar objetos dentro de su campo de visión al instante. Esto ayuda a los robots a evitar obstáculos, realizar una planificación dinámica de la trayectoria y lograr una navegación automatizada tanto en interiores como en exteriores.
  • Segmentación de instancias: Al identificar los límites y las formas exactas de los objetos individuales, YOLO11 equipa a los robots para realizar operaciones precisas de recogida y colocación y complejas tareas de ensamblaje.
  • Estimación de poses: El soporte de YOLO11para la estimación de poses permite a los robots reconocer e interpretar los movimientos y gestos del cuerpo humano. Es crucial para que los robots colaborativos (cobots) trabajen con seguridad junto a los humanos.
  • Seguimiento de objetos: YOLO11 permite track objetos en movimiento a lo largo del tiempo, lo que lo hace ideal para aplicaciones relacionadas con la robótica autónoma que necesitan vigilar su entorno en tiempo real.
  • Clasificación de imágenes: YOLO11 puede classify objetos en imágenes, lo que permite a los robots categorizar artículos, detect anomalías o tomar decisiones basadas en tipos de objetos, como la identificación de suministros médicos en entornos sanitarios.
Fig. 3. Tareas de visión por ordenador soportadas por YOLO11.

IA en aplicaciones robóticas: Desarrollado por YOLO11

Desde el aprendizaje inteligente hasta la automatización industrial, modelos como YOLO11 pueden ayudar a redefinir lo que pueden hacer los robots. Su integración en la robótica demuestra cómo los modelos de visión por ordenador están impulsando los avances en la automatización. Exploremos algunos ámbitos clave en los que YOLO11 puede tener un impacto significativo.

Enseñando a robots mediante visión artificial 

La visión por ordenador se utiliza mucho en los robots humanoides, ya que les permite aprender observando su entorno. Modelos como YOLO11 pueden ayudar a mejorar este proceso al proporcionar detección avanzada de objetos y estimación de poses, lo que ayuda a los robots a interpretar con precisión las acciones y comportamientos humanos.

Al analizar los movimientos e interacciones sutiles en tiempo real, se puede entrenar a los robots para que reproduzcan tareas humanas complejas. Esto les permite ir más allá de las rutinas preprogramadas y aprender tareas, como usar un mando a distancia o un destornillador, simplemente observando a una persona.

Fig. 4. Un robot que imita una acción humana.

Este tipo de aprendizaje puede ser útil en diferentes industrias. Por ejemplo, en la agricultura, los robots pueden observar a los trabajadores humanos aprender tareas como plantar, cosechar y gestionar cultivos. Al copiar cómo los humanos realizan estas tareas, los robots pueden adaptarse a diferentes condiciones agrícolas sin necesidad de ser programados para cada situación.

Aplicaciones relacionadas con la robótica en el sector salud

Del mismo modo, en la sanidad, la visión por ordenador es cada vez más importante. Por ejemplo, YOLO11 puede utilizarse en dispositivos médicos para ayudar a los cirujanos en procedimientos complejos. Con funciones como la detección de objetos y la segmentación de instancias, YOLO11 puede ayudar a los robots a detectar estructuras internas del cuerpo, manejar herramientas quirúrgicas y realizar movimientos precisos.

Aunque pueda parecer algo sacado de la ciencia ficción, investigaciones recientes demuestran la aplicación práctica de la visión por ordenador en procedimientos quirúrgicos. En un interesante estudio sobre disección robótica autónoma para colecistectomía (extirpación de la vesícula biliar), los investigadores integraron YOLO11 para la segmentación de tejidos (clasificación y separación de distintos tejidos en una imagen) y la detección de puntos clave de instrumentos quirúrgicos (identificación de puntos de referencia específicos en las herramientas). 

El sistema pudo distinguir con precisión entre diferentes tipos de tejido, incluso cuando los tejidos se deformaban (cambiaban de forma) durante el procedimiento, y se ajustó dinámicamente a estos cambios. Esto hizo posible que los instrumentos robóticos siguieran trayectorias precisas de disección (corte quirúrgico).

Fabricación inteligente y automatización industrial

Los robots que pueden recoger y colocar objetos están desempeñando un papel clave en la automatización de las operaciones de fabricación y la optimización de las cadenas de suministro. Su velocidad y precisión les permiten realizar tareas con una mínima intervención humana, como la identificación y clasificación de artículos. 

Gracias a la precisa segmentación de instancias de YOLO11, los brazos robóticos pueden entrenarse para detect y segment objetos que se mueven por una cinta transportadora, recogerlos con precisión y colocarlos en los lugares designados en función de su tipo y tamaño.

Por ejemplo, los fabricantes de automóviles más conocidos están utilizando robots basados en visión para ensamblar diferentes piezas de automóviles, mejorando la velocidad y la precisión de la cadena de montaje. Los modelos de visión artificial como YOLO11 pueden permitir que estos robots trabajen junto a trabajadores humanos, garantizando una integración perfecta de los sistemas automatizados en entornos de producción dinámicos. Este avance puede dar lugar a tiempos de producción más rápidos, menos errores y productos de mayor calidad.

Fig 5. Un brazo robótico basado en visión que ensambla un coche.

Ventajas de integrar Ultralytics YOLO11 en robótica

YOLO11 ofrece varias ventajas clave que lo hacen ideal para su perfecta integración en sistemas robóticos autónomos. Estas son algunas de las principales ventajas:

  • Bajo latencia de inferencia: YOLO11 puede ofrecer predicciones muy precisas con baja latencia, incluso en entornos dinámicos.
  • Modelos ligeros: Diseñados para optimizar el rendimiento, los modelos ligeros de YOLO11permiten a los robots más pequeños con menos potencia de procesamiento disponer de funciones de visión avanzadas sin sacrificar la eficacia.
  • Eficiencia energética: YOLO11 está diseñado para ahorrar energía, por lo que es ideal para robots alimentados por batería que necesitan conservar la energía mientras mantienen un alto rendimiento.

Limitaciones de la IA visual en robótica

Si bien los modelos de visión artificial proporcionan herramientas potentes para la visión robótica, existen algunas limitaciones que hay que tener en cuenta al integrarlos en sistemas robóticos del mundo real. Algunas de estas limitaciones son:

  • Recopilación de datos costosa: El entrenamiento de modelos eficaces para tareas específicas de robots a menudo requiere conjuntos de datos grandes, diversos y bien etiquetados, que son caros de adquirir.
  • Variaciones ambientales: Los robots trabajan en entornos impredecibles, donde factores como las condiciones de iluminación o los fondos desordenados pueden afectar el rendimiento de los modelos de visión.
  • Problemas de calibración y alineación: Asegurarse de que los sistemas de visión estén correctamente calibrados y alineados con los otros sensores del robot es vital para un rendimiento preciso, y la desalineación puede conducir a errores en la toma de decisiones.

El futuro de los avances en robótica e IA

Los sistemas de visión artificial no son solo herramientas para los robots de hoy en día; son los pilares de un futuro en el que los robots pueden funcionar de forma autónoma. Con sus capacidades de detección en tiempo real y su compatibilidad con múltiples tareas, son perfectos para la robótica de nueva generación.

De hecho, las tendencias actuales del mercado muestran que la visión artificial se está volviendo cada vez más esencial en la robótica. Los informes de la industria destacan que la visión artificial es la segunda tecnología más utilizada en el mercado mundial de la robótica con IA. 

Fig. 6. Cuota de mercado global de robots de IA por tecnología.

Conclusiones clave

Gracias a su capacidad para procesar datos visuales en tiempo real, YOLO11 puede ayudar a los robots a detect, identificar e interactuar con su entorno con mayor precisión. Esto supone una gran diferencia en campos como la fabricación, donde los robots pueden colaborar con los humanos, y la sanidad, donde pueden ayudar en cirugías complejas. 

A medida que la robótica continúa avanzando, la integración de la visión artificial en dichos sistemas será crucial para permitir que los robots manejen una amplia gama de tareas de manera más eficiente. El futuro de la robótica parece prometedor, con la IA y la visión artificial impulsando máquinas aún más inteligentes y adaptables.

Únase a nuestra comunidad y consulte nuestro repositorio de GitHub para obtener más información sobre los desarrollos recientes en IA. Explore varias aplicaciones de la IA en la atención médica y la visión artificial en la agricultura en nuestras páginas de soluciones. Consulte nuestros planes de licencia para construir sus propias soluciones de visión artificial.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis