Al hacer clic en "Aceptar todas las cookies", usted acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación por el sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información en
Configuración de cookies
Al hacer clic en "Aceptar todas las cookies", usted acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación por el sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información en
Descubra cómo el cálculo de distancias en aplicaciones de visión por ordenador mediante Ultralytics YOLO11 ayuda a medir la proximidad de los objetos en tiempo real.
Cuando cruzas la calle y ves que se acerca un coche, sabes al instante a qué distancia está. Este juicio rápido, casi instintivo, se debe a la comprensión espacial del entorno. A partir de esta percepción, puedes decidir si aceleras, te detienes o sigues andando.
Del mismo modo, la visión por ordenador es una rama de la inteligencia artificial (IA) que hace posible que las máquinas desarrollen una comprensión de su entorno mediante la interpretación de datos visuales. Al igual que se puede evaluar la proximidad de un coche para tomar decisiones rápidas, los modelos de visión por ordenador pueden analizar imágenes y vídeos, ayudando a las máquinas a percibir el mundo que las rodea y reaccionar ante él.
Por ejemplo, Ultralytics YOLO11 es un modelo de visión por ordenador capaz de detectar y rastrear objetos en imágenes y vídeos en tiempo real. En pocas palabras, YOLO11 trabaja mirando toda la imagen a la vez, en lugar de por partes, lo que lo hace más rápido y eficaz. También puede realizar tareas de visión por ordenador como la segmentación de instancias, la estimación de poses y la clasificación de imágenes.
En concreto, las capacidades de YOLO11 pueden utilizarse para calcular la distancia que separa unos objetos de otros, lo que resulta útil en muchas áreas como la fabricación, el comercio minorista y la gestión de multitudes, ayudando a mejorar la seguridad y la eficiencia.
En este artículo analizaremos cómo puede utilizarse YOLO11 para el cálculo de distancias en aplicaciones de visión por ordenador, por qué es importante y su repercusión en distintos sectores.
Fig. 1. Ejemplo de utilización de YOLO para calcular la distancia de aterrizaje de un avión.
Visión general del cálculo de distancias en visión por ordenador
El cálculo de distancias en visión por ordenador implica detectar, localizar y medir los píxeles entre dos objetos en una imagen. Los píxeles son las unidades individuales que componen una imagen digital, cada una de las cuales representa un único punto con un color o un valor de intensidad específicos.
Para convertir las medidas de los píxeles en distancias del mundo real, la calibración es clave. Es como utilizar una regla para medir algo y luego usar esa medida para entender el tamaño de otros objetos. Al hacer referencia a objetos con tamaños conocidos, la calibración crea un vínculo entre los píxeles y las distancias físicas reales.
Veamos un ejemplo. En la imagen siguiente, la moneda es el objeto de referencia y conocemos su tamaño (0,9 x 1,0 pulgadas). Comparando las medidas en píxeles de los demás objetos con el tamaño de la moneda, podemos calcular su tamaño en el mundo real.
Fig. 2. Una moneda puede utilizarse como referencia para medir el tamaño real de otros objetos.
Sin embargo, el cálculo de la distancia se realiza en un plano bidimensional (2D), lo que significa que sólo mide las distancias horizontal y vertical entre los objetos. Esto es diferente de la estimación de la profundidad, que mide la distancia de los objetos en el espacio tridimensional, incluida su distancia a la cámara.
Aunque las cámaras de profundidad pueden medir la profundidad real y ofrecer información espacial más detallada, en muchos casos basta con una simple distancia calibrada. Por ejemplo, saber a qué distancia se encuentran los objetos en un plano 2D funciona bien para tareas como el seguimiento de objetos o la gestión de colas, por lo que la estimación de la profundidad no es necesaria en esas situaciones.
Cómo funciona el cálculo de distancias con YOLO11
A continuación, vamos a ver cómo calcular la distancia entre dos objetos utilizando el soporte de YOLO11 para la detección y seguimiento de objetos. He aquí un desglose:
Detección y seguimiento de objetos: YOLO11 puede utilizarse para detectar objetos reconociéndolos en un fotograma y siguiendo su movimiento a través de los fotogramas de un vídeo. Asigna un ID de seguimiento único a cada objeto, lo que permite al sistema controlar su posición y movimiento a lo largo del vídeo.
Cuadros delimitadores: Se dibujan cuadros delimitadores alrededor de los objetos detectados basándose en los resultados de detección de objetos de YOLO11, que definen su ubicación en la imagen.
Selección de objetos: Se pueden seleccionar dos objetos para enfocarlos, y YOLO11 actualiza los cuadros delimitadores a medida que los objetos se mueven en tiempo real.
Cálculo del centroide: Los centroides (los puntos centrales de las cajas delimitadoras de los dos objetos) se calculan a partir de las coordenadas de las esquinas de las cajas delimitadoras, que representan las posiciones de los objetos.
Cálculo de la distancia: Los centroides de los dos objetos pueden utilizarse para calcular la distancia euclídea entre ellos. La distancia euclídea es la distancia en línea recta entre dos puntos en un plano 2D, calculada utilizando las diferencias en las direcciones horizontal y vertical. Así se obtiene la distancia entre los dos objetos en píxeles.
Es importante tener en cuenta que las distancias calculadas con este método son sólo estimaciones, ya que se basan en mediciones de píxeles en 2D.
Fig. 3. Uso de Ultralytics YOLO para detectar a una persona y calcular distancias.
El impacto de la estimación de la distancia YOLO
Teniendo en cuenta que el cálculo de distancias con YOLO11 es una estimación, te estarás preguntando: ¿Dónde puede utilizarse y cómo puede marcar la diferencia?
Dado que se utilizan calibraciones para llegar a estas estimaciones de distancia, son lo suficientemente precisas como para ayudar en muchas situaciones prácticas. La estimación de distancias de YOLO11 es especialmente útil en entornos dinámicos, como almacenes, donde los objetos están en constante movimiento y es necesario realizar ajustes en tiempo real para que todo funcione correctamente.
Un ejemplo interesante es el uso de YOLO11 para hacer un seguimiento de los paquetes en una cinta transportadora y estimar la distancia entre ellos en tiempo real. Esto ayuda a los jefes de almacén a asegurarse de que los paquetes están espaciados correctamente, evitando colisiones y manteniendo las cosas funcionando sin problemas.
En estos casos, no siempre es necesaria una distancia exacta. Normalmente, se establece un rango o umbral para la distancia óptima, por lo que una estimación funciona bien para este tipo de aplicaciones.
Fig. 4. Detección de paquetes mediante YOLO11 y cálculo de la distancia entre ellos.
Cálculo de distancias en aplicaciones de visión por ordenador
Diversas aplicaciones de visión por ordenador pueden beneficiarse del cálculo de la distancia entre objetos mediante YOLO11. En el análisis de comercios, por ejemplo, ayuda a mejorar la gestión de colas mediante el seguimiento de las posiciones de los clientes en tiempo real. Esto permite a las empresas asignar mejor los recursos, reducir los tiempos de espera y crear una experiencia de compra más fluida. Ajustando dinámicamente los niveles de personal y gestionando el flujo de clientes, las tiendas pueden evitar el hacinamiento y optimizar el uso del espacio.
Del mismo modo, en la gestión del tráfico, la estimación de la distancia ayuda a controlar el espacio entre vehículos y analizar los patrones de tráfico. Esto puede utilizarse para detectar comportamientos peligrosos, como ir a rebufo de otros vehículos, y ajustar los semáforos para que el tráfico fluya sin problemas. Puede contribuir a que las carreteras sean más seguras identificando posibles problemas y mejorando la gestión general del tráfico en tiempo real.
Fig. 5. El cálculo de distancias mediante visión puede utilizarse para vigilar el tráfico.
Otro uso único de esta tecnología se produjo durante la pandemia de COVID-19, cuando ayudó a promover el distanciamiento social. Se aseguró de que la gente mantuviera una distancia segura en espacios públicos, tiendas y hospitales, reduciendo el riesgo de propagación del virus.
Gracias al seguimiento de las distancias en tiempo real, se podían enviar alertas cuando las personas estaban demasiado cerca, lo que facilitaba a las empresas y los proveedores de atención sanitaria responder con rapidez y mantener un entorno más seguro para todos.
Ventajas e inconvenientes del cálculo de distancias en visión por ordenador
Ahora que ya hemos hablado de algunas de las aplicaciones del cálculo de distancias mediante visión por ordenador, vamos a ver más de cerca las ventajas que conlleva:
Automatización: Vision AI puede automatizar las tareas de cálculo de distancias que, de otro modo, requerirían un seguimiento manual, lo que reduce los errores humanos y los costes laborales al tiempo que aumenta la productividad.
Optimización de recursos: Al conocer el espaciado aproximado y la proximidad de los objetos, se pueden optimizar los recursos (como el personal o la maquinaria), lo que reduce el despilfarro y mejora los flujos de trabajo.
Mínima complejidad de configuración: Una vez configurados, los sistemas de cálculo de distancias por visión requieren relativamente poco mantenimiento y menos intervención humana en comparación con otros sistemas que dependen de la introducción manual de datos o de maquinaria compleja.
A pesar de estas ventajas, también hay que tener en cuenta algunas limitaciones a la hora de implantar estos sistemas. A continuación, le ofrecemos un breve resumen de los factores clave que debe tener en cuenta a la hora de calcular distancias mediante visión por ordenador:
Sensibilidad a los factores ambientales: La precisión del cálculo de la distancia puede verse afectada por las condiciones de iluminación, las sombras, los reflejos o los obstáculos, lo que puede dar lugar a errores o incoherencias.
Privacidad: El uso de la visión por ordenador para rastrear objetos o personas puede plantear problemas de privacidad, especialmente en espacios públicos o entornos sensibles en los que puedan estar implicados datos personales.
Complejidad en escenarios multiobjeto: En entornos con numerosos objetos en movimiento, calcular con precisión las distancias entre varios objetos simultáneamente puede llevar a confusión, sobre todo si están próximos o se cruzan.
Principales conclusiones
Calcular la distancia entre objetos con YOLO11 es una solución fiable que puede ayudar en la toma de decisiones. Resulta especialmente útil en entornos dinámicos como almacenes, comercios minoristas y gestión del tráfico, donde el seguimiento de la proximidad de los objetos puede mejorar la eficiencia y la seguridad.
YOLO11 permite automatizar tareas que normalmente requerirían un esfuerzo manual. Aunque existen algunos retos, como la sensibilidad a los factores ambientales y los problemas de privacidad, las ventajas, como la automatización, la escalabilidad y la facilidad de integración, lo hacen impactante. A medida que la visión por ordenador siga mejorando, especialmente en áreas como el cálculo de distancias, es probable que asistamos a un verdadero cambio en la forma en que las máquinas interactúan con su entorno y lo comprenden.