Yolo Vision Shenzhen
Shenzhen
Únete ahora

¿Cómo calcular la distancia utilizando modelos de visión artificial?

Abirami Vina

4 minutos de lectura

3 de abril de 2025

Descubra cómo el cálculo de distancias en aplicaciones de visión por ordenador mediante Ultralytics YOLO11 ayuda a medir la proximidad de los objetos en tiempo real.

Cuando cruzas la calle y ves un coche que se acerca, puedes saber al instante aproximadamente a qué distancia está. Este juicio rápido, casi instintivo, es gracias a una comprensión espacial de tu entorno. Basándote en este sentido, puedes decidir si acelerar, detenerte o seguir caminando. 

De manera similar, la visión artificial es una rama de la inteligencia artificial (IA) que permite a las máquinas desarrollar una comprensión de su entorno interpretando datos visuales. Al igual que usted puede evaluar la proximidad de un coche para tomar decisiones rápidas, los modelos de visión artificial pueden analizar imágenes y vídeos, ayudando a las máquinas a sentir y reaccionar ante el mundo que les rodea.

Por ejemplo, Ultralytics YOLO11 es un modelo de visión por ordenador capaz de detect y track objetos en imágenes y vídeos en tiempo real. En pocas palabras, YOLO11 trabaja mirando toda la imagen a la vez, en lugar de por partes, lo que lo hace más rápido y eficaz. También puede realizar tareas de visión por ordenador como la segmentación de instancias, la estimación de poses y la clasificación de imágenes.

En concreto, las capacidades de YOLO11 pueden utilizarse para calcular la distancia que separa unos objetos de otros, lo que resulta útil en muchas áreas como la fabricación, el comercio minorista y la gestión de multitudes, ayudando a mejorar la seguridad y la eficiencia.

En este artículo analizaremos cómo puede utilizarse YOLO11 para el cálculo de distancias en aplicaciones de visión por ordenador, por qué es importante y su repercusión en distintos sectores.

__wf_reserved_inherit
Fig. 1. Ejemplo de utilización de YOLO para calcular la distancia de aterrizaje de un avión.

Una visión general del cálculo de distancias en visión artificial

El cálculo de distancia en visión artificial implica detectar, ubicar y medir los píxeles entre dos objetos en una imagen. Los píxeles son las unidades individuales que componen una imagen digital, cada uno representando un único punto con un valor específico de color o intensidad. 

Para convertir las medidas en píxeles en distancias del mundo real, la calibración es clave. Puede considerarlo como usar una regla para medir algo y luego usar esa medida para comprender el tamaño de otros objetos. Al hacer referencia a objetos con tamaños conocidos, la calibración crea un vínculo entre los píxeles y las distancias físicas reales.

Veamos un ejemplo para ver cómo funciona esto. En la imagen de abajo, la moneda es el objeto de referencia, y su tamaño (0.9 pulgadas por 1.0 pulgadas) es conocido. Al comparar las medidas en píxeles de los otros objetos con el tamaño de la moneda, podemos calcular su tamaño en el mundo real.

__wf_reserved_inherit
Fig. 2. Se puede usar una moneda como referencia para medir el tamaño real de otros objetos.

Sin embargo, el cálculo de la distancia se realiza en un plano bidimensional (2D), lo que significa que solo mide las distancias horizontales y verticales entre los objetos. Esto es diferente de la estimación de profundidad, que mide la distancia de los objetos en un espacio tridimensional, incluida su distancia desde la cámara.

Si bien las cámaras de profundidad pueden medir la profundidad real y proporcionar información espacial más detallada, en muchos casos, una simple distancia calibrada es suficiente. Por ejemplo, saber qué tan separados están los objetos en un plano 2D funciona bien para tareas como el seguimiento de objetos o la gestión de colas, por lo que la estimación de profundidad no es necesaria en esas situaciones.

Cómo funciona el cálculo de distancias con YOLO11

A continuación, vamos a ver cómo calcular la distancia entre dos objetos utilizando el soporte de YOLO11para la detección y seguimiento de objetos. He aquí un desglose:

  • Detección y seguimiento de objetos: YOLO11 puede utilizarse para detect objetos reconociéndolos en un fotograma y siguiendo su movimiento a través de los fotogramas de un vídeo. Asigna un ID de track único a cada objeto, lo que permite al sistema controlar su posición y movimiento a lo largo del vídeo.
  • Cuadros delimitadores: Se dibujan cuadros delimitadores alrededor de los objetos detectados basándose en los resultados de detección de objetos de YOLO11, que definen su ubicación en la imagen.
  • Selección de objetos: Se pueden seleccionar dos objetos para enfocarlos, y YOLO11 actualiza los cuadros delimitadores a medida que los objetos se mueven en tiempo real.
  • Cálculo del centroide: Los centroides (los puntos centrales de los cuadros delimitadores de los dos objetos) se calculan en función de las coordenadas de las esquinas del cuadro delimitador, lo que representa las posiciones de los objetos.
  • Cálculo de distancia: Los centroides de los dos objetos se pueden utilizar para calcular la distancia euclidiana entre ellos. La distancia euclidiana es la distancia en línea recta entre dos puntos en un plano 2D, calculada utilizando las diferencias tanto en las direcciones horizontal como vertical. Esto proporciona la distancia entre los dos objetos en píxeles.

Es importante tener en cuenta que las distancias calculadas mediante este método son solo estimaciones, ya que se basan en mediciones de píxeles 2D.

__wf_reserved_inherit
Fig. 3. Uso de Ultralytics YOLO para detect a una persona y calcular distancias. 

El impacto de la estimación de la distancia YOLO

Teniendo en cuenta que el cálculo de distancias con YOLO11 es una estimación, te estarás preguntando: ¿Dónde puede utilizarse y cómo puede marcar la diferencia? 

Dado que se utilizan calibraciones para llegar a estas estimaciones de distancia, son lo suficientemente precisas como para ayudar en muchas situaciones prácticas. La estimación de distancias de YOLO11es especialmente útil en entornos dinámicos, como almacenes, donde los objetos están en constante movimiento y es necesario realizar ajustes en tiempo real para que todo funcione correctamente.

Un ejemplo interesante es el uso de YOLO11 para track los paquetes en una cinta transportadora y estimar la distancia entre ellos en tiempo real. Esto ayuda a los jefes de almacén a asegurarse de que los paquetes están espaciados correctamente, evitando colisiones y manteniendo las cosas funcionando sin problemas. 

En tales casos, no siempre es necesaria una distancia exacta. Normalmente, se establece un rango o umbral para la distancia óptima, por lo que una estimación funciona bien para este tipo de aplicaciones.

__wf_reserved_inherit
Fig. 4. Detección de paquetes mediante YOLO11 y cálculo de la distancia entre ellos.

Cálculo de Distancia en Aplicaciones de Visión Artificial

Diversas aplicaciones de visión por ordenador pueden beneficiarse del cálculo de la distancia entre objetos mediante YOLO11. En el análisis de comercios, por ejemplo, ayuda a mejorar la gestión de colas mediante el seguimiento de las posiciones de los clientes en tiempo real. Esto permite a las empresas asignar mejor los recursos, reducir los tiempos de espera y crear una experiencia de compra más fluida. Ajustando dinámicamente los niveles de personal y gestionando el flujo de clientes, las tiendas pueden evitar el hacinamiento y optimizar el uso del espacio.

Del mismo modo, en la gestión del tráfico, la estimación de la distancia ayuda a controlar el espacio entre vehículos y analizar los patrones de tráfico. Esto puede utilizarse para detect comportamientos peligrosos, como ir a rebufo de otros vehículos, y ajustar los semáforos para que el tráfico fluya sin problemas. Puede contribuir a que las carreteras sean más seguras identificando posibles problemas y mejorando la gestión general del tráfico en tiempo real.

__wf_reserved_inherit
Fig 5. El cálculo de distancia habilitado por visión artificial se puede utilizar para monitorizar el tráfico.

Otro uso único de esta tecnología se produjo durante la pandemia de COVID-19, cuando ayudó a promover el distanciamiento social. Se aseguró de que las personas mantuvieran una distancia segura en espacios públicos, tiendas y hospitales, reduciendo el riesgo de propagación del virus. 

Al rastrear las distancias en tiempo real, se podrían enviar alertas cuando las personas estuvieran demasiado cerca, lo que facilitaría a las empresas y a los proveedores de atención médica responder rápidamente y mantener un entorno más seguro para todos.

Pros y contras del cálculo de distancias en la visión artificial

Ahora que hemos discutido algunas de las aplicaciones del cálculo de distancias utilizando la visión artificial, aquí hay una mirada más de cerca a los beneficios asociados de hacerlo:

  • Automatización: La visión artificial puede automatizar las tareas de cálculo de distancias que de otro modo requerirían un seguimiento manual, reduciendo el error humano y los costes laborales al tiempo que aumenta la productividad.
  • Optimización de recursos: Al conocer el espaciamiento y la proximidad aproximados de los objetos, se pueden optimizar los recursos (como el personal o la maquinaria), lo que reduce el desperdicio y mejora los flujos de trabajo.
  • Complejidad de configuración mínima: Una vez configurados, los sistemas de cálculo de distancia habilitados para la visión tienen un mantenimiento relativamente bajo y requieren menos intervención humana en comparación con otros sistemas que dependen de la entrada manual o maquinaria compleja.

A pesar de estas ventajas, también existen algunas limitaciones que se deben tener en cuenta al implementar dichos sistemas. Aquí hay un vistazo rápido de los factores clave a considerar cuando se trata del cálculo de la distancia mediante visión artificial:

  • Sensibilidad a los factores ambientales: La precisión del cálculo de la distancia puede verse afectada por las condiciones de iluminación, las sombras, los reflejos o las obstrucciones, lo que puede provocar errores o inconsistencias.
  • Privacidad: El uso de la visión por ordenador para track objetos o personas puede plantear problemas de privacidad, especialmente en espacios públicos o entornos sensibles en los que puedan estar implicados datos personales.
  • Complejidad en escenarios multi-objeto: En entornos con numerosos objetos en movimiento, el cálculo preciso de las distancias entre varios objetos simultáneamente puede llevar a la confusión, sobre todo si están muy juntos o se cruzan.

Conclusiones clave

Calcular la distancia entre objetos con YOLO11 es una solución fiable que puede ayudar en la toma de decisiones. Resulta especialmente útil en entornos dinámicos como almacenes, comercios minoristas y gestión del tráfico, donde el track de la proximidad de los objetos puede mejorar la eficiencia y la seguridad. 

YOLO11 permite automatizar tareas que normalmente requerirían un esfuerzo manual. Aunque existen algunos retos, como la sensibilidad a los factores ambientales y los problemas de privacidad, las ventajas, como la automatización, la escalabilidad y la facilidad de integración, lo hacen impactante. A medida que la visión por ordenador siga mejorando, especialmente en áreas como el cálculo de distancias, es probable que asistamos a un verdadero cambio en la forma en que las máquinas interactúan con su entorno y lo comprenden.

¡Únete a nuestra comunidad! Explora nuestro repositorio de GitHub para obtener más información sobre la Visión Artificial. Si estás interesado en aprovechar la visión artificial, consulta nuestras opciones de licencia. ¡Descubre cómo la visión artificial en la atención médica está mejorando la eficiencia y observa el impacto de la IA en la agricultura visitando nuestras páginas de soluciones! 

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis