Yolo Vision Shenzhen
Shenzhen
Únete ahora

¿Cómo calcular la distancia utilizando modelos de visión artificial?

Abirami Vina

4 minutos de lectura

3 de abril de 2025

Aprenda cómo el cálculo de distancias en aplicaciones de visión artificial que utilizan Ultralytics YOLO11 ayuda a medir la proximidad de los objetos en tiempo real.

Cuando cruzas la calle y ves un coche que se acerca, puedes saber al instante aproximadamente a qué distancia está. Este juicio rápido, casi instintivo, es gracias a una comprensión espacial de tu entorno. Basándote en este sentido, puedes decidir si acelerar, detenerte o seguir caminando. 

De manera similar, la visión artificial es una rama de la inteligencia artificial (IA) que permite a las máquinas desarrollar una comprensión de su entorno interpretando datos visuales. Al igual que usted puede evaluar la proximidad de un coche para tomar decisiones rápidas, los modelos de visión artificial pueden analizar imágenes y vídeos, ayudando a las máquinas a sentir y reaccionar ante el mundo que les rodea.

Por ejemplo, Ultralytics YOLO11 es un modelo de visión artificial que puede detectar y rastrear objetos en imágenes y vídeos en tiempo real. En pocas palabras, YOLO11 funciona mirando toda la imagen a la vez, en lugar de por partes, lo que lo hace más rápido y eficiente. También puede manejar tareas de visión artificial como la segmentación de instancias, la estimación de poses y la clasificación de imágenes.

En particular, las capacidades de YOLO11 se pueden utilizar para calcular la distancia entre objetos, lo cual es útil en muchas áreas como la fabricación, el comercio minorista y la gestión de multitudes, lo que ayuda a mejorar la seguridad y la eficiencia.

En este artículo, exploraremos cómo se puede utilizar YOLO11 para el cálculo de distancias en aplicaciones de visión artificial, por qué es importante y su impacto en diferentes industrias.

__wf_reserved_inherit
Fig 1. Ejemplo del uso de YOLO para calcular la distancia de aterrizaje de un avión.

Una visión general del cálculo de distancias en visión artificial

El cálculo de distancia en visión artificial implica detectar, ubicar y medir los píxeles entre dos objetos en una imagen. Los píxeles son las unidades individuales que componen una imagen digital, cada uno representando un único punto con un valor específico de color o intensidad. 

Para convertir las medidas en píxeles en distancias del mundo real, la calibración es clave. Puede considerarlo como usar una regla para medir algo y luego usar esa medida para comprender el tamaño de otros objetos. Al hacer referencia a objetos con tamaños conocidos, la calibración crea un vínculo entre los píxeles y las distancias físicas reales.

Veamos un ejemplo para ver cómo funciona esto. En la imagen de abajo, la moneda es el objeto de referencia, y su tamaño (0.9 pulgadas por 1.0 pulgadas) es conocido. Al comparar las medidas en píxeles de los otros objetos con el tamaño de la moneda, podemos calcular su tamaño en el mundo real.

__wf_reserved_inherit
Fig. 2. Se puede usar una moneda como referencia para medir el tamaño real de otros objetos.

Sin embargo, el cálculo de la distancia se realiza en un plano bidimensional (2D), lo que significa que solo mide las distancias horizontales y verticales entre los objetos. Esto es diferente de la estimación de profundidad, que mide la distancia de los objetos en un espacio tridimensional, incluida su distancia desde la cámara.

Si bien las cámaras de profundidad pueden medir la profundidad real y proporcionar información espacial más detallada, en muchos casos, una simple distancia calibrada es suficiente. Por ejemplo, saber qué tan separados están los objetos en un plano 2D funciona bien para tareas como el seguimiento de objetos o la gestión de colas, por lo que la estimación de profundidad no es necesaria en esas situaciones.

Comprensión de cómo funciona el cálculo de la distancia utilizando YOLO11

A continuación, veamos cómo calcular la distancia entre dos objetos utilizando la compatibilidad de YOLO11 para la detección de objetos y el seguimiento. Aquí tienes un desglose:

  • Detección y seguimiento de objetos: YOLO11 puede utilizarse para detectar objetos reconociéndolos en un fotograma y rastreando su movimiento a través de los fotogramas de un vídeo. Asigna un ID de seguimiento único a cada objeto, lo que permite al sistema supervisar su posición y movimiento a lo largo del vídeo.
  • Bounding boxes: Se dibujan bounding boxes alrededor de los objetos detectados basándose en los resultados de la detección de objetos de YOLO11, que definen su ubicación en la imagen.
  • Selección de objetos: Se pueden seleccionar dos objetos para enfocar, y YOLO11 actualiza los bounding boxes a medida que los objetos se mueven en tiempo real.
  • Cálculo del centroide: Los centroides (los puntos centrales de los cuadros delimitadores de los dos objetos) se calculan en función de las coordenadas de las esquinas del cuadro delimitador, lo que representa las posiciones de los objetos.
  • Cálculo de distancia: Los centroides de los dos objetos se pueden utilizar para calcular la distancia euclidiana entre ellos. La distancia euclidiana es la distancia en línea recta entre dos puntos en un plano 2D, calculada utilizando las diferencias tanto en las direcciones horizontal como vertical. Esto proporciona la distancia entre los dos objetos en píxeles.

Es importante tener en cuenta que las distancias calculadas mediante este método son solo estimaciones, ya que se basan en mediciones de píxeles 2D.

__wf_reserved_inherit
Fig. 3. Uso de Ultralytics YOLO para detectar a una persona y calcular distancias. 

El impacto de la estimación de distancia YOLO

Considerando que el cálculo de distancias utilizando YOLO11 es una estimación, te preguntarás: ¿Dónde se puede usar esto y cómo puede marcar la diferencia? 

Dado que las calibraciones se utilizan para llegar a estas estimaciones de distancia, son lo suficientemente precisas como para ayudar en muchas situaciones prácticas. La estimación de distancia de YOLO11 es particularmente útil en entornos dinámicos, como almacenes, donde los objetos están constantemente en movimiento y se necesitan ajustes en tiempo real para que todo funcione sin problemas.

Un ejemplo interesante es el uso de YOLO11 para rastrear paquetes en una cinta transportadora y estimar la distancia entre ellos en tiempo real. Esto ayuda a los gerentes de almacén a asegurarse de que los paquetes estén espaciados correctamente, evitando colisiones y manteniendo las cosas funcionando sin problemas. 

En tales casos, no siempre es necesaria una distancia exacta. Normalmente, se establece un rango o umbral para la distancia óptima, por lo que una estimación funciona bien para este tipo de aplicaciones.

__wf_reserved_inherit
Fig. 4. Detección de paquetes usando YOLO11 y cálculo de la distancia entre ellos.

Cálculo de Distancia en Aplicaciones de Visión Artificial

Varias aplicaciones de visión artificial pueden beneficiarse del cálculo de la distancia entre objetos utilizando YOLO11. En el análisis minorista, por ejemplo, ayuda a mejorar la gestión de colas mediante el seguimiento de las posiciones de los clientes en tiempo real. Esto permite a las empresas asignar mejor los recursos, reducir los tiempos de espera y crear una experiencia de compra más fluida. Al ajustar dinámicamente los niveles de personal y gestionar el flujo de clientes, las tiendas pueden evitar el hacinamiento y optimizar el uso del espacio.

Del mismo modo, en la gestión del tráfico, la estimación de la distancia ayuda a controlar el espacio entre vehículos y a analizar los patrones de tráfico. Esto puede utilizarse para detectar comportamientos peligrosos, como el seguimiento de cerca, y ajustar las señales de tráfico para que éste fluya sin problemas. Puede ayudar a que las carreteras sean más seguras identificando posibles problemas y mejorando la gestión general del tráfico en tiempo real.

__wf_reserved_inherit
Fig 5. El cálculo de distancia habilitado por visión artificial se puede utilizar para monitorizar el tráfico.

Otro uso único de esta tecnología se produjo durante la pandemia de COVID-19, cuando ayudó a promover el distanciamiento social. Se aseguró de que las personas mantuvieran una distancia segura en espacios públicos, tiendas y hospitales, reduciendo el riesgo de propagación del virus. 

Al rastrear las distancias en tiempo real, se podrían enviar alertas cuando las personas estuvieran demasiado cerca, lo que facilitaría a las empresas y a los proveedores de atención médica responder rápidamente y mantener un entorno más seguro para todos.

Pros y contras del cálculo de distancias en la visión artificial

Ahora que hemos discutido algunas de las aplicaciones del cálculo de distancias utilizando la visión artificial, aquí hay una mirada más de cerca a los beneficios asociados de hacerlo:

  • Automatización: La visión artificial puede automatizar las tareas de cálculo de distancias que de otro modo requerirían un seguimiento manual, reduciendo el error humano y los costes laborales al tiempo que aumenta la productividad.
  • Optimización de recursos: Al conocer el espaciamiento y la proximidad aproximados de los objetos, se pueden optimizar los recursos (como el personal o la maquinaria), lo que reduce el desperdicio y mejora los flujos de trabajo.
  • Complejidad de configuración mínima: Una vez configurados, los sistemas de cálculo de distancia habilitados para la visión tienen un mantenimiento relativamente bajo y requieren menos intervención humana en comparación con otros sistemas que dependen de la entrada manual o maquinaria compleja.

A pesar de estas ventajas, también existen algunas limitaciones que se deben tener en cuenta al implementar dichos sistemas. Aquí hay un vistazo rápido de los factores clave a considerar cuando se trata del cálculo de la distancia mediante visión artificial:

  • Sensibilidad a los factores ambientales: La precisión del cálculo de la distancia puede verse afectada por las condiciones de iluminación, las sombras, los reflejos o las obstrucciones, lo que puede provocar errores o inconsistencias.
  • Preocupaciones sobre la privacidad: El uso de la visión artificial para rastrear objetos o personas puede plantear problemas de privacidad, especialmente en espacios públicos o entornos sensibles donde podrían estar involucrados datos personales.
  • Complejidad en escenarios multi-objeto: En entornos con numerosos objetos en movimiento, el cálculo preciso de las distancias entre varios objetos simultáneamente puede llevar a la confusión, sobre todo si están muy juntos o se cruzan.

Conclusiones clave

Calcular la distancia entre objetos usando YOLO11 es una solución confiable que puede respaldar la toma de decisiones. Es especialmente útil en entornos dinámicos como almacenes, comercio minorista y gestión de tráfico, donde mantener un registro de la proximidad de los objetos puede mejorar la eficiencia y la seguridad. 

YOLO11 hace posible la automatización de tareas que normalmente requerirían un esfuerzo manual. Si bien existen algunos desafíos, como la sensibilidad a los factores ambientales y las preocupaciones sobre la privacidad, los beneficios, como la automatización, la escalabilidad y la fácil integración, lo hacen impactante. A medida que la visión artificial continúa mejorando, especialmente en áreas como el cálculo de la distancia, es probable que veamos un cambio real en la forma en que las máquinas interactúan y comprenden su entorno.

¡Únete a nuestra comunidad! Explora nuestro repositorio de GitHub para obtener más información sobre la Visión Artificial. Si estás interesado en aprovechar la visión artificial, consulta nuestras opciones de licencia. ¡Descubre cómo la visión artificial en la atención médica está mejorando la eficiencia y observa el impacto de la IA en la agricultura visitando nuestras páginas de soluciones! 

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis
Enlace copiado al portapapeles