Как рассчитать расстояние с помощью моделей компьютерного зрения?

Абирами Вина

4 мин. чтения

3 апреля 2025 г.

Узнайте, как расчет расстояния в приложениях компьютерного зрения с помощью Ultralytics YOLO11 помогает измерять близость объектов в режиме реального времени.

Когда вы переходите дорогу и видите приближающуюся к вам машину, вы сразу же можете определить, на каком расстоянии она находится. Это быстрое, почти инстинктивное суждение происходит благодаря пространственному пониманию окружающей обстановки. Основываясь на этом чувстве, вы можете решить, стоит ли ускориться, остановиться или продолжать идти. 

Компьютерное зрение - это направление искусственного интеллекта (ИИ), которое позволяет машинам понимать окружающую обстановку, интерпретируя визуальные данные. Подобно тому, как вы можете оценить близость автомобиля, чтобы быстро принимать решения, модели компьютерного зрения могут анализировать изображения и видео, помогая машинам чувствовать и реагировать на окружающий мир.

Например, Ultralytics YOLO11 - это модель компьютерного зрения, которая позволяет обнаруживать и отслеживать объекты на изображениях и видео в режиме реального времени. Проще говоря, YOLO11 работает, рассматривая все изображение сразу, а не по частям, что делает ее более быстрой и эффективной. Она также может решать такие задачи компьютерного зрения, как сегментация объектов, оценка позы и классификация изображений.

В частности, возможности YOLO11 можно использовать для расчета расстояния между объектами, что полезно во многих областях, таких как производство, розничная торговля и управление толпой, помогая повысить безопасность и эффективность.

В этой статье мы рассмотрим, как YOLO11 может использоваться для расчета расстояний в приложениях компьютерного зрения, почему это важно и как это влияет на различные отрасли.

__wf_reserved_inherit
Рис. 1. Пример использования YOLO для расчета посадочной дистанции самолета.

Обзор вычисления расстояний в компьютерном зрении

Расчет расстояния в компьютерном зрении включает в себя обнаружение, определение местоположения и измерение пикселей между двумя объектами на изображении. Пиксели - это отдельные единицы, составляющие цифровое изображение, каждая из которых представляет собой одну точку с определенным цветом или значением интенсивности. 

Для преобразования пиксельных измерений в реальные расстояния ключевую роль играет калибровка. Ее можно представить себе как использование линейки для измерения чего-либо, а затем использование этого измерения для понимания размеров других объектов. Калибровка создает связь между пикселями и реальными физическими расстояниями, используя объекты известных размеров.

Давайте рассмотрим пример, чтобы понять, как это работает. На изображении ниже монета является эталонным объектом, и ее размер (0,9 дюйма на 1,0 дюйма) известен. Сравнив размеры пикселей других объектов с размером монеты, мы можем вычислить их реальный размер.

__wf_reserved_inherit
Рис. 2. Монету можно использовать в качестве эталона для измерения реальных размеров других объектов.

Однако расчет расстояния производится в двухмерной (2D) плоскости, то есть измеряются только горизонтальные и вертикальные расстояния между объектами. Это отличается от оценки глубины, которая измеряет расстояние между объектами в трехмерном пространстве, включая их расстояние от камеры.

Хотя камеры глубины могут измерять истинную глубину и предоставлять более подробную пространственную информацию, во многих случаях достаточно простого калиброванного расстояния. Например, знание расстояния между объектами в двухмерной плоскости хорошо подходит для таких задач, как отслеживание объектов или управление очередями, поэтому в таких ситуациях оценка глубины не нужна.

Понимание того, как работает расчет расстояния с помощью YOLO11

Далее рассмотрим, как рассчитать расстояние между двумя объектами, используя поддержку обнаружения и отслеживания объектов в YOLO11. Вот краткое описание:

  • Обнаружение и отслеживание объектов: YOLO11 можно использовать для обнаружения объектов, распознавая их в кадре и отслеживая их перемещение по кадрам видео. Он присваивает каждому объекту уникальный идентификатор трека, что позволяет системе отслеживать его положение и перемещение на протяжении всего видео.
  • Ограничительные рамки: На основе результатов обнаружения объектов в YOLO11 вокруг них рисуются ограничительные рамки, которые определяют их местоположение на изображении.
  • Выбор объектов: Можно выбрать два объекта для фокусировки, и YOLO11 обновляет ограничительные рамки по мере перемещения объектов в режиме реального времени.
  • Расчет центроида: Центроиды (центральные точки ограничительных полей двух объектов) вычисляются на основе координат углов ограничительных полей, представляющих положение объектов.
  • Расчет расстояния: Центроиды двух объектов можно использовать для расчета евклидова расстояния между ними. Евклидово расстояние - это прямолинейное расстояние между двумя точками в двумерной плоскости, рассчитанное по разности горизонтального и вертикального направлений. Это позволяет получить расстояние между двумя объектами в пикселях.

Важно помнить, что расстояния, рассчитанные с помощью этого метода, являются лишь приблизительными, так как они основаны на 2D-измерениях пикселей.

__wf_reserved_inherit
Рис. 3. Использование Ultralytics YOLO для обнаружения человека и расчета расстояния. 

Влияние оценки расстояния YOLO

Учитывая, что расчет расстояний с помощью YOLO11 является приблизительным, вы можете задаться вопросом: Где это можно использовать и как это может повлиять на ситуацию? 

Поскольку для получения этих оценок расстояния используются калибровки, они достаточно точны, чтобы помочь во многих практических ситуациях. Оценка расстояния YOLO11 особенно полезна в динамичных средах, например на складах, где объекты постоянно находятся в движении и для поддержания нормальной работы необходимы корректировки в реальном времени.

Интересный пример - использование YOLO11 для отслеживания упаковок на конвейере и оценки расстояния между ними в режиме реального времени. Это помогает менеджерам склада следить за правильным расположением упаковок, предотвращая столкновения и обеспечивая бесперебойную работу. 

В таких случаях точное расстояние не всегда необходимо. Как правило, задается диапазон или порог оптимального расстояния, поэтому для таких приложений хорошо подходит оценка.

__wf_reserved_inherit
Рис. 4. Обнаружение пакетов с помощью YOLO11 и вычисление расстояния между ними.

Вычисление расстояний в приложениях компьютерного зрения

Вычисление расстояния между объектами с помощью YOLO11 может быть полезно для различных приложений компьютерного зрения. Например, в аналитике розничной торговли он помогает улучшить управление очередями, отслеживая положение покупателей в режиме реального времени. Это позволяет предприятиям лучше распределять ресурсы, сокращать время ожидания и создавать более комфортные условия для совершения покупок. Динамически регулируя численность персонала и управляя потоком покупателей, магазины могут предотвратить переполненность и оптимизировать использование пространства.

Аналогично, в управлении дорожным движением оценка расстояния помогает контролировать расстояние между автомобилями и анализировать схему движения. Это может быть использовано для выявления опасных видов поведения, таких как движение в хвосте, и корректировки сигналов светофора для обеспечения бесперебойного движения. Это может помочь сделать дороги более безопасными, выявляя потенциальные проблемы и улучшая общее управление движением в режиме реального времени.

__wf_reserved_inherit
Рис. 5. Расчет расстояния с помощью зрения может быть использован для мониторинга дорожного движения.

Еще одно уникальное применение этой технологии было найдено во время пандемии COVID-19, когда она способствовала социальной дистанцированности. Благодаря ей люди держались на безопасном расстоянии в общественных местах, магазинах и больницах, что снижало риск распространения вируса. 

Отслеживая расстояния в режиме реального времени, можно отправлять предупреждения, если люди находятся слишком близко, что позволяет предприятиям и медицинским учреждениям быстро реагировать и поддерживать более безопасную обстановку для всех.

Плюсы и минусы расчета расстояния в компьютерном зрении

Теперь, когда мы обсудили некоторые области применения расчета расстояний с помощью компьютерного зрения, давайте подробнее рассмотрим связанные с этим преимущества:

  • Автоматизация: ИИ Vision AI может автоматизировать задачи по расчету расстояния, которые в противном случае требовали бы ручного отслеживания, сокращая человеческие ошибки и трудозатраты при одновременном повышении производительности.
  • Оптимизация ресурсов: Зная примерное расстояние между объектами и их близость, можно оптимизировать ресурсы (например, персонал или технику), сокращая потери и улучшая рабочие процессы.
  • Минимальная сложность настройки: После настройки системы расчета расстояния с использованием технического зрения не требуют особого обслуживания и вмешательства человека по сравнению с другими системами, которые зависят от ручного ввода или сложного оборудования.

Несмотря на эти преимущества, при внедрении подобных систем следует помнить и о некоторых ограничениях. Вот краткий обзор ключевых факторов, которые необходимо учитывать, когда речь идет о расчете расстояния с помощью компьютерного зрения:

  • Чувствительность к факторам окружающей среды: На точность расчета расстояния могут влиять условия освещения, тени, отражения или препятствия, что приводит к возможным ошибкам или несоответствиям.
  • Вопросы конфиденциальности: Использование компьютерного зрения для отслеживания объектов или людей может вызвать проблемы с конфиденциальностью, особенно в общественных местах или чувствительных средах, где могут быть задействованы личные данные.
  • Сложность в многообъектных сценариях: В средах с множеством движущихся объектов точный расчет расстояния между несколькими объектами одновременно может привести к путанице, особенно если они находятся близко друг к другу или пересекаются.

Основные выводы

Вычисление расстояния между объектами с помощью YOLO11 - это надежное решение, способное помочь в принятии решений. Оно особенно полезно в динамичных средах, таких как склады, розничная торговля и управление дорожным движением, где отслеживание близости объектов может повысить эффективность и безопасность. 

YOLO11 позволяет автоматизировать задачи, которые обычно требуют ручного труда. Несмотря на некоторые сложности, такие как чувствительность к факторам окружающей среды и проблемы с конфиденциальностью, преимущества, такие как автоматизация, масштабируемость и простота интеграции, делают эту технологию очень важной. Поскольку компьютерное зрение продолжает совершенствоваться, особенно в таких областях, как расчет расстояния, вполне вероятно, что мы увидим реальный сдвиг в том, как машины взаимодействуют с окружающей средой и понимают ее.

Присоединяйтесь к нашему сообществу! Изучите наш репозиторий GitHub, чтобы узнать больше о Vision AI. Если вы заинтересованы в использовании компьютерного зрения, ознакомьтесь с нашими возможностями лицензирования. Узнайте, как компьютерное зрение в здравоохранении повышает эффективность, и посмотрите на влияние ИИ в сельском хозяйстве, посетив страницы наших решений! 

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена