Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Как вычислить расстояние с помощью моделей компьютерного зрения?

Абирами Вина

4 мин чтения

3 апреля 2025 г.

Узнайте, как расчет расстояния в приложениях компьютерного зрения с помощью Ultralytics YOLO11 помогает измерять близость объектов в режиме реального времени.

Когда вы переходите дорогу и видите приближающуюся к вам машину, вы можете мгновенно сказать, примерно, как далеко она находится. Эта быстрая, почти инстинктивная оценка происходит благодаря пространственному пониманию вашего окружения. Основываясь на этом чувстве, вы можете решить, ускориться, остановиться или продолжить движение. 

Аналогично, компьютерное зрение — это раздел искусственного интеллекта (ИИ), который позволяет машинам развивать понимание своего окружения, интерпретируя визуальные данные. Подобно тому, как вы можете оценить близость автомобиля, чтобы быстро принимать решения, модели компьютерного зрения могут анализировать изображения и видео, помогая машинам чувствовать окружающий мир и реагировать на него.

Например, Ultralytics YOLO11 это модель компьютерного зрения, которая позволяет detect и track объекты на изображениях и видео в режиме реального времени. Проще говоря, YOLO11 работает, рассматривая все изображение сразу, а не по частям, что делает ее более быстрой и эффективной. Она также может решать такие задачи компьютерного зрения, как сегментация объектов, оценка позы и классификация изображений.

В частности, возможности YOLO11 можно использовать для расчета расстояния между объектами, что полезно во многих областях, таких как производство, розничная торговля и управление толпой, помогая повысить безопасность и эффективность.

В этой статье мы рассмотрим, как YOLO11 может использоваться для расчета расстояний в приложениях компьютерного зрения, почему это важно и как это влияет на различные отрасли.

__wf_reserved_inherit
Рис. 1. Пример использования YOLO для расчета посадочной дистанции самолета.

Обзор вычисления расстояния в компьютерном зрении

Расчет расстояния в компьютерном зрении включает в себя обнаружение, определение местоположения и измерение пикселей между двумя объектами на изображении. Пиксели – это отдельные элементы, составляющие цифровое изображение, каждый из которых представляет собой отдельную точку с определенным цветом или значением интенсивности. 

Чтобы преобразовать измерения в пикселях в реальные расстояния, калибровка имеет ключевое значение. Вы можете думать об этом как об использовании линейки для измерения чего-либо, а затем об использовании этого измерения для понимания размера других объектов. Ссылаясь на объекты с известными размерами, калибровка создает связь между пикселями и фактическими физическими расстояниями.

Давайте рассмотрим пример, чтобы увидеть, как это работает. На изображении ниже монета является эталонным объектом, и ее размер (0,9 дюйма на 1,0 дюйма) известен. Сравнивая пиксельные измерения других объектов с размером монеты, мы можем рассчитать их реальный размер.

__wf_reserved_inherit
Рис. 2. Монета может использоваться в качестве эталона для измерения реального размера других объектов.

Однако, вычисление расстояния производится в двухмерной (2D) плоскости, то есть измеряются только горизонтальное и вертикальное расстояния между объектами. Это отличается от оценки глубины, которая измеряет расстояние до объектов в трехмерном пространстве, включая их удаленность от камеры.

Хотя камеры глубины могут измерять истинную глубину и предоставлять более подробную пространственную информацию, во многих случаях достаточно простой откалиброванной дистанции. Например, знание расстояния между объектами в 2D-плоскости хорошо подходит для таких задач, как отслеживание объектов или управление очередями, поэтому оценка глубины в этих ситуациях не требуется.

Понимание того, как работает расчет расстояния с помощью YOLO11

Далее рассмотрим, как рассчитать расстояние между двумя объектами, используя поддержку обнаружения и отслеживания объектов в YOLO11. Вот краткое описание:

  • Обнаружение и отслеживание объектов: YOLO11 можно использовать для detect объектов, распознавая их в кадре и отслеживая их перемещение по кадрам видео. Он присваивает каждому объекту уникальный идентификатор track , что позволяет системе отслеживать его положение и перемещение на протяжении всего видео.
  • Ограничительные рамки: На основе результатов обнаружения объектов в YOLO11вокруг них рисуются ограничительные рамки, которые определяют их местоположение на изображении.
  • Выбор объектов: Можно выбрать два объекта для фокусировки, и YOLO11 обновляет ограничительные рамки по мере перемещения объектов в режиме реального времени.
  • Вычисление центроида: Центроиды (центральные точки ограничивающих рамок двух объектов) вычисляются на основе координат углов ограничивающей рамки, представляющих положение объектов.
  • Вычисление расстояния: Центроиды двух объектов затем можно использовать для вычисления евклидова расстояния между ними. Евклидово расстояние - это расстояние по прямой между двумя точками на 2D-плоскости, вычисляемое с использованием разницы как в горизонтальном, так и в вертикальном направлениях. Это дает расстояние между двумя объектами в пикселях.

Важно помнить, что расстояния, рассчитанные с использованием этого метода, являются лишь приблизительными, поскольку они основаны на 2D-пиксельных измерениях.

__wf_reserved_inherit
Рис. 3. Использование Ultralytics YOLO для detect человека и расчета расстояния. 

Влияние оценки расстояния YOLO

Учитывая, что расчет расстояний с помощью YOLO11 является приблизительным, вы можете задаться вопросом: Где это можно использовать и как это может повлиять на ситуацию? 

Поскольку для получения этих оценок расстояния используются калибровки, они достаточно точны, чтобы помочь во многих практических ситуациях. Оценка расстояния YOLO11особенно полезна в динамичных средах, например на складах, где объекты постоянно находятся в движении и для поддержания нормальной работы необходимы корректировки в реальном времени.

Интересный пример - использование YOLO11 для track упаковок на конвейере и оценки расстояния между ними в режиме реального времени. Это помогает менеджерам склада следить за правильным расположением упаковок, предотвращая столкновения и обеспечивая бесперебойную работу. 

В таких случаях точное расстояние не всегда необходимо. Как правило, устанавливается диапазон или порог для оптимального расстояния, поэтому оценка хорошо подходит для этих типов приложений.

__wf_reserved_inherit
Рис. 4. Обнаружение пакетов с помощью YOLO11 и вычисление расстояния между ними.

Расчет расстояния в приложениях компьютерного зрения

Вычисление расстояния между объектами с помощью YOLO11 может быть полезно для различных приложений компьютерного зрения. Например, в аналитике розничной торговли он помогает улучшить управление очередями, отслеживая положение покупателей в режиме реального времени. Это позволяет предприятиям лучше распределять ресурсы, сокращать время ожидания и создавать более комфортные условия для совершения покупок. Динамически регулируя численность персонала и управляя потоком покупателей, магазины могут предотвратить переполненность и оптимизировать использование пространства.

Аналогично, в управлении дорожным движением оценка расстояния помогает контролировать расстояние между автомобилями и анализировать схему движения. Это может быть использовано для detect опасных видов поведения, таких как движение в хвосте, и корректировки сигналов светофора для обеспечения бесперебойного движения. Это может помочь сделать дороги более безопасными, выявляя потенциальные проблемы и улучшая общее управление движением в режиме реального времени.

__wf_reserved_inherit
Рис. 5. Расчет расстояния с помощью машинного зрения может использоваться для мониторинга трафика.

Еще одно уникальное применение этой технологии произошло во время пандемии COVID-19, когда она помогла продвигать социальное дистанцирование. Она следила за тем, чтобы люди соблюдали безопасную дистанцию в общественных местах, магазинах и больницах, снижая риск распространения вируса. 

Отслеживая расстояния в режиме реального времени, можно отправлять оповещения, когда люди находятся слишком близко друг к другу, что упрощает предприятиям и поставщикам медицинских услуг быстрое реагирование и поддержание более безопасной среды для всех.

Плюсы и минусы вычисления расстояния в компьютерном зрении

Теперь, когда мы обсудили некоторые применения вычисления расстояния с использованием компьютерного зрения, вот более подробный взгляд на связанные с этим преимущества:

  • Автоматизация: Vision AI может автоматизировать задачи расчета расстояний, которые в противном случае потребовали бы ручного отслеживания, сокращая количество человеческих ошибок и затраты на оплату труда при одновременном повышении производительности.
  • Оптимизация ресурсов: Зная приблизительное расстояние и близость объектов, можно оптимизировать ресурсы (например, персонал или оборудование), сокращая потери и улучшая рабочие процессы.
  • Минимальная сложность настройки: После настройки системы расчета расстояния с поддержкой машинного зрения относительно просты в обслуживании и требуют меньшего вмешательства человека по сравнению с другими системами, которые полагаются на ручной ввод или сложное оборудование.

Несмотря на эти преимущества, есть также некоторые ограничения, которые следует учитывать при внедрении таких систем. Вот краткий обзор ключевых факторов, которые следует учитывать, когда речь идет о расчете расстояния с использованием компьютерного зрения:

  • Чувствительность к факторам окружающей среды: На точность вычисления расстояния могут влиять условия освещения, тени, отражения или препятствия, что может привести к потенциальным ошибкам или несоответствиям.
  • Вопросы конфиденциальности: Использование компьютерного зрения для track объектов или людей может вызвать проблемы с конфиденциальностью, особенно в общественных местах или чувствительных средах, где могут быть задействованы личные данные.
  • Сложность в сценариях с несколькими объектами: В средах с многочисленными движущимися объектами точный расчет расстояний между несколькими объектами одновременно может привести к путанице, особенно если они находятся близко друг к другу или пересекаются.

Основные выводы

Вычисление расстояния между объектами с помощью YOLO11 - это надежное решение, способное помочь в принятии решений. Оно особенно полезно в динамичных средах, таких как склады, розничная торговля и управление дорожным движением, где track близости объектов может повысить эффективность и безопасность. 

YOLO11 позволяет автоматизировать задачи, которые обычно требуют ручного труда. Несмотря на некоторые сложности, такие как чувствительность к факторам окружающей среды и проблемы с конфиденциальностью, преимущества, такие как автоматизация, масштабируемость и простота интеграции, делают эту технологию очень важной. Поскольку компьютерное зрение продолжает совершенствоваться, особенно в таких областях, как расчет расстояния, вполне вероятно, что мы увидим реальный сдвиг в том, как машины взаимодействуют с окружающей средой и понимают ее.

Присоединяйтесь к нашему сообществу! Изучите наш репозиторий на GitHub, чтобы узнать больше о Vision AI. Если вы заинтересованы в использовании компьютерного зрения, ознакомьтесь с нашими вариантами лицензирования. Узнайте, как компьютерное зрение в здравоохранении повышает эффективность, и оцените влияние ИИ в сельском хозяйстве, посетив страницы наших решений! 

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно