Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Обнаружение 3D-объектов

Узнайте о распознавании 3D-объектов: как LiDAR, облака точек и глубокое обучение создают точные 3D-ограничители для автономных транспортных средств, робототехники и AR.

Обнаружение 3D-объектов - это передовая техника компьютерного зрения (CV) для идентификации и определения местоположения объектов в трехмерном пространстве. В отличие от 2D-обнаружения объектов, которое работает с плоскими изображениями, 3D-обнаружение предоставляет важнейшую информацию о глубине, позволяя системе понять реальный размер, положение и ориентацию объекта. Эта возможность позволяет получить гораздо более глубокое и точное пространственное восприятие, что необходимо для многих современных приложений ИИ.

Как работает обнаружение 3D-объектов

Системы обнаружения 3D-объектов обычно используют специализированные датчики для захвата геометрии окружающей среды. К распространенным источникам данных относятся:

  • LiDAR (Light Detection and Ranging): Эта технология использует лазерные импульсы для измерения точных расстояний до объектов, создавая подробную 3D-карту, называемую облаком точек. Облако точек - это набор точек данных в трехмерном пространстве, которые точно отображают внешние поверхности объектов.
  • Стереокамеры: Подобно человеческому зрению, стереокамеры используют два или более объектива для захвата изображений под разными углами. Сравнивая эти изображения, система может рассчитать глубину и создать 3D-представление сцены.
  • Карты глубины: Они могут генерироваться различными датчиками, в том числе стереокамерами или камерами с временным пролетом (ToF), и предоставляют пиксельное значение расстояния.

После получения этих 3D-данных специализированные модели глубокого обучения анализируют их для идентификации и определения местоположения объектов. Такие модели, как VoxelNet и VoteNet, предназначены для обработки неструктурированных облаков точек или сеток вокселей (3D-эквивалентов пикселей) для предсказания 3D-ограничителей вокруг объектов.

Обнаружение 3D- и 2D-объектов

Основное различие между 2D- и 3D-обнаружением объектов заключается в измерении пространства, в котором они работают. 2D-обнаружение определяет местоположение объекта на плоском изображении с помощью прямоугольной рамки, заданной координатами X и Y. Однако в этом случае отсутствует восприятие глубины, что затрудняет определение истинного размера объекта или расстояния до него. Например, на 2D-изображении большой грузовик, находящийся далеко, может казаться такого же размера, как и маленький автомобиль, находящийся гораздо ближе.

Обнаружение 3D-объектов преодолевает это ограничение, добавляя ось Z для определения глубины. Это позволяет определить не только то, что представляет собой объект и где он находится в кадре, но и то, как далеко он находится, его физические размеры и ориентацию в 3D-пространстве. Хотя это дает гораздо более полное представление об окружающей среде, это также связано с более высокими вычислительными затратами и более сложными требованиями к данным.

Применение в реальном мире

Детальная пространственная информация, которую дает обнаружение 3D-объектов, неоценима во многих областях.

  1. Автономные транспортные средства: Это одно из самых важных применений. Самоуправляемые автомобили таких компаний, как Waymo, используют LiDAR и камеры для создания 3D-модели окружающей среды в режиме реального времени. Это позволяет автомобилю точно обнаруживать другие машины, пешеходов и велосипедистов, прогнозировать их передвижение и безопасно передвигаться.
  2. Робототехника и автоматизация: На складах и производственных предприятиях роботы используют 3D-обнаружение для идентификации, захвата и перемещения объектов с высокой точностью. Оно также является основой для приложений дополненной реальности (AR), позволяя реалистично размещать виртуальные объекты и взаимодействовать с физическим миром.

Хотя 3D-обнаружение объектов сложнее и ресурсоемче, чем 2D-методы, его способность обеспечивать точное пространственное понимание делает его незаменимой технологией для следующего поколения интеллектуальных систем.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена