Глоссарий

Обнаружение 3D-объектов

Узнайте о распознавании 3D-объектов: как LiDAR, облака точек и глубокое обучение создают точные 3D-ограничители для автономных транспортных средств, робототехники и AR.

Обнаружение 3D-объектов - это передовая техника компьютерного зрения (CV) для идентификации и определения местоположения объектов в трехмерном пространстве. В отличие от 2D-обнаружения объектов, которое работает с плоскими изображениями, 3D-обнаружение предоставляет важнейшую информацию о глубине, позволяя системе понять реальный размер, положение и ориентацию объекта. Эта возможность позволяет получить гораздо более глубокое и точное пространственное восприятие, что необходимо для многих современных приложений ИИ.

Как работает обнаружение 3D-объектов

Системы обнаружения 3D-объектов обычно используют специализированные датчики для захвата геометрии окружающей среды. К распространенным источникам данных относятся:

LiDAR (Light Detection and Ranging): Эта технология использует лазерные импульсы для измерения точных расстояний до объектов, создавая подробную 3D-карту, называемую облаком точек. Облако точек - это набор точек данных в трехмерном пространстве, которые точно отображают внешние поверхности объектов.
Стереокамеры: Подобно человеческому зрению, стереокамеры используют два или более объектива для захвата изображений под разными углами. Сравнивая эти изображения, система может рассчитать глубину и создать 3D-представление сцены.
Карты глубины: Они могут генерироваться различными датчиками, в том числе стереокамерами или камерами с временным пролетом (ToF), и предоставляют пиксельное значение расстояния.

После получения этих 3D-данных специализированные модели глубокого обучения анализируют их для идентификации и определения местоположения объектов. Такие модели, как VoxelNet и VoteNet, предназначены для обработки неструктурированных облаков точек или сеток вокселей (3D-эквивалентов пикселей) для предсказания 3D-ограничителей вокруг объектов.

Обнаружение 3D- и 2D-объектов

Основное различие между 2D- и 3D-обнаружением объектов заключается в измерении пространства, в котором они работают. 2D-обнаружение определяет местоположение объекта на плоском изображении с помощью прямоугольной рамки, заданной координатами X и Y. Однако в этом случае отсутствует восприятие глубины, что затрудняет определение истинного размера объекта или расстояния до него. Например, на 2D-изображении большой грузовик, находящийся далеко, может казаться такого же размера, как и маленький автомобиль, находящийся гораздо ближе.

Обнаружение 3D-объектов преодолевает это ограничение, добавляя ось Z для определения глубины. Это позволяет определить не только то, что представляет собой объект и где он находится в кадре, но и то, как далеко он находится, его физические размеры и ориентацию в 3D-пространстве. Хотя это дает гораздо более полное представление об окружающей среде, это также связано с более высокими вычислительными затратами и более сложными требованиями к данным.

Применение в реальном мире

Детальная пространственная информация, которую дает обнаружение 3D-объектов, неоценима во многих областях.

Автономные транспортные средства: Это одно из самых важных применений. Самоуправляемые автомобили таких компаний, как Waymo, используют LiDAR и камеры для создания 3D-модели окружающей среды в режиме реального времени. Это позволяет автомобилю точно обнаруживать другие машины, пешеходов и велосипедистов, прогнозировать их передвижение и безопасно передвигаться.
Робототехника и автоматизация: На складах и производственных предприятиях роботы используют 3D-обнаружение для идентификации, захвата и перемещения объектов с высокой точностью. Оно также является основой для приложений дополненной реальности (AR), позволяя реалистично размещать виртуальные объекты и взаимодействовать с физическим миром.

Хотя 3D-обнаружение объектов сложнее и ресурсоемче, чем 2D-методы, его способность обеспечивать точное пространственное понимание делает его незаменимой технологией для следующего поколения интеллектуальных систем.

Обнаружение 3D-объектов

Обучайте модели Ultralytics YOLO для оптимизации рабочих процессов в различных отраслях

Гибкое корпоративное лицензирование для развития ваших инноваций

Обучайте AI-модели за секунды с Ultralytics YOLO

Как работает обнаружение 3D-объектов

Обнаружение 3D- и 2D-объектов

Применение в реальном мире

Читать больше в этой категории

От битов к кубитам: Как квантовая оптимизация меняет ИИ

Краткое руководство для начинающих о том, как обучить модель искусственного интеллекта

Из Дубая с глубоким пониманием: Основные итоги саммита GDG MENA-T Summit 2025

Присоединяйтесь к сообществу Ultralytics