Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Оценка глубины

Узнайте, как оценка глубины создает карты глубины из изображений - стерео, ToF, LiDAR и монокулярное глубокое обучение - для робототехники, AR/VR и 3D-восприятия.

Оценка глубины - одна из основных задач компьютерного зрения, которая заключается в расчете расстояния до различных объектов в сцене с точки зрения камеры. В отличие от стандартных двумерных изображений, которые фиксируют только высоту и ширину, оценка глубины добавляет третье измерение, позволяя системе воспринимать мир в 3D. В ходе этого процесса создается карта глубины, которая представляет собой изображение, где значение каждого пикселя соответствует его расстоянию от камеры. Эта способность является основополагающей для того, чтобы машины могли понимать пространственные отношения и взаимодействовать с окружающей средой более осмысленно, подобно человеческому зрению.

Как работает оценка глубины

Существует несколько методик оценки глубины, начиная от традиционных методов с использованием специализированного оборудования и заканчивая современными подходами, основанными на глубоком обучении.

  • Стереовидение: Этот метод имитирует бинокулярное зрение человека с помощью двух камер, расположенных на небольшом расстоянии друг от друга. Анализируя небольшую разницу (диспаратность) между двумя изображениями, можно триангулировать расстояние до точек сцены. Это классический и надежный подход к получению информации о глубине.
  • Камеры с временным пролетом (ToF): Эти специализированные датчики излучают световой сигнал (обычно инфракрасный) и измеряют время, необходимое для того, чтобы свет отразился от объекта и вернулся на датчик. ToF-камеры позволяют создавать высокоточные карты глубины в режиме реального времени.
  • LiDAR (Light Detection and Ranging): Технология LiDAR часто используется в автономных транспортных средствах: она излучает лазерные импульсы и измеряет время их возврата, создавая подробное трехмерное облако точек вокруг. Технология LiDAR предоставляет точные данные о глубине, что делает ее бесценной для безопасной навигации.
  • Монокулярная оценка глубины: Значительный прогресс в области ИИ связан с оценкой глубины по одному двухмерному изображению. Модели глубокого обучения, в частности сверточные нейронные сети (CNN), обучаются на огромных массивах данных, чтобы определять глубину по текстурам, оттенкам и размерам объектов, подобно тому, как это делает человеческий мозг.

Применение оценки глубины

Способность воспринимать глубину имеет решающее значение для широкого спектра приложений, требующих пространственного восприятия.

В робототехнике оценка глубины имеет решающее значение для навигации и манипулирования. Промышленный робот на сборочной линии использует данные о глубине для точного захвата и перемещения объектов, что повышает эффективность автоматизации производства. Аналогично, мобильный робот использует карту глубины, чтобы избегать препятствий и планировать свой путь в динамичной среде, например на складе. Такое 3D-восприятие обеспечивает точное и безопасное взаимодействие с физическим миром.

Дополненная реальность (AR) и виртуальная реальность (VR) в значительной степени полагаются на оценку глубины для создания захватывающих впечатлений. Чтобы AR-приложение на смартфоне разместило виртуальный предмет мебели в реальной комнате, оно должно сначала понять ее геометрию. Создав подробную карту глубины, система может обеспечить реалистичное перекрытие виртуального объекта и его взаимодействие с реальными объектами, делая иллюзию плавной и правдоподобной.

Оценка глубины по сравнению со смежными понятиями

Важно отличать оценку глубины от схожих по звучанию терминов в компьютерном зрении.

  • Вычисление расстояния: Хотя это и связано, расчет расстояния в компьютерном зрении часто относится к измерению расстояния между двумя объектами в плоскости двумерного изображения (т.е. в пикселях). В отличие от этого, оценка глубины измеряет расстояние объектов в трехмерном пространстве от самой камеры. Хотя простого калиброванного расстояния может быть достаточно для некоторых задач, оценка глубины предоставляет более подробную пространственную информацию.
  • Обнаружение 3D-объектов: Оценка глубины является ключевым инструментом для обнаружения 3D-объектов. Если при обнаружении 2D-объектов на плоском изображении вокруг объекта рисуется ограничительная рамка, то при обнаружении 3D-объектов вокруг него помещается 3D-кубоид, определяющий его положение, размер и ориентацию в трехмерном пространстве. Такое расширенное обнаружение возможно только при наличии точной информации о глубине.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена