스테레오, ToF, LiDAR, 단안 딥러닝 등 이미지에서 깊이 추정으로 깊이 맵을 생성하여 로봇 공학, AR/VR 및 3D 인식을 지원하는 방법을 알아보세요.
깊이 추정은 컴퓨터 비전(CV)의 기본 작업으로 컴퓨터 비전(CV)의 기본 작업입니다. 카메라에 대한 장면 내 물체의 거리를 결정하는 작업입니다. 이미지의 각 픽셀에 대한 깊이 값을 계산합니다, 이 프로세스는 표준 2차원 데이터를 풍부한 3D 표현(흔히 뎁스 맵이라고도 함)으로 변환합니다. 이 기능은 기계가 공간 관계를 인식하여 환경을 탐색하고 물체를 조작하고 이해할 수 있도록 하는 데 필수적입니다, 사물을 조작하고, 인간의 시각 시스템과 마찬가지로 세상의 기하학적 구조를 이해할 수 있습니다.
깊이 추정은 하드웨어 집약적인 액티브 센싱부터 소프트웨어 기반 딥러닝(DL) 접근 방식에 이르기까지 다양합니다.
3차원을 인식하는 능력은 다양한 산업 분야에서 중요한 기능을 제공합니다.
자율주행차 분야에서 깊이 추정은 안전과 내비게이션에 필수적입니다. 자율주행차는 카메라 데이터와 LiDAR를 결합하여 장애물을 detect , 다른 차량과의 거리를 추정하고 도로의 실시간 지도를 구축합니다. 마찬가지로 로봇 공학에서는 깊이 인식 기능을 통해 자동화된 팔이 물품의 위치와 모양을 정확하게 판단하여 "픽 앤 플레이스" 작업을 수행할 수 있습니다. 제조 자동화 워크플로우
용 증강 현실 경험이 몰입감을 주려면 가상 객체가 실제 세계와 사실적으로 상호작용해야 합니다. 깊이 추정 은 모바일 디바이스가 공간의 형상을 파악하여 가상의 가구나 캐릭터를 바닥에 배치하거나 실제 오브젝트 뒤에 숨길 수 있게 함으로써 바닥에 배치하거나 실제 오브젝트 뒤에 숨길 수 있어(오클루전) 사용자 경험을 크게 개선할 수 있습니다.
전용 뎁스 모델이 존재하지만 개발자는 종종 2D를 사용합니다.
물체 감지 보정 데이터와 함께
대략적인 거리. 그리고 ultralytics 라이브러리는 솔루션 모듈을 통해 이를 간소화하여 사용자가 다음을 수행할 수 있도록 합니다.
바운딩 박스 위치를 기반으로 추적된 오브젝트의 거리를 추정할 수 있습니다.
다음 코드는 사용 방법을 보여줍니다. YOLO11 을 사용하여 객체를 track 카메라로부터 대략적인 거리를 계산하는 방법을 보여줍니다.
import cv2
from ultralytics import YOLO, solutions
# Load the YOLO11 model for object detection
model = YOLO("yolo11n.pt")
# Initialize the DistanceCalculation solution
# This estimates distance based on bounding box centroids
dist_obj = solutions.DistanceCalculation(names=model.names, view_img=True)
# Open a video file or camera stream
cap = cv2.VideoCapture("path/to/video.mp4")
while cap.isOpened():
success, im0 = cap.read()
if not success:
break
# Track objects and calculate distance
tracks = model.track(im0, persist=True, show=False)
im0 = dist_obj.start_process(im0, tracks)
# Display result (or save/process further)
cv2.imshow("Distance Estimation", im0)
if cv2.waitKey(1) == ord("q"):
break
cap.release()
cv2.destroyAllWindows()
AI 생태계에서 깊이 추정을 유사한 용어와 구별하는 것이 중요합니다:
최근 제너레이티브 AI와 기초 모델의 발전으로 모델은 2D와 3D 사이의 간극을 더욱 좁히고 있습니다. 다음과 같은 기술 신경 방사 필드(NeRF) 는 희박한 2D 이미지를 사용하여 복잡한 3D 장면을 재구성합니다. 복잡한 3D 장면을 재구성하는 데 사용되며, 기본 깊이 원칙에 크게 의존합니다. 모델 최적화가 모델 최적화가 개선됨에 따라 엣지 디바이스에서 매우 정확한 깊이 추정이 가능해지면서 차세대 스마트 드론의 원동력이 되고 있습니다, 서비스 로봇, 공간 컴퓨팅 디바이스 등을 지원합니다.