YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

3D 물체 감지

3D 물체 감지 살펴보기: LiDAR, 포인트 클라우드 및 딥러닝이 자율 주행 차량, 로봇 공학 및 AR을 위한 정확한 3D 바운딩 박스를 구축하는 방법.

3D 객체 감지는 3차원 공간에서 객체를 식별하고 위치를 파악하기 위한 고급 컴퓨터 비전(CV) 기술입니다. 평면 이미지에서 작동하는 2D 객체 감지와 달리 3D 감지는 중요한 깊이 정보를 제공하여 시스템이 객체의 실제 크기, 위치 및 방향을 이해할 수 있도록 합니다. 이 기능은 훨씬 더 깊고 정확한 공간 인식을 가능하게 하며, 이는 많은 최신 AI 애플리케이션에 필수적인 요소입니다.

3D 물체 감지 작동 방식

3D 객체 감지 시스템은 일반적으로 주변 환경의 형상을 캡처하기 위해 특수 센서에 의존합니다. 일반적인 데이터 소스에는 다음이 포함됩니다:

  • LiDAR(빛 감지 및 거리 측정): 이 기술은 레이저 펄스를 사용하여 물체까지의 정확한 거리를 측정하여 포인트 클라우드라는 상세한 3D 지도를 생성합니다. 포인트 클라우드는 3D 공간에 있는 데이터 포인트의 모음으로, 물체의 외부 표면을 정확하게 표현합니다.
  • 스테레오 카메라: 스테레오 카메라는 사람의 시각과 유사하게 두 개 이상의 렌즈를 사용하여 약간 다른 각도에서 이미지를 캡처합니다. 시스템은 이러한 이미지를 비교하여 깊이를 계산하고 장면의 3D 표현을 생성할 수 있습니다.
  • 심도 맵: 스테레오 카메라 또는 ToF(Time-of-Flight) 카메라 등 다양한 센서로 생성할 수 있으며, 픽셀당 거리 값을 제공합니다.

이 3D 데이터가 캡처되면 특수 딥러닝 모델이 이를 분석하여 물체를 식별하고 위치를 파악합니다. 복셀넷과 투표넷 같은 모델은 비정형 포인트 클라우드 또는 복셀 그리드(픽셀의 3D 등가물)를 처리하여 객체 주변의 3D 경계 상자를 예측하도록 설계되었습니다.

3D 대 2D 물체 감지

2D와 3D 객체 감지의 주요 차이점은 작동하는 공간의 차원입니다. 2D 감지는 X와 Y 좌표로 정의된 직사각형 상자를 사용하여 평면 이미지에서 물체의 위치를 식별합니다. 하지만 깊이 인식 기능이 부족하여 물체의 실제 크기나 거리를 판단하기 어렵습니다. 예를 들어 2D 이미지에서 멀리 있는 대형 트럭이 훨씬 가까이 있는 소형 자동차와 같은 크기로 보일 수 있습니다.

3D 객체 감지는 깊이를 위해 Z축을 추가하여 이러한 한계를 극복합니다. 이를 통해 물체의 종류와 프레임 내 위치뿐만 아니라 물체의 거리, 물리적 크기, 3D 공간에서의 방향까지 파악할 수 있습니다. 이렇게 하면 환경을 훨씬 더 풍부하게 이해할 수 있지만 계산 비용이 더 많이 들고 데이터 요구 사항이 더 복잡해집니다.

실제 애플리케이션

3D 물체 감지가 제공하는 상세한 공간 정보는 여러 분야에서 매우 유용합니다.

  1. 자율주행 차량: 자율주행차는 가장 중요한 애플리케이션 중 하나입니다. 웨이모와 같은 회사의 자율주행차는 LiDAR와 카메라를 사용하여 주변 환경의 실시간 3D 모델을 구축합니다. 이를 통해 차량은 다른 자동차, 보행자, 자전거를 정확하게 감지하여 움직임을 예측하고 안전하게 주행할 수 있습니다.
  2. 로봇 공학 및 자동화: 창고와 제조 시설에서 로봇은 3D 감지 기능을 사용하여 물체를 고정밀로 식별, 파악, 이동합니다. 또한 증강 현실(AR) 애플리케이션의 기본이 되어 가상 물체를 현실적으로 배치하고 물리적 세계와 상호 작용할 수 있게 해줍니다.

3D 물체 감지는 2D 방식보다 복잡하고 리소스 집약적이지만, 정밀한 공간 이해 능력을 제공하기 때문에 차세대 지능형 시스템에 없어서는 안 될 기술입니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.