실시간 물체 감지 및 드론 기반 컴퓨터 비전 작업을 가능하게 하는 Ultralytics YOLO11 사용하여 AI 기반 드론 애플리케이션을 구축하는 방법을 알아보세요.
오프라인 쇼핑과 온라인 쇼핑은 비슷해 보이지만 서로 다른 물류에 의존합니다. 매장은 진열대를 재입고해야 하는 반면, 온라인 주문은 문 앞 배송에 의존합니다. 기술 발전 덕분에 두 쇼핑 경험은 동시에 재편되고 있습니다.
예를 들어, 배송에 큰 변화가 일어나고 있습니다. AI 기반 드론은 제품이 우리 집에 도착하는 방식을 바꾸고 있습니다. 이러한 스마트 드론은 향후 10년간 약 8억 8천만 건의 배송을 처리할 것으로 예상되며, 하늘을 일상적인 상거래를 위한 새로운 배송 경로로 바꾸고 있습니다.
배달 드론은 시각 데이터를 분석하는 데 사용되는 AI의 하위 분야인 컴퓨터 비전과 인공 지능(AI)을 사용하여 장애물 주변을 탐색하고 조종합니다. 다음과 같은 컴퓨터 비전 모델은 Ultralytics YOLO11 와 같은 컴퓨터 비전 모델은 드론이 실시간으로 물체를 감지하고 추적하여 주변 환경을 더 잘 이해하고 상호 작용할 수 있도록 도와줍니다.
메이투안과 DJI 같은 기업들은 이미 드론에 컴퓨터 비전을 통합하고 있습니다. 실제로 다양한 산업 분야에서 드론이 빠르게 도입됨에 따라 AI 드론 시장은 2031년까지 2,069억 달러 규모로 급성장할 것으로 예상됩니다.
이 글에서는 드론 배송과 같은 드론 기반 애플리케이션에서 Ultralytics YOLO11 같은 컴퓨터 비전 모델을 어떻게 사용할 수 있는지 자세히 살펴봅니다. 실제 시나리오에서 사용하기 전에 이러한 기술을 어떻게 개발하고 테스트할 수 있는지 보여주는 예시를 살펴보겠습니다.
배송 드론의 핵심은 비행 중 주택을 감지하는 능력입니다. 이 기능을 재현하고 작동 원리를 이해하기 위해 공중 드론이 촬영한 영상에서 집을 식별할 수 있는 컴퓨터 비전 모델을 훈련시킵니다. 이를 위해 라벨링된 예제를 사용하여 집을 인식하고 감지하도록 사전 학습된 YOLO11 모델을 미세 조정하는 맞춤형 훈련을 실시할 것입니다.
그러기 위해서는 드론에서 촬영한 고품질 영상 데이터가 필요합니다. 흥미롭게도 실제 드론을 사용하지 않더라도 사실적인 항공 영상을 생성할 수 있습니다. 그 방법을 살펴보겠습니다.
Google 어스 스튜디오는 사용자가 Google 어스의 위성 및 3D 이미지를 사용하여 스틸 및 애니메이션 콘텐츠를 제작하는 데 사용할 수 있는 웹 기반 애니메이션 도구입니다. 이를 사용하여 사실적인 항공 영상을 제작할 수 있습니다.
첫 번째 단계는 아래와 같이 Google 어스 스튜디오를 열고 프로젝트를 생성하는 것입니다.
로그인하려면 Google 계정이 필요합니다.
로그인한 후에는 인공 드론 동영상을 촬영할 위치를 선택할 수 있습니다. 페이지 왼쪽 상단의 검색창을 사용하여 위치를 검색할 수 있습니다. 이 튜토리얼에서는 캐나다를 선택하겠습니다. 또한 집을 감지하도록 모델을 훈련시킬 것이므로 드론 동영상에는 집이 공중에서 보이는 장면이 포함되어야 합니다.
다음으로, 인공 드론 촬영의 움직임을 캡처할 첫 번째와 마지막 시간 프레임을 설정할 수 있습니다. 드론 촬영의 시작 위치를 선택했으면 아래와 같이 파란색 다이아몬드를 사용하여 첫 번째 프레임을 설정합니다.
다음으로 드론의 목적지를 결정하기 위해 마지막 프레임을 선택할 수 있습니다. 이렇게 하면 드론 영상의 움직이는 효과를 만드는 데 도움이 됩니다. 이렇게 하려면 막대(아래 강조 표시됨)를 오른쪽으로 밀어서 특정 시간으로 이동하여 드론 촬영에 움직이는 효과를 만들 수 있습니다. 다시 한 번 파란색 다이아몬드를 사용하여 마지막 지점을 설정합니다.
마지막으로, 이 프로젝트를 저장하고 페이지 오른쪽 상단의 빨간색 '렌더링' 버튼을 클릭하여 렌더링할 수 있습니다. 이렇게 하면 드론 촬영의 최종 비디오 출력이 제공되어 인공 드론 비디오 영상을 성공적으로 만들 수 있습니다.
이제 인공 드론 비디오 영상을 만들었으니 다음 단계는 영상에 있는 집에 라벨을 붙이거나 주석을 다는 것입니다. 또한 영상의 개별 프레임을 분리해야 합니다.
이를 시작하기 위해 LabelImg를 설치합니다. LabelImg는 오픈 소스 이미지 라벨링 도구입니다. 다음 명령을 실행하여 터미널에서 pip 패키지 인스톨러를 사용하여 직접 설치할 수 있습니다: "pip install labelImg".
설치 후 터미널 또는 명령 프롬프트에서 'labelImg' 명령을 사용하여 도구를 실행할 수 있습니다. 그러면 아래와 같은 페이지가 표시됩니다.
한편, 온라인 동영상-이미지 변환기를 사용하거나 FFmpeg라는 도구를 사용하여 동영상을 프레임으로 분할할 수 있습니다. FFmpeg는 오디오, 비디오, 자막 및 관련 메타데이터와 같은 멀티미디어 콘텐츠를 처리하기 위한 라이브러리 및 도구 모음입니다.
다음 터미널 명령을 사용하여 드론 촬영 영상의 각 프레임을 분리할 수 있습니다:
ffmpeg -i input_video.mp4 -vf fps=1 frame_%04d.jpg
드론 영상의 프레임을 분리한 후에는 그 안에 있는 물체(집)에 라벨을 붙일 수 있습니다. LabelImg 도구를 통해 이미지 폴더로 이동하여 각 이미지의 객체에 라벨을 붙일 수 있습니다. 라벨이 지정된 모든 이미지를 저장하고 확인합니다. 이미지에 주석을 달았으면 이제 이 데이터를 사용하여 YOLO11 학습시킬 수 있습니다.
YOLO11 훈련을 시작하기 전에 이미지와 라벨을 정리해 보겠습니다. 먼저 'train'과 'valid'라는 이름의 폴더를 두 개 만듭니다. 이 폴더에 이미지를 분할합니다. 각 폴더 안에 아래와 같이 이미지와 해당 라벨 파일(텍스트 형식)을 위한 별도의 하위 폴더를 만듭니다.
그런 다음 다음과 같이 YOLO11 모델 학습을 시작할 수 있습니다:
from ultralytics import YOLO
# Load a YOLO11 model
model = YOLO("yolo11n.pt") # choose your model, e.g., YOLO11 nano
# Train the model with your data and settings
model.train(data="data.yaml", epochs=100, imgsz=640)
이제 훈련된 YOLO11 모델을 추론이라는 프로세스를 통해 예측에 사용할 수 있습니다. 추론은 모델을 사용하여 학습 중에 학습한 내용을 기반으로 보이지 않는 새로운 데이터를 분석하는 것입니다. 이 경우, 이 모델을 사용하여 이미지나 동영상에서 집과 같은 특정 객체를 찾아 그 주위에 경계 상자를 그려 레이블을 지정할 수 있습니다.
예측을 실행하려면 다음 Python 코드를 사용하여 입력 동영상에 대해 학습된 YOLO11 모델을 사용할 수 있습니다. 이 예제에서는 학습에 사용된 것과 동일한 인공 드론 동영상을 사용하지만 원하는 경우 다른 동영상 파일을 사용할 수 있습니다.
# Import library
from ultralytics import YOLO
# Load the YOLO model
model = YOLO("best.pt") # Choose your custom-trained model
# Predict the results from the model
results = model.predict(source="path/to/original/video.mp4", show=True, save=True)
이 코드를 실행하면 예측 및 바운딩 박스가 포함된 출력 비디오 파일이 저장됩니다.
드론 배송 패키지를 위한 주택 감지는 컴퓨터 비전과 YOLO11 어떻게 적용될 수 있는지 보여주는 한 가지 예일 뿐입니다. 다음은 컴퓨터 비전, YOLO11 및 항공 드론의 다른 실제 활용 사례입니다:
컴퓨터 비전으로 구동되는 AI 드론은 택배 배송부터 응급 상황과 농업 지원까지 다양한 산업 분야를 변화시키고 있습니다. 이 가이드에서는 인공 드론 비디오를 만들고, 그 안에 있는 사물에 라벨을 붙이고, YOLO11 학습시키고, 집을 감지하는 데 사용하는 방법을 안내합니다.
드론 영상에 물체 감지 기능을 적용하면 드론이 더 스마트해져 실시간으로 물체를 자동으로 인식하고 추적할 수 있습니다. 기술이 발전함에 따라 AI 기반 드론은 배송 속도를 높이고 보안을 개선하며 재난 대응을 지원하는 데 더욱 큰 역할을 할 것입니다.
커뮤니티에 가입하고 GitHub 리포지토리를 살펴보고 Vision AI에 대해 자세히 알아보고 라이선스 옵션을 확인하여 컴퓨터 비전 프로젝트를 시작하세요. 제조업의 AI 또는 자동차 산업의 컴퓨터 비전과 같은 혁신에 관심이 있으신가요? 솔루션 페이지를 방문하여 자세히 알아보세요.