Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Xây dựng các ứng dụng máy bay không người lái hỗ trợ AI với Ultralytics YOLO11

Abirami Vina

4 phút đọc

Ngày 18 tháng 4 năm 2025

Tìm hiểu cách xây dựng các ứng dụng máy bay không người lái (drone) hỗ trợ AI với Ultralytics YOLO11, cho phép nhận diện đối tượng theo thời gian thực và các tác vụ thị giác máy tính dựa trên máy bay không người lái.

Mua sắm tại cửa hàng và mua sắm trực tuyến có vẻ giống nhau, nhưng chúng dựa vào các hoạt động logistics khác nhau. Các cửa hàng cần bổ sung hàng hóa lên kệ, trong khi các đơn đặt hàng trực tuyến phụ thuộc vào việc giao hàng tận nhà. Nhờ những tiến bộ công nghệ, cả hai trải nghiệm mua sắm đang được định hình lại song song.

Ví dụ: một sự thay đổi lớn đang diễn ra trong lĩnh vực giao hàng. Máy bay không người lái (drone) hỗ trợ bởi AI đang thay đổi cách sản phẩm đến nhà chúng ta. Những máy bay không người lái thông minh này dự kiến sẽ xử lý khoảng 808 triệu lượt giao hàng trong thập kỷ tới, biến bầu trời thành tuyến đường giao hàng mới nhất cho thương mại hàng ngày.

Máy bay không người lái giao hàng sử dụng trí tuệ nhân tạo (AI) và thị giác máy tính, một lĩnh vực con của AI được sử dụng để phân tích dữ liệu trực quan, để điều hướng và di chuyển xung quanh các chướng ngại vật. Các mô hình thị giác máy tính như Ultralytics YOLO11 có thể giúp máy bay không người lái phát hiện và theo dõi các đối tượng trong thời gian thực, cho phép chúng hiểu rõ hơn và tương tác với môi trường của mình.

Hình 1. Một máy bay không người lái giao hàng đang mang một kiện hàng đến đích.

Các công ty như Meituan và DJI đã tích hợp thị giác máy tính vào máy bay không người lái của họ. Trên thực tế, việc áp dụng nhanh chóng máy bay không người lái trong nhiều ngành công nghiệp khác nhau đã thiết lập thị trường máy bay không người lái AI để tăng vọt lên 206,9 tỷ đô la vào năm 2031. 

Trong bài viết này, chúng ta sẽ xem xét kỹ hơn cách các mô hình thị giác máy tính như Ultralytics YOLO11 có thể được sử dụng trong các ứng dụng dựa trên drone như giao hàng bằng drone. Chúng ta sẽ xem xét một ví dụ minh họa cách các công nghệ này có thể được phát triển và thử nghiệm trước khi được sử dụng trong các tình huống thực tế.

Sử dụng Ultralytics YOLO11 trên máy bay không người lái để phát hiện nhà ở

Một phần quan trọng của máy bay không người lái giao hàng là khả năng phát hiện nhà khi chúng di chuyển. Để tái tạo khả năng này và hiểu cách nó hoạt động, chúng ta sẽ huấn luyện một mô hình thị giác máy tính có thể xác định nhà trong các cảnh quay được chụp bởi máy bay không người lái trên không. Chúng ta sẽ huấn luyện tùy chỉnh YOLO11 cho việc này, bao gồm tinh chỉnh một mô hình YOLO11 đã được huấn luyện trước để nhận dạng và phát hiện nhà bằng cách sử dụng các ví dụ được gắn nhãn.

Để làm được điều đó, chúng ta sẽ cần dữ liệu video chất lượng cao từ máy bay không người lái. Điều thú vị là ngay cả khi không có quyền truy cập vào máy bay không người lái thực tế, chúng ta vẫn có thể tạo ra các cảnh quay trên không chân thực. Hãy cùng xem cách thực hiện.

Tạo một cảnh quay bằng drone nhân tạo bằng Google Earth Studio

Google Earth Studio là một công cụ hoạt hình dựa trên web mà người dùng có thể sử dụng để tạo nội dung tĩnh và động bằng cách sử dụng hình ảnh vệ tinh và 3D của Google Earth. Chúng ta có thể sử dụng nó để tạo ra những thước phim trên không chân thực.

Bước đầu tiên là mở Google Earth Studio và tạo một dự án, như hình bên dưới. 

Bạn cần có tài khoản Google để đăng nhập.

Hình 2. Tạo một dự án trên Google Earth Studio.

Sau khi bạn đã đăng nhập, bạn có thể chọn một vị trí cho video drone nhân tạo của mình. Sử dụng thanh tìm kiếm ở góc trên cùng bên trái của trang, bạn có thể tìm kiếm các vị trí. Đối với hướng dẫn này, chúng ta sẽ chọn Canada. Ngoài ra, vì chúng ta sẽ huấn luyện một mô hình để phát hiện nhà ở, video drone của chúng ta nên có góc nhìn từ trên không của các ngôi nhà.

Hình 3. Chọn một vị trí bằng Google Earth Studio.

Tiếp theo, chúng ta có thể đặt khung thời gian đầu tiên và cuối cùng để ghi lại chuyển động của cảnh quay drone nhân tạo. Sau khi bạn đã chọn vị trí bắt đầu cho cảnh quay drone, hãy đặt khung hình đầu tiên bằng các hình thoi màu xanh lam, như hình bên dưới. 

Hình 4. Đặt khung hình đầu tiên bằng cách sử dụng các hình thoi màu xanh lam.

Tiếp theo, chúng ta có thể chọn khung hình cuối cùng để xác định điểm đến của drone. Điều này sẽ giúp chúng ta tạo hiệu ứng chuyển động cho cảnh quay từ drone. Để thực hiện việc này, hãy trượt thanh (được đánh dấu bên dưới) sang phải đến một thời điểm cụ thể để tạo hiệu ứng chuyển động cho cảnh quay drone. Một lần nữa, hãy sử dụng các hình thoi màu xanh lam để đặt điểm cuối cùng.

Hình 5. Đặt khung hình cuối cùng bằng cách di chuyển thanh trượt.

Cuối cùng, bạn có thể lưu dự án này và kết xuất nó bằng cách nhấp vào nút “Kết xuất” màu đỏ ở góc trên bên phải của trang. Thao tác này sẽ cung cấp cho bạn đầu ra video cuối cùng của cảnh quay bằng máy bay không người lái, tạo thành công cảnh quay video nhân tạo từ máy bay không người lái.

Hình 6. Kết xuất video đầu ra cuối cùng.

Cách gắn nhãn dữ liệu máy bay không người lái

Bây giờ chúng ta đã tạo cảnh quay video drone nhân tạo, bước tiếp theo là gắn nhãn hoặc chú thích các ngôi nhà trong đó. Chúng ta cũng cần tách các khung hình riêng lẻ của video. 

Để bắt đầu, chúng ta sẽ cài đặt LabelImg. LabelImg là một công cụ gắn nhãn hình ảnh mã nguồn mở. Bạn có thể cài đặt nó trực tiếp từ terminal bằng trình cài đặt gói pip bằng cách chạy lệnh sau: “pip install labelImg”.

Sau khi cài đặt, bạn có thể chạy công cụ bằng lệnh ‘labelImg’ trên terminal hoặc command prompt. Thao tác này sẽ đưa bạn đến trang hiển thị bên dưới.

Hình 7. Giao diện công cụ LabelImg.

Trong khi đó, chúng ta có thể sử dụng trình chuyển đổi video thành hình ảnh trực tuyến hoặc một công cụ có tên là FFmpeg để chia video thành các khung hình. FFmpeg là một tập hợp các thư viện và công cụ để xử lý nội dung đa phương tiện như âm thanh, video, phụ đề và siêu dữ liệu liên quan. 

Bạn có thể sử dụng lệnh terminal sau để tách từng khung hình của video quay bằng máy bay không người lái:

Sau khi tách các khung hình từ cảnh quay trên máy bay không người lái, chúng ta có thể bắt đầu gắn nhãn các đối tượng (nhà) trong đó. Bằng cách điều hướng đến thư mục hình ảnh thông qua công cụ LabelImg, chúng ta có thể gắn nhãn các đối tượng trong mỗi hình ảnh. Đảm bảo lưu và xác minh mọi hình ảnh đã gắn nhãn. Sau khi chú thích hình ảnh, bây giờ chúng ta có thể chuyển sang huấn luyện YOLO11 bằng dữ liệu này.

Hình 8. Một ví dụ về việc lưu trữ hình ảnh đã được gán nhãn.

Quy trình huấn luyện mô hình YOLO11

Trước khi bắt đầu huấn luyện YOLO11, chúng ta sẽ sắp xếp hình ảnh và nhãn của mình. Bắt đầu bằng cách tạo hai thư mục: một thư mục có tên là "train" và thư mục còn lại là "valid". Chia hình ảnh của bạn vào giữa các thư mục này. Bên trong mỗi thư mục, hãy tạo các thư mục con riêng biệt cho hình ảnh và các tệp nhãn tương ứng (định dạng văn bản), như hình bên dưới.

Hình 9. Một ví dụ về việc tạo thư mục hình ảnh và nhãn.

Sau đó, chúng ta có thể bắt đầu huấn luyện mô hình YOLO11 như sau:

  • Bước 1: Cài đặt gói Ultralytics Python. Bạn có thể thực hiện việc này bằng cách chạy lệnh “pip install ultralytics” trong terminal của bạn. Nếu bạn gặp bất kỳ sự cố cài đặt nào, hãy xem hướng dẫn khắc phục sự cố của chúng tôi để biết các mẹo và thủ thuật giúp bạn giải quyết chúng.
  • Bước 2: Sau khi cài đặt thành công gói, hãy tạo một tệp có tên ‘data.yaml’. Đây là một tệp cấu hình rất quan trọng để huấn luyện mô hình. Trong tệp data.yaml, hãy bao gồm các thông tin sau: đường dẫn đến tập dữ liệu huấn luyện của bạn, đường dẫn đến tập dữ liệu xác thực của bạn, số lượng lớp (nc) và danh sách tên lớp (names), như được hiển thị bên dưới.
Hình 10. Ví dụ về một file data.yaml.

  • Bước 3: Sau khi tệp ‘data.yaml’ được định cấu hình, bạn có thể bắt đầu huấn luyện mô hình của mình bằng mã Python sau. Mã này tải mô hình YOLO11 được huấn luyện trước và huấn luyện nó theo cấu hình của bạn.
from ultralytics import YOLO

# Load a YOLO11 model
model = YOLO("yolo11n.pt")  # choose your model, e.g., YOLO11 nano

# Train the model with your data and settings
model.train(data="data.yaml", epochs=100, imgsz=640)
  • Bước 4: Sau khi quá trình huấn luyện hoàn tất, bạn sẽ thấy một đầu ra tương tự như đầu ra được hiển thị bên dưới. Điều này có nghĩa là bạn đã huấn luyện thành công mô hình YOLO11 của mình cho các ứng dụng dựa trên máy bay không người lái.
Hình 11. Kết quả hiển thị sau khi huấn luyện mô hình.

Chạy dự đoán bằng Ultralytics YOLO11 trên máy bay không người lái

Mô hình YOLO11 đã huấn luyện giờ đây có thể được sử dụng để đưa ra dự đoán thông qua một quy trình gọi là suy luận. Suy luận bao gồm việc sử dụng mô hình để phân tích dữ liệu mới, chưa từng thấy dựa trên những gì nó đã học được trong quá trình huấn luyện. Trong trường hợp này, mô hình có thể được sử dụng để tìm và gắn nhãn các đối tượng cụ thể, chẳng hạn như nhà cửa, trong hình ảnh hoặc video bằng cách vẽ các hộp giới hạn xung quanh chúng.

Để chạy dự đoán, bạn có thể sử dụng mô hình YOLO11 đã được huấn luyện trên video đầu vào bằng mã Python sau. Trong ví dụ này, chúng ta sẽ sử dụng cùng một video drone nhân tạo đã được sử dụng để huấn luyện, nhưng bạn có thể sử dụng bất kỳ tệp video nào khác nếu bạn muốn.

# Import library
from ultralytics import YOLO

# Load the YOLO model
model = YOLO("best.pt")  # Choose your custom-trained model

# Predict the results from the model
results = model.predict(source="path/to/original/video.mp4", show=True, save=True)

Sau khi chạy đoạn mã này, tệp video đầu ra với các dự đoán và hộp giới hạn sẽ được lưu.

Hình 12. Một khung hình từ file video đầu ra. 

Tích hợp Ultralytics YOLO11 trên máy bay không người lái cho nhiều ứng dụng khác nhau

Phát hiện nhà để giao các gói hàng bằng máy bay không người lái chỉ là một ví dụ về cách thị giác máy tính và YOLO11 có thể được áp dụng. Dưới đây là một số ứng dụng thực tế khác của thị giác máy tính, YOLO11 và máy bay không người lái trên không:

  • Giám sát và an ninh: Máy bay không người lái AI có thể được sử dụng để giám sát các khu vực rộng lớn trong thời gian thực. Chúng có thể phát hiện xâm nhập, theo dõi các hoạt động đáng ngờ và tăng cường an ninh tại biên giới quốc gia cũng như các sự kiện công cộng lớn. 
  • Ứng phó thảm họa và tìm kiếm cứu nạn: Được trang bị camera nhiệt và phát hiện đối tượng, máy bay không người lái có thể giúp định vị những người sống sót trong vùng thảm họa. Chúng cũng có thể đánh giá thiệt hại và cung cấp vật tư khẩn cấp.
  • Nông nghiệp và canh tác chính xác: Máy bay không người lái tích hợp với thị giác máy tính có thể được sử dụng để phân tích sức khỏe cây trồng và phát hiện bệnh tật, giúp nông dân tăng năng suất đồng thời giảm chi phí. 
  • Lập bản đồ và phân tích không gian địa lý: Bằng cách thu thập bản đồ 3D độ phân giải cao, máy bay không người lái AI có thể hỗ trợ quy hoạch đô thị và khảo sát đất đai. Chúng cung cấp đánh giá địa hình nhanh hơn và chính xác hơn so với các phương pháp truyền thống. 

Những điều cần nhớ

Máy bay không người lái AI được hỗ trợ bởi thị giác máy tính đang thay đổi nhiều ngành công nghiệp, từ giao hàng đến hỗ trợ trong các trường hợp khẩn cấp và nông nghiệp. Trong hướng dẫn này, chúng ta đã xem qua việc tạo video máy bay không người lái nhân tạo, dán nhãn các đối tượng trong đó, đào tạo YOLO11 và sử dụng nó để phát hiện nhà.

Việc áp dụng object detection vào cảnh quay từ máy bay không người lái giúp chúng trở nên thông minh hơn, cho phép chúng tự động nhận diện và theo dõi các đối tượng trong thời gian thực. Khi công nghệ được cải thiện, máy bay không người lái điều khiển bằng AI có thể sẽ đóng một vai trò lớn hơn trong việc giao hàng nhanh hơn, cải thiện an ninh và hỗ trợ ứng phó với thảm họa.

Tham gia cộng đồng của chúng tôi và khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về Vision AI, đồng thời xem các tùy chọn cấp phép của chúng tôi để khởi động các dự án computer vision của bạn. Bạn quan tâm đến những đổi mới như AI trong sản xuất hoặc computer vision trong ngành công nghiệp ô tô? Hãy truy cập các trang giải pháp của chúng tôi để khám phá thêm. 

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard