Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Cách đánh giá hiệu năng các mô hình Ultralytics YOLO như YOLO11

Abirami Vina

5 phút đọc

Ngày 28 tháng 4 năm 2025

Tìm hiểu cách đánh giá hiệu năng (benchmark) Ultralytics YOLO11, so sánh hiệu suất trên các thiết bị và khám phá các định dạng xuất khác nhau để tối ưu hóa tốc độ, độ chính xác và hiệu quả.

Với số lượng mô hình AI ngày càng tăng hiện nay, việc chọn mô hình phù hợp nhất cho ứng dụng AI cụ thể của bạn là điều cần thiết để đạt được kết quả chính xác và đáng tin cậy. Mỗi mô hình khác nhau về tốc độ, độ chính xác và hiệu suất tổng thể. Vậy, làm thế nào chúng ta có thể xác định mô hình nào phù hợp nhất cho một nhiệm vụ nhất định? Điều này đặc biệt quan trọng đối với các hệ thống thời gian thực như xe tự hành, giải pháp an ninh và robot, nơi việc ra quyết định nhanh chóng và đáng tin cậy là rất quan trọng.

Đánh giá điểm chuẩn giúp trả lời câu hỏi này bằng cách đánh giá một mô hình trong các điều kiện khác nhau. Nó cung cấp thông tin chi tiết về hiệu suất của mô hình trên các thiết lập và cấu hình phần cứng khác nhau, cho phép đưa ra quyết định sáng suốt hơn.

Ví dụ: Ultralytics YOLO11 là một mô hình thị giác máy tính hỗ trợ các tác vụ phân tích dữ liệu trực quan khác nhau như phát hiện đối tượng và phân vùng thể hiện. Để hiểu đầy đủ khả năng của nó, bạn có thể đánh giá hiệu suất của nó trên các thiết lập khác nhau để xem nó sẽ xử lý các tình huống thực tế như thế nào.

Trong bài viết này, chúng ta sẽ khám phá cách đo điểm chuẩn các mô hình Ultralytics YOLO như YOLO11, so sánh hiệu suất của chúng trên các phần cứng khác nhau và xem các định dạng xuất khác nhau ảnh hưởng đến tốc độ và hiệu quả của chúng như thế nào. Hãy cùng bắt đầu!

Đánh giá hiệu năng mô hình (model benchmarking) là gì?

Khi sử dụng mô hình Vision AI trong một ứng dụng thực tế, làm thế nào bạn có thể biết liệu nó có đủ nhanh, chính xác và đáng tin cậy hay không? Việc đánh giá hiệu năng (benchmarking) của mô hình có thể cung cấp thông tin chi tiết để trả lời câu hỏi này. Đánh giá hiệu năng mô hình là quá trình kiểm tra và so sánh các mô hình AI khác nhau để xem mô hình nào hoạt động tốt nhất. 

Nó bao gồm việc thiết lập một đường cơ sở để so sánh, chọn các biện pháp hiệu suất phù hợp (như độ chính xác hoặc tốc độ) và kiểm tra tất cả các mô hình trong cùng điều kiện. Kết quả giúp xác định điểm mạnh và điểm yếu của từng mô hình, giúp bạn dễ dàng quyết định mô hình nào phù hợp nhất với giải pháp AI cụ thể của bạn. Đặc biệt, một bộ dữ liệu điểm chuẩn thường được sử dụng để cung cấp các so sánh công bằng và đánh giá mức độ hoạt động của một mô hình trong các tình huống thực tế khác nhau.

Hình 1. Tại sao cần benchmark các mô hình computer vision? Hình ảnh của tác giả.

Một ví dụ rõ ràng về lý do tại sao việc đánh giá hiệu năng (benchmarking) lại quan trọng là trong các ứng dụng thời gian thực như giám sát hoặc robot, nơi ngay cả những chậm trễ nhỏ cũng có thể ảnh hưởng đến việc ra quyết định. Đánh giá hiệu năng giúp đánh giá xem một mô hình có thể xử lý hình ảnh nhanh chóng mà vẫn cung cấp các dự đoán đáng tin cậy hay không. 

Nó cũng đóng một vai trò quan trọng trong việc xác định các nút thắt cổ chai về hiệu suất. Nếu một mô hình chạy chậm hoặc sử dụng quá nhiều tài nguyên, việc đo điểm chuẩn có thể tiết lộ liệu vấn đề có bắt nguồn từ giới hạn phần cứng, cấu hình mô hình hay định dạng xuất hay không. Những thông tin chi tiết này rất quan trọng để chọn thiết lập hiệu quả nhất.

So sánh việc đánh giá hiệu năng mô hình với việc đánh giá và kiểm thử mô hình

Đánh giá hiệu năng, đánh giá và kiểm thử mô hình là các thuật ngữ AI phổ biến được sử dụng cùng nhau. Mặc dù tương tự, nhưng chúng không giống nhau và có các chức năng khác nhau. Kiểm thử mô hình kiểm tra mức độ hoạt động của một mô hình bằng cách chạy nó trên một tập dữ liệu kiểm thử và đo lường các yếu tố như độ chính xác và tốc độ. Trong khi đó, đánh giá mô hình tiến thêm một bước bằng cách phân tích kết quả để hiểu điểm mạnh, điểm yếu của mô hình và mức độ hoạt động của nó trong các tình huống thực tế. Cả hai đều chỉ tập trung vào một mô hình tại một thời điểm.

Tuy nhiên, việc đánh giá chuẩn mô hình so sánh nhiều mô hình cạnh nhau bằng cách sử dụng cùng một bộ kiểm tra và bộ dữ liệu. Nó giúp tìm ra mô hình nào hoạt động tốt nhất cho một tác vụ cụ thể bằng cách làm nổi bật sự khác biệt về độ chính xác, tốc độ và hiệu quả giữa chúng. Trong khi kiểm tra và đánh giá tập trung vào một mô hình duy nhất, thì việc đánh giá chuẩn giúp chọn đúng mô hình (hoặc mô hình tốt nhất) bằng cách so sánh các tùy chọn khác nhau một cách công bằng.

Hình 2. Sự khác biệt giữa đo điểm chuẩn mô hình với đánh giá và thử nghiệm. Hình ảnh của tác giả.

Tổng quan về Ultralytics YOLO11

Ultralytics YOLO11 là một mô hình Vision AI đáng tin cậy, được thiết kế để thực hiện nhiều tác vụ computer vision một cách chính xác. Nó cải thiện so với các phiên bản mô hình YOLO trước đó và được tích hợp nhiều tính năng có thể giúp giải quyết các vấn đề trong thế giới thực. Ví dụ: nó có thể được sử dụng để phát hiện đối tượng, phân loại hình ảnh, phân vùng khu vực, theo dõi chuyển động, v.v. Nó cũng có thể được sử dụng trong các ứng dụng trên nhiều ngành công nghiệp, từ an ninh đến tự động hóa và phân tích.

Hình 3. Một ví dụ về việc sử dụng YOLO11 để phân vùng người trong ảnh.

Một trong những lợi ích chính liên quan đến Ultralytics YOLO11 là cách nó dễ sử dụng. Chỉ với một vài dòng code, bất kỳ ai cũng có thể tích hợp nó vào các dự án AI của họ mà không cần phải đối phó với các thiết lập phức tạp hoặc kiến thức chuyên môn kỹ thuật nâng cao. 

Nó cũng hoạt động trơn tru trên các phần cứng khác nhau, chạy hiệu quả trên CPU (Bộ xử lý trung tâm), GPU (Bộ xử lý đồ họa) và các bộ tăng tốc AI chuyên dụng khác. Cho dù được triển khai trên các thiết bị biên hay máy chủ đám mây, nó đều mang lại hiệu suất mạnh mẽ. 

YOLO11 có sẵn với nhiều kích thước mô hình khác nhau, mỗi kích thước được tối ưu hóa cho các tác vụ khác nhau. Điểm chuẩn giúp xác định phiên bản nào phù hợp nhất với nhu cầu cụ thể của bạn. Ví dụ: một thông tin chi tiết quan trọng mà điểm chuẩn có thể tiết lộ là các mô hình nhỏ hơn, chẳng hạn như nano hoặc small, có xu hướng chạy nhanh hơn nhưng có thể đánh đổi một số độ chính xác.

Cách đánh giá hiệu năng các mô hình YOLO như YOLO11

Sau khi hiểu rõ về đo điểm chuẩn và tầm quan trọng của nó, hãy cùng tìm hiểu cách bạn có thể đo điểm chuẩn các mô hình YOLO như YOLO11 và đánh giá hiệu quả của chúng để thu thập những hiểu biết có giá trị.

Để bắt đầu, bạn có thể cài đặt gói Ultralytics Python bằng cách chạy lệnh sau trong terminal hoặc dấu nhắc lệnh của bạn: “pip install ultralytics”. Nếu bạn gặp bất kỳ sự cố nào trong quá trình cài đặt, hãy xem Hướng dẫn về các sự cố thường gặp của chúng tôi để biết các mẹo khắc phục sự cố.

Sau khi gói được cài đặt, bạn có thể dễ dàng đánh giá hiệu năng YOLO11 chỉ với một vài dòng mã Python:

from ultralytics.utils.benchmarks import benchmark

# Benchmark on GPU
benchmark(model="yolo11n.pt", data="coco8.yaml", imgsz=640, half=False, device=0)

Khi bạn chạy đoạn mã được hiển thị ở trên, nó sẽ tính toán tốc độ mô hình xử lý hình ảnh, số lượng khung hình mà nó có thể xử lý trong một giây và độ chính xác của nó trong việc phát hiện đối tượng. 

Đề cập đến "coco8.yaml" trong mã đề cập đến tệp cấu hình bộ dữ liệu dựa trên bộ dữ liệu COCO8 (Common Objects in Context) - một phiên bản mẫu nhỏ của bộ dữ liệu COCO đầy đủ, thường được sử dụng để thử nghiệm.

Nếu bạn đang thử nghiệm YOLO11 cho một ứng dụng cụ thể, chẳng hạn như giám sát giao thông hoặc chụp ảnh y tế, thì việc sử dụng một bộ dữ liệu phù hợp (ví dụ: bộ dữ liệu giao thông hoặc bộ dữ liệu y tế) sẽ cung cấp thông tin chi tiết chính xác hơn. Điểm chuẩn với COCO cung cấp một ý tưởng chung về hiệu suất, nhưng để có kết quả tốt nhất, bạn có thể chọn một bộ dữ liệu phản ánh trường hợp sử dụng thực tế của bạn.

Tìm hiểu về các kết quả điểm chuẩn YOLO11

Sau khi YOLO11 đã được đánh giá điểm chuẩn, bước tiếp theo là diễn giải kết quả. Sau khi chạy điểm chuẩn, bạn sẽ thấy nhiều số liệu khác nhau trong kết quả. Các số liệu này giúp đánh giá hiệu suất của YOLO11 về độ chính xác và tốc độ. 

Dưới đây là một số chỉ số điểm chuẩn YOLO11 đáng chú ý cần theo dõi:

  • mAP50-95: Đo lường độ chính xác của việc phát hiện đối tượng. Giá trị càng cao có nghĩa là mô hình nhận dạng đối tượng càng tốt.
  • accuracy_top5: Nó thường được sử dụng cho các tác vụ phân loại. Nó cho biết tần suất nhãn chính xác xuất hiện trong năm dự đoán hàng đầu.
  • Thời gian suy luận: Thời gian cần thiết để xử lý một hình ảnh duy nhất, được đo bằng mili giây. Giá trị thấp hơn có nghĩa là xử lý nhanh hơn.
Hình 4. Đồ thị thể hiện hiệu suất benchmark của YOLO11.

Các yếu tố khác cần xem xét khi đánh giá hiệu năng YOLO11 

Chỉ xem xét kết quả benchmark thôi thì chưa đủ. Để hiểu rõ hơn về hiệu suất, việc so sánh các cài đặt và tùy chọn phần cứng khác nhau là rất hữu ích. Dưới đây là một vài điều quan trọng cần xem xét:

  • GPU so với CPU: GPU có thể xử lý hình ảnh nhanh hơn nhiều so với CPU. Điểm chuẩn giúp bạn biết liệu CPU có đủ nhanh cho nhu cầu của bạn hay bạn sẽ được lợi khi sử dụng GPU hay không.
  • Cài đặt độ chính xác (FP32, FP16, INT8): Các cài đặt này kiểm soát cách mô hình xử lý các con số. Độ chính xác thấp hơn (như FP16 hoặc INT8) làm cho mô hình chạy nhanh hơn và sử dụng ít bộ nhớ hơn, nhưng nó có thể làm giảm độ chính xác một chút.
  • Định dạng xuất: Chuyển đổi mô hình sang một định dạng như TensorRT có thể làm cho nó chạy nhanh hơn nhiều trên một số phần cứng nhất định. Điều này hữu ích nếu bạn đang tối ưu hóa tốc độ trên các thiết bị cụ thể.

Cách đánh giá hiệu năng YOLO11 trên các phần cứng khác nhau

Gói Ultralytics Python cho phép bạn chuyển đổi các mô hình YOLO11 thành các định dạng khác nhau, chạy hiệu quả hơn trên phần cứng cụ thể, cải thiện cả tốc độ và mức sử dụng bộ nhớ. Mỗi định dạng xuất được tối ưu hóa cho các thiết bị khác nhau. 

Một mặt, định dạng ONNX có thể tăng tốc hiệu suất trên nhiều môi trường khác nhau. Mặt khác, OpenVINO cải thiện hiệu quả trên phần cứng Intel và các định dạng như CoreML hoặc TF SavedModel là lý tưởng cho các thiết bị Apple và các ứng dụng di động. 

Hãy cùng xem cách bạn có thể đánh giá hiệu năng của YOLO11 ở một định dạng cụ thể. Đoạn mã dưới đây đánh giá hiệu năng của YOLO11 ở định dạng ONNX, một định dạng được sử dụng rộng rãi để chạy các mô hình AI trên cả CPU và GPU.

from ultralytics.utils.benchmarks import benchmark  

# Benchmark a specific export format (e.g., ONNX)  
benchmark(model="yolo11n.pt", data="coco8.yaml", imgsz=640, format="onnx")

Ngoài các kết quả điểm chuẩn, việc chọn đúng định dạng phụ thuộc vào thông số kỹ thuật hệ thống và nhu cầu triển khai của bạn. Ví dụ: xe tự lái cần phát hiện đối tượng nhanh chóng. Nếu bạn định sử dụng GPU NVIDIA để tăng tốc hiệu suất, định dạng TensorRT là lựa chọn lý tưởng để chạy YOLO11 trên GPU NVIDIA.

Hình 5. Sử dụng YOLO11 để phát hiện đối tượng trong xe tự lái.

Những điều cần nhớ

Gói Ultralytics Python giúp việc đánh giá hiệu năng YOLO11 trở nên dễ dàng bằng cách cung cấp các lệnh đơn giản có thể xử lý kiểm tra hiệu năng cho bạn. Chỉ với một vài bước, bạn có thể thấy các thiết lập khác nhau ảnh hưởng đến tốc độ và độ chính xác của mô hình như thế nào, giúp bạn đưa ra lựa chọn sáng suốt mà không cần kiến thức chuyên môn sâu.

Phần cứng và cài đặt phù hợp cũng có thể tạo ra sự khác biệt lớn. Điều chỉnh các tham số như kích thước mô hình và tập dữ liệu cho phép bạn tinh chỉnh YOLO11 để có hiệu suất tốt nhất, cho dù bạn đang chạy nó trên GPU cao cấp hay cục bộ trên một thiết bị biên.

Kết nối với cộng đồng của chúng tôi và khám phá các dự án AI tiên tiến trên kho lưu trữ GitHub của chúng tôi. Tìm hiểu về tác động của AI trong nông nghiệp và vai trò của thị giác máy tính trong sản xuất thông qua các trang giải pháp của chúng tôi. Khám phá các gói cấp phép của chúng tôi và bắt đầu hành trình AI của bạn ngay bây giờ!

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard