Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay

Cách đánh giá chuẩn Ultralytics YOLO các mô hình như YOLO11

Abirami Vina

5 phút đọc

Ngày 28 tháng 4 năm 2025

Tìm hiểu cách đánh giá chuẩn Ultralytics YOLO11 , so sánh hiệu suất trên các thiết bị và khám phá các định dạng xuất khác nhau để tối ưu hóa tốc độ, độ chính xác và hiệu quả.

Với số lượng mô hình AI ngày càng tăng hiện nay, việc chọn mô hình phù hợp nhất cho ứng dụng AI cụ thể của bạn là điều cần thiết để đạt được kết quả chính xác và đáng tin cậy. Mỗi mô hình khác nhau về tốc độ, độ chính xác và hiệu suất tổng thể. Vậy, làm thế nào chúng ta có thể xác định mô hình nào phù hợp nhất cho một nhiệm vụ nhất định? Điều này đặc biệt quan trọng đối với các hệ thống thời gian thực như xe tự hành, giải pháp an ninh và robot, nơi việc ra quyết định nhanh chóng và đáng tin cậy là rất quan trọng.

Đánh giá điểm chuẩn giúp trả lời câu hỏi này bằng cách đánh giá một mô hình trong các điều kiện khác nhau. Nó cung cấp thông tin chi tiết về hiệu suất của mô hình trên các thiết lập và cấu hình phần cứng khác nhau, cho phép đưa ra quyết định sáng suốt hơn.

Ví dụ, Ultralytics YOLO11 là một mô hình thị giác máy tính hỗ trợ nhiều tác vụ phân tích dữ liệu trực quan như phát hiện đối tượng và phân đoạn thực thể. Để hiểu đầy đủ khả năng của nó, bạn có thể so sánh hiệu suất của nó trên các thiết lập khác nhau để xem nó xử lý các tình huống thực tế như thế nào.

Trong bài viết này, chúng ta sẽ khám phá cách đánh giá chuẩn các mô hình YOLO Ultralytics như YOLO11 , so sánh hiệu suất của chúng trên nhiều phần cứng khác nhau và xem các định dạng xuất khác nhau ảnh hưởng đến tốc độ và hiệu quả của chúng như thế nào. Hãy bắt đầu thôi!

Đánh giá hiệu năng mô hình (model benchmarking) là gì?

Khi sử dụng mô hình Vision AI trong một ứng dụng thực tế, làm thế nào bạn có thể biết liệu nó có đủ nhanh, chính xác và đáng tin cậy hay không? Việc đánh giá hiệu năng (benchmarking) của mô hình có thể cung cấp thông tin chi tiết để trả lời câu hỏi này. Đánh giá hiệu năng mô hình là quá trình kiểm tra và so sánh các mô hình AI khác nhau để xem mô hình nào hoạt động tốt nhất. 

Nó bao gồm việc thiết lập một đường cơ sở để so sánh, chọn các biện pháp hiệu suất phù hợp (như độ chính xác hoặc tốc độ) và kiểm tra tất cả các mô hình trong cùng điều kiện. Kết quả giúp xác định điểm mạnh và điểm yếu của từng mô hình, giúp bạn dễ dàng quyết định mô hình nào phù hợp nhất với giải pháp AI cụ thể của bạn. Đặc biệt, một bộ dữ liệu điểm chuẩn thường được sử dụng để cung cấp các so sánh công bằng và đánh giá mức độ hoạt động của một mô hình trong các tình huống thực tế khác nhau.

Hình 1. Tại sao cần benchmark các mô hình computer vision? Hình ảnh của tác giả.

Một ví dụ rõ ràng về lý do tại sao việc đánh giá hiệu năng (benchmarking) lại quan trọng là trong các ứng dụng thời gian thực như giám sát hoặc robot, nơi ngay cả những chậm trễ nhỏ cũng có thể ảnh hưởng đến việc ra quyết định. Đánh giá hiệu năng giúp đánh giá xem một mô hình có thể xử lý hình ảnh nhanh chóng mà vẫn cung cấp các dự đoán đáng tin cậy hay không. 

Nó cũng đóng một vai trò quan trọng trong việc xác định các nút thắt cổ chai về hiệu suất. Nếu một mô hình chạy chậm hoặc sử dụng quá nhiều tài nguyên, việc đo điểm chuẩn có thể tiết lộ liệu vấn đề có bắt nguồn từ giới hạn phần cứng, cấu hình mô hình hay định dạng xuất hay không. Những thông tin chi tiết này rất quan trọng để chọn thiết lập hiệu quả nhất.

So sánh việc đánh giá hiệu năng mô hình với việc đánh giá và kiểm thử mô hình

Đánh giá hiệu năng, đánh giá và kiểm thử mô hình là các thuật ngữ AI phổ biến được sử dụng cùng nhau. Mặc dù tương tự, nhưng chúng không giống nhau và có các chức năng khác nhau. Kiểm thử mô hình kiểm tra mức độ hoạt động của một mô hình bằng cách chạy nó trên một tập dữ liệu kiểm thử và đo lường các yếu tố như độ chính xác và tốc độ. Trong khi đó, đánh giá mô hình tiến thêm một bước bằng cách phân tích kết quả để hiểu điểm mạnh, điểm yếu của mô hình và mức độ hoạt động của nó trong các tình huống thực tế. Cả hai đều chỉ tập trung vào một mô hình tại một thời điểm.

Tuy nhiên, việc đánh giá chuẩn mô hình so sánh nhiều mô hình cạnh nhau bằng cách sử dụng cùng một bộ kiểm tra và bộ dữ liệu. Nó giúp tìm ra mô hình nào hoạt động tốt nhất cho một tác vụ cụ thể bằng cách làm nổi bật sự khác biệt về độ chính xác, tốc độ và hiệu quả giữa chúng. Trong khi kiểm tra và đánh giá tập trung vào một mô hình duy nhất, thì việc đánh giá chuẩn giúp chọn đúng mô hình (hoặc mô hình tốt nhất) bằng cách so sánh các tùy chọn khác nhau một cách công bằng.

Hình 2. Sự khác biệt giữa đo điểm chuẩn mô hình với đánh giá và thử nghiệm. Hình ảnh của tác giả.

Tổng quan về Ultralytics YOLO11

Ultralytics YOLO11 là một mô hình AI thị giác đáng tin cậy được thiết kế để thực hiện chính xác nhiều tác vụ thị giác máy tính . Nó cải thiện các YOLO các phiên bản mô hình và được tích hợp nhiều tính năng có thể giúp giải quyết các vấn đề thực tế. Ví dụ, nó có thể được sử dụng để detect các vật thể, classify hình ảnh, segment các vùng, track chuyển động, v.v. Nó cũng có thể được sử dụng trong các ứng dụng trên nhiều ngành công nghiệp, từ an ninh đến tự động hóa và phân tích.

Hình 3. Một ví dụ về việc sử dụng YOLO11 ĐẾN segment người trong một hình ảnh.

Một trong những lợi ích chính liên quan đến Ultralytics YOLO11 là cách sử dụng dễ dàng. Chỉ với vài dòng mã, bất kỳ ai cũng có thể tích hợp nó vào các dự án AI của mình mà không cần phải thiết lập phức tạp hay đòi hỏi chuyên môn kỹ thuật cao. 

Nó cũng hoạt động trơn tru trên các phần cứng khác nhau, chạy hiệu quả trên CPU (Bộ xử lý trung tâm), GPU (Bộ xử lý đồ họa) và các bộ tăng tốc AI chuyên dụng khác. Cho dù được triển khai trên các thiết bị biên hay máy chủ đám mây, nó đều mang lại hiệu suất mạnh mẽ. 

YOLO11 có sẵn ở nhiều kích cỡ mô hình khác nhau, mỗi kích cỡ được tối ưu hóa cho các tác vụ khác nhau. Việc so sánh chuẩn giúp xác định phiên bản nào phù hợp nhất với nhu cầu cụ thể của bạn. Ví dụ, một thông tin chi tiết quan trọng mà việc so sánh chuẩn có thể tiết lộ là các mô hình nhỏ hơn, chẳng hạn như nano hoặc nhỏ, có xu hướng chạy nhanh hơn nhưng có thể đánh đổi một số độ chính xác.

Cách đánh giá chuẩn YOLO các mô hình như YOLO11

Bây giờ chúng ta đã hiểu benchmarking là gì và tầm quan trọng của nó. Hãy cùng tìm hiểu cách bạn có thể benchmarking. YOLO các mô hình như YOLO11 và đánh giá hiệu quả của chúng để thu thập những hiểu biết có giá trị.

Để bắt đầu, bạn có thể cài đặt gói Ultralytics Python bằng cách chạy lệnh sau trong terminal hoặc dấu nhắc lệnh: “ pip install ultralytics ”. Nếu gặp bất kỳ sự cố nào trong quá trình cài đặt, hãy tham khảo Hướng dẫn về các sự cố thường gặp của chúng tôi để biết các mẹo khắc phục sự cố.

Sau khi gói được cài đặt, bạn có thể dễ dàng đánh giá chuẩn YOLO11 chỉ với một vài dòng Python mã số:

from ultralytics.utils.benchmarks import benchmark

# Benchmark on GPU
benchmark(model="yolo11n.pt", data="coco8.yaml", imgsz=640, half=False, device=0)

Khi bạn chạy đoạn mã được hiển thị ở trên, nó sẽ tính toán tốc độ mô hình xử lý hình ảnh, số lượng khung hình mà nó có thể xử lý trong một giây và độ chính xác của nó trong việc phát hiện đối tượng. 

Việc nhắc đến “coco8. yaml ” trong mã đề cập đến tệp cấu hình tập dữ liệu dựa trên tập dữ liệu COCO8 (Đối tượng chung trong ngữ cảnh) - một phiên bản mẫu nhỏ của toàn bộ COCO tập dữ liệu, thường được sử dụng để thử nghiệm và thực nghiệm.

Nếu bạn đang thử nghiệm YOLO11 đối với một ứng dụng cụ thể, chẳng hạn như giám sát giao thông hoặc hình ảnh y tế, việc sử dụng tập dữ liệu có liên quan (ví dụ: tập dữ liệu giao thông hoặc tập dữ liệu y tế) sẽ mang lại thông tin chi tiết chính xác hơn. So sánh với COCO cung cấp ý tưởng chung về hiệu suất, nhưng để có kết quả tốt nhất, bạn có thể chọn tập dữ liệu phản ánh trường hợp sử dụng thực tế của mình.

Hiểu biết YOLO11 đầu ra chuẩn mực

Một lần YOLO11 đã được đánh giá chuẩn, bước tiếp theo là diễn giải kết quả. Sau khi chạy đánh giá chuẩn, bạn sẽ thấy nhiều số liệu khác nhau trong kết quả. Các số liệu này giúp đánh giá hiệu quả YOLO11 thực hiện về mặt độ chính xác và tốc độ. 

Dưới đây là một số đáng chú ý YOLO11 các số liệu đánh giá chuẩn cần chú ý:

  • mAP50 -95: Đo độ chính xác phát hiện vật thể. Giá trị càng cao nghĩa là mô hình càng nhận dạng vật thể tốt hơn.
  • accuracy_top5: Nó thường được sử dụng cho các tác vụ phân loại. Nó cho biết tần suất nhãn chính xác xuất hiện trong năm dự đoán hàng đầu.
  • Thời gian suy luận: Thời gian cần thiết để xử lý một hình ảnh duy nhất, được đo bằng mili giây. Giá trị thấp hơn có nghĩa là xử lý nhanh hơn.
Hình 4. Một đồ thị hiển thị YOLO11 hiệu suất chuẩn của.

Các yếu tố khác cần xem xét khi đánh giá chuẩn YOLO11 

Chỉ xem xét kết quả benchmark thôi thì chưa đủ. Để hiểu rõ hơn về hiệu suất, việc so sánh các cài đặt và tùy chọn phần cứng khác nhau là rất hữu ích. Dưới đây là một vài điều quan trọng cần xem xét:

  • GPU so với CPU : GPU có thể xử lý hình ảnh nhanh hơn nhiều so với CPU. Việc đánh giá hiệu năng giúp bạn xem liệu CPU đủ nhanh cho nhu cầu của bạn hoặc nếu bạn sẽ được hưởng lợi từ việc sử dụng GPU .
  • Cài đặt độ chính xác (FP32, FP16, INT8): Các cài đặt này kiểm soát cách mô hình xử lý các con số. Độ chính xác thấp hơn (như FP16 hoặc INT8) làm cho mô hình chạy nhanh hơn và sử dụng ít bộ nhớ hơn, nhưng nó có thể làm giảm độ chính xác một chút.
  • Định dạng xuất : Chuyển đổi mô hình sang định dạng như TensorRT có thể giúp ứng dụng chạy nhanh hơn nhiều trên một số phần cứng nhất định. Điều này hữu ích nếu bạn đang tối ưu hóa tốc độ trên các thiết bị cụ thể.

Cách đánh giá chuẩn YOLO11 trên phần cứng khác nhau

Các Ultralytics Python gói cho phép bạn chuyển đổi YOLO11 Các mô hình được chuyển đổi sang các định dạng khác nhau, chạy hiệu quả hơn trên phần cứng cụ thể, cải thiện cả tốc độ và mức sử dụng bộ nhớ. Mỗi định dạng xuất được tối ưu hóa cho các thiết bị khác nhau. 

Một mặt, định dạng ONNX có thể tăng tốc hiệu suất trên nhiều môi trường khác nhau. Mặt khác, OpenVINO cải thiện hiệu quả trên Intel phần cứng và các định dạng như CoreML hoặc TF SavedModel lý tưởng cho các thiết bị Apple và ứng dụng di động. 

Chúng ta hãy cùng xem cách bạn có thể đánh giá chuẩn YOLO11 theo một định dạng cụ thể. Mã bên dưới là điểm chuẩn YOLO11 trong ONNX định dạng được sử dụng rộng rãi để chạy các mô hình AI trên cả CPU và GPU.

from ultralytics.utils.benchmarks import benchmark  

# Benchmark a specific export format (e.g., ONNX)  
benchmark(model="yolo11n.pt", data="coco8.yaml", imgsz=640, format="onnx")

Ngoài kết quả đánh giá chuẩn, việc lựa chọn định dạng phù hợp còn phụ thuộc vào thông số kỹ thuật và nhu cầu triển khai của hệ thống. Ví dụ: xe tự lái cần phát hiện vật thể nhanh. Nếu bạn dự định sử dụng NVIDIA GPU để tăng tốc hiệu suất, TensorRT định dạng là sự lựa chọn lý tưởng để chạy YOLO11 trên một NVIDIA GPU .

Hình 5. Sử dụng YOLO11 để phát hiện vật thể trên xe tự lái.

Những điều cần nhớ

Các Ultralytics Python gói làm chuẩn mực YOLO11 dễ dàng bằng cách cung cấp các lệnh đơn giản có thể xử lý kiểm tra hiệu suất cho bạn. Chỉ với vài bước, bạn có thể thấy các thiết lập khác nhau ảnh hưởng đến tốc độ và độ chính xác của mô hình như thế nào, giúp bạn đưa ra lựa chọn sáng suốt mà không cần chuyên môn kỹ thuật sâu rộng.

Phần cứng và cài đặt phù hợp cũng có thể tạo ra sự khác biệt lớn. Việc điều chỉnh các thông số như kích thước mô hình và tập dữ liệu cho phép bạn tinh chỉnh YOLO11 để có hiệu suất tốt nhất, cho dù bạn đang chạy nó trên một máy tính cao cấp GPU hoặc cục bộ trên thiết bị biên.

Kết nối với cộng đồng của chúng tôi và khám phá các dự án AI tiên tiến trên kho lưu trữ GitHub của chúng tôi. Tìm hiểu về tác động của AI trong nông nghiệp và vai trò của thị giác máy tính trong sản xuất thông qua các trang giải pháp của chúng tôi. Khám phá các gói cấp phép của chúng tôi và bắt đầu hành trình AI của bạn ngay bây giờ!

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí