Yolo Vision Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Intersection over Union (IoU)

Tìm hiểu Intersection over Union (IoU) là gì, cách tính IoU và vai trò quan trọng của nó trong object detection và đánh giá mô hình AI.

Intersection over Union (IoU) là một chỉ số đánh giá cơ bản được sử dụng trong thị giác máy tính (CV), đặc biệt đối với các tác vụ phát hiện đối tượng. Nó đo lường sự chồng chéo giữa hai ranh giới: hộp giới hạn được dự đoán do mô hình tạo ra và hộp giới hạn ground-truth, là đường viền chính xác được gắn nhãn thủ công. Điểm số thu được, một giá trị từ 0 đến 1, định lượng mức độ chính xác của mô hình trong việc xác định vị trí của một đối tượng trong một hình ảnh. Điểm 1 thể hiện sự phù hợp hoàn hảo, trong khi điểm 0 cho biết hoàn toàn không có sự chồng chéo nào. Chỉ số này rất quan trọng để đánh giá độ chính xác định vị của các mô hình như Ultralytics YOLO11.

Cách IoU hoạt động

Về cốt lõi, IoU tính tỷ lệ giao (diện tích chồng lên nhau) trên hợp (tổng diện tích được bao phủ bởi cả hai hộp) của bounding box được dự đoán và ground-truth. Hãy tưởng tượng hai hình vuông chồng lên nhau. "Giao" là diện tích chung nơi chúng chồng lên nhau. "Hợp" là tổng diện tích mà cả hai hình vuông bao phủ kết hợp, chỉ tính phần chồng lên nhau một lần. Bằng cách chia giao cho hợp, IoU cung cấp một thước đo tiêu chuẩn về mức độ căn chỉnh của hộp được dự đoán với đối tượng thực tế. Khái niệm đơn giản nhưng mạnh mẽ này là nền tảng của deep learning (DL) hiện đại để phát hiện đối tượng.

Một phần quan trọng của việc sử dụng IoU là thiết lập một "ngưỡng IoU". Ngưỡng này là một giá trị được xác định trước (ví dụ: 0,5) để xác định xem một dự đoán có chính xác hay không. Nếu điểm IoU cho một hộp dự đoán cao hơn ngưỡng này, nó được phân loại là "true positive" (dương tính thật). Nếu điểm thấp hơn, nó là "false positive" (dương tính giả). Ngưỡng này ảnh hưởng trực tiếp đến các số liệu hiệu suất khác như Độ chính xác (Precision)Độ phủ (Recall), và là một thành phần quan trọng trong việc tính toán độ chính xác trung bình (mAP), một số liệu tiêu chuẩn để đánh giá các mô hình phát hiện đối tượng trên các tập dữ liệu benchmark như COCO.

Các Ứng dụng Thực tế

IoU rất quan trọng để xác thực hiệu suất của vô số hệ thống AI. Dưới đây là một vài ví dụ:

  1. Lái xe tự động: Trong AI cho xe tự lái, IoU được sử dụng để đánh giá mức độ hệ thống thị giác của xe phát hiện người đi bộ, các phương tiện khác và biển báo giao thông. Điểm IoU cao đảm bảo rằng các bounding box được dự đoán là chính xác, điều này rất quan trọng để điều hướng an toàn và tránh va chạm. Các công ty như Waymo phụ thuộc rất nhiều vào khả năng nhận diện đối tượng chính xác để đảm bảo an toàn cho các hệ thống tự hành của họ.
  2. Chẩn đoán hình ảnh y tế: Trong phân tích hình ảnh y tế, IoU giúp đánh giá độ chính xác của các mô hình xác định các dị thường như khối u hoặc tổn thương trong ảnh chụp như MRI hoặc CT. Định vị chính xác là rất quan trọng để lập kế hoạch điều trị và IoU cung cấp một thước đo đáng tin cậy về việc liệu dự đoán của mô hình có hữu ích về mặt lâm sàng hay không. Điều này rất quan trọng trong các ứng dụng như phát hiện khối u bằng mô hình YOLO.

Nâng cao hiệu suất mô hình với IoU

IoU không chỉ là một số liệu đánh giá; nó còn là một phần không thể thiếu trong quá trình huấn luyện. Nhiều kiến trúc phát hiện đối tượng hiện đại, bao gồm các biến thể của Ultralytics YOLOv8 và YOLO11, sử dụng trực tiếp IoU hoặc các biến thể của nó trong hàm mất mát (loss functions). Các loss function dựa trên IoU nâng cao này, chẳng hạn như Generalized IoU (GIoU), Distance-IoU (DIoU) hoặc Complete-IoU (CIoU), giúp mô hình học cách dự đoán các bounding box không chỉ chồng lấp tốt mà còn xem xét các yếu tố như khoảng cách giữa các tâm và tính nhất quán của tỷ lệ khung hình. Điều này dẫn đến sự hội tụ nhanh hơn và hiệu suất định vị tốt hơn so với các loss function hồi quy truyền thống. Bạn có thể tìm thấy so sánh chi tiết giữa các mô hình YOLO khác nhau trong tài liệu của chúng tôi.

Việc theo dõi IoU trong quá trình huấn luyện mô hìnhđiều chỉnh siêu tham số giúp các nhà phát triển tinh chỉnh mô hình để định vị tốt hơn. Các công cụ như Ultralytics HUB cho phép theo dõi IoU và các số liệu khác, hợp lý hóa chu trình cải thiện mô hình. Mặc dù được sử dụng rộng rãi, IoU tiêu chuẩn đôi khi có thể không nhạy, đặc biệt đối với các hộp không chồng chéo. Hạn chế này đã thúc đẩy sự phát triển của các biến thể IoU đã đề cập ở trên. Tuy nhiên, IoU vẫn là nền tảng của đánh giá thị giác máy tính.

IoU so với các số liệu khác

Mặc dù IoU rất quan trọng, nhưng điều quan trọng là phải hiểu mối quan hệ của nó với các số liệu khác:

  • IoU so với Độ chính xác: Độ chính xác là một chỉ số phổ biến trong các tác vụ phân loại, đo lường tỷ lệ phần trăm dự đoán chính xác. Tuy nhiên, nó không phù hợp để phát hiện đối tượng vì nó không tính đến lỗi bản địa hóa. Một dự đoán có thể phân loại chính xác một đối tượng nhưng đặt bounding box không tốt. IoU đặc biệt giải quyết vấn đề này bằng cách đo lường chất lượng của bản địa hóa.
  • IoU so với độ chính xác trung bình (mAP): Các thuật ngữ này có liên quan nhưng khác biệt. IoU đo lường chất lượng của một bounding box được dự đoán. Ngược lại, mAP là một chỉ số toàn diện đánh giá hiệu suất của mô hình trên tất cả các đối tượng và lớp trong một bộ dữ liệu. Nó được tính bằng cách lấy trung bình các giá trị độ chính xác trên nhiều ngưỡng IoU và tất cả các lớp. Về cơ bản, IoU là một khối xây dựng để tính toán mAP. Một giải thích chi tiết về mối quan hệ này có thể được tìm thấy trong hướng dẫn của chúng tôi về các chỉ số hiệu suất YOLO.
  • IoU so với F1-Score: F1-score là trung bình điều hòa của độ chính xác và độ phủ và thường được sử dụng trong phân loại. Mặc dù độ chính xác và độ phủ được sử dụng để tính toán mAP, bản thân F1-score không trực tiếp đo lường chất lượng bản địa hóa như IoU. Nó tập trung nhiều hơn vào sự cân bằng giữa việc tìm tất cả các trường hợp dương tính và tính chính xác của những phát hiện đó.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard