Thuật ngữ

Giao điểm qua Union (IoU)

Tìm hiểu Giao điểm trên hợp (IoU) là gì, cách tính toán và vai trò quan trọng của nó trong phát hiện đối tượng và đánh giá mô hình AI.

Giao điểm trên hợp (IoU) là một thước đo đánh giá cơ bản được sử dụng trong thị giác máy tính (CV) , đặc biệt là cho các tác vụ phát hiện đối tượng . Thước đo này đo lường sự chồng lấn giữa hai ranh giới: khung giới hạn dự đoán được tạo ra bởi mô hình và khung giới hạn thực tế, là đường viền chính xác được gắn nhãn thủ công. Điểm số kết quả, có giá trị từ 0 đến 1, định lượng mức độ chính xác mà mô hình đã định vị một đối tượng trong ảnh. Điểm số 1 biểu thị sự trùng khớp hoàn hảo, trong khi điểm số 0 biểu thị không có sự chồng lấn nào cả. Thước đo này rất quan trọng để đánh giá độ chính xác định vị của các mô hình như Ultralytics YOLO11 .

IoU hoạt động như thế nào

Về cơ bản, IoU tính toán tỷ lệ giữa giao điểm (diện tích chồng lấn) với hợp (tổng diện tích được bao phủ bởi cả hai hộp) của các hộp giới hạn dự đoán và hộp giới hạn thực tế. Hãy tưởng tượng hai hình vuông chồng lấn. "Giao điểm" là diện tích chung mà chúng chồng lấn. "Hợp" là tổng diện tích mà cả hai hình vuông bao phủ cộng lại, chỉ tính phần chồng lấn một lần. Bằng cách chia giao điểm cho hợp, IoU cung cấp một thước đo chuẩn hóa về mức độ phù hợp của hộp dự đoán với đối tượng thực tế. Khái niệm đơn giản nhưng mạnh mẽ này là nền tảng của học sâu (DL) hiện đại trong phát hiện đối tượng.

Một phần quan trọng khi sử dụng IoU là thiết lập "ngưỡng IoU". Ngưỡng này là một giá trị được xác định trước (ví dụ: 0,5) để xác định xem dự đoán có chính xác hay không. Nếu điểm IoU cho một ô dự đoán cao hơn ngưỡng này, nó được phân loại là "dương tính thật". Nếu điểm thấp hơn, nó được gọi là "dương tính giả". Ngưỡng này ảnh hưởng trực tiếp đến các chỉ số hiệu suất khác như Độ chính xácĐộ thu hồi , và là một thành phần quan trọng trong việc tính toán Độ chính xác trung bình (mAP) , một chỉ số tiêu chuẩn để đánh giá các mô hình phát hiện đối tượng trên các tập dữ liệu chuẩn như COCO .

Ứng dụng trong thế giới thực

IoU rất cần thiết để xác thực hiệu suất của vô số hệ thống AI. Dưới đây là một vài ví dụ:

  1. Lái xe tự động : Trong AI dành cho xe tự lái , IoU được sử dụng để đánh giá mức độ hiệu quả của hệ thống thị giác trong việc phát hiện người đi bộ, phương tiện khác và biển báo giao thông. Điểm IoU cao đảm bảo các hộp giới hạn dự đoán chính xác, điều này rất quan trọng cho việc điều hướng an toàn và tránh va chạm. Các công ty như Waymo rất tin tưởng vào khả năng phát hiện vật thể chính xác để đảm bảo an toàn cho hệ thống tự hành của họ.
  2. Chẩn đoán hình ảnh y tế : Trong phân tích hình ảnh y tế , IoU giúp đánh giá độ chính xác của các mô hình xác định các bất thường như khối u hoặc tổn thương trong các lần quét như MRI hoặc CT. Định vị chính xác là rất quan trọng cho việc lập kế hoạch điều trị, và IoU cung cấp một thước đo đáng tin cậy về việc liệu dự đoán của mô hình có hữu ích về mặt lâm sàng hay không. Điều này rất quan trọng trong các ứng dụng như phát hiện khối u bằng mô hình YOLO .

Nâng cao hiệu suất mô hình với IoU

IoU không chỉ là một thước đo đánh giá; nó còn là một phần không thể thiếu của quá trình huấn luyện. Nhiều kiến trúc phát hiện đối tượng hiện đại, bao gồm các biến thể của Ultralytics YOLOv8 và YOLO11, sử dụng IoU hoặc các biến thể của nó trực tiếp trong các hàm mất mát của chúng. Các mất mát dựa trên IoU nâng cao này, chẳng hạn như IoU Tổng quát (GIoU), IoU Khoảng cách (DIoU) hoặc IoU Hoàn chỉnh (CIoU), giúp mô hình học cách dự đoán các hộp giới hạn không chỉ chồng chéo tốt mà còn xem xét các yếu tố như khoảng cách giữa các tâm và tính nhất quán tỷ lệ khung hình. Điều này dẫn đến hội tụ nhanh hơn và hiệu suất định vị tốt hơn so với mất mát hồi quy truyền thống. Bạn có thể tìm thấy các so sánh chi tiết giữa các mô hình YOLO khác nhau trong tài liệu của chúng tôi.

Việc theo dõi IoU trong quá trình huấn luyện mô hìnhđiều chỉnh siêu tham số giúp các nhà phát triển tinh chỉnh mô hình để định vị tốt hơn. Các công cụ như Ultralytics HUB cho phép theo dõi IoU và các số liệu khác, giúp đơn giản hóa chu trình cải tiến mô hình. Mặc dù có tính ứng dụng rộng rãi, IoU tiêu chuẩn đôi khi có thể không nhạy, đặc biệt là đối với các hộp không chồng lấn. Hạn chế này đã thúc đẩy sự phát triển của các biến thể IoU đã đề cập ở trên. Tuy nhiên, IoU vẫn là nền tảng của đánh giá thị giác máy tính .

IoU so với các số liệu khác

Mặc dù IoU rất quan trọng, nhưng điều quan trọng là phải hiểu mối quan hệ của nó với các số liệu khác:

  • IoU so với Độ chính xác : Độ chính xác là một thước đo phổ biến trong các tác vụ phân loại, đo lường tỷ lệ phần trăm dự đoán chính xác. Tuy nhiên, nó không phù hợp để phát hiện đối tượng vì không tính đến lỗi định vị. Một dự đoán có thể phân loại chính xác một đối tượng nhưng lại đặt hộp giới hạn không chính xác. IoU giải quyết vấn đề này một cách cụ thể bằng cách đo lường chất lượng định vị.
  • IoU so với Độ chính xác trung bình (mAP) : Hai thuật ngữ này có liên quan nhưng khác biệt. IoU đo lường chất lượng của một khung giới hạn dự đoán duy nhất . Ngược lại, mAP là một số liệu toàn diện đánh giá hiệu suất của mô hình trên tất cả các đối tượng và lớp trong một tập dữ liệu. Nó được tính bằng cách lấy trung bình các giá trị độ chính xác trên nhiều ngưỡng IoU và tất cả các lớp. Về cơ bản, IoU là nền tảng để tính toán mAP. Bạn có thể tìm thấy lời giải thích chi tiết về mối quan hệ này trong hướng dẫn về số liệu hiệu suất YOLO của chúng tôi.
  • IoU so với Điểm F1 : Điểm F1 là giá trị trung bình hài hòa của độ chính xác và độ thu hồi, thường được sử dụng trong phân loại. Mặc dù độ chính xác và độ thu hồi được sử dụng để tính toán mAP, bản thân điểm F1 không đo lường trực tiếp chất lượng định vị như IoU. Nó tập trung nhiều hơn vào sự cân bằng giữa việc tìm thấy tất cả các trường hợp dương và tính chính xác của những phát hiện đó.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard