Tìm hiểu Giao điểm trên hợp (IoU) là gì, cách tính toán và vai trò quan trọng của nó trong phát hiện đối tượng và đánh giá mô hình AI.
Giao điểm trên hợp (IoU) là một thước đo đánh giá cơ bản được sử dụng trong thị giác máy tính (CV) , đặc biệt là cho các tác vụ phát hiện đối tượng . Thước đo này đo lường sự chồng lấn giữa hai ranh giới: khung giới hạn dự đoán được tạo ra bởi mô hình và khung giới hạn thực tế, là đường viền chính xác được gắn nhãn thủ công. Điểm số kết quả, có giá trị từ 0 đến 1, định lượng mức độ chính xác mà mô hình đã định vị một đối tượng trong ảnh. Điểm số 1 biểu thị sự trùng khớp hoàn hảo, trong khi điểm số 0 biểu thị không có sự chồng lấn nào cả. Thước đo này rất quan trọng để đánh giá độ chính xác định vị của các mô hình như Ultralytics YOLO11 .
Về cơ bản, IoU tính toán tỷ lệ giữa giao điểm (diện tích chồng lấn) với hợp (tổng diện tích được bao phủ bởi cả hai hộp) của các hộp giới hạn dự đoán và hộp giới hạn thực tế. Hãy tưởng tượng hai hình vuông chồng lấn. "Giao điểm" là diện tích chung mà chúng chồng lấn. "Hợp" là tổng diện tích mà cả hai hình vuông bao phủ cộng lại, chỉ tính phần chồng lấn một lần. Bằng cách chia giao điểm cho hợp, IoU cung cấp một thước đo chuẩn hóa về mức độ phù hợp của hộp dự đoán với đối tượng thực tế. Khái niệm đơn giản nhưng mạnh mẽ này là nền tảng của học sâu (DL) hiện đại trong phát hiện đối tượng.
Một phần quan trọng khi sử dụng IoU là thiết lập "ngưỡng IoU". Ngưỡng này là một giá trị được xác định trước (ví dụ: 0,5) để xác định xem dự đoán có chính xác hay không. Nếu điểm IoU cho một ô dự đoán cao hơn ngưỡng này, nó được phân loại là "dương tính thật". Nếu điểm thấp hơn, nó được gọi là "dương tính giả". Ngưỡng này ảnh hưởng trực tiếp đến các chỉ số hiệu suất khác như Độ chính xác và Độ thu hồi , và là một thành phần quan trọng trong việc tính toán Độ chính xác trung bình (mAP) , một chỉ số tiêu chuẩn để đánh giá các mô hình phát hiện đối tượng trên các tập dữ liệu chuẩn như COCO .
IoU rất cần thiết để xác thực hiệu suất của vô số hệ thống AI. Dưới đây là một vài ví dụ:
IoU không chỉ là một thước đo đánh giá; nó còn là một phần không thể thiếu của quá trình huấn luyện. Nhiều kiến trúc phát hiện đối tượng hiện đại, bao gồm các biến thể của Ultralytics YOLOv8 và YOLO11, sử dụng IoU hoặc các biến thể của nó trực tiếp trong các hàm mất mát của chúng. Các mất mát dựa trên IoU nâng cao này, chẳng hạn như IoU Tổng quát (GIoU), IoU Khoảng cách (DIoU) hoặc IoU Hoàn chỉnh (CIoU), giúp mô hình học cách dự đoán các hộp giới hạn không chỉ chồng chéo tốt mà còn xem xét các yếu tố như khoảng cách giữa các tâm và tính nhất quán tỷ lệ khung hình. Điều này dẫn đến hội tụ nhanh hơn và hiệu suất định vị tốt hơn so với mất mát hồi quy truyền thống. Bạn có thể tìm thấy các so sánh chi tiết giữa các mô hình YOLO khác nhau trong tài liệu của chúng tôi.
Việc theo dõi IoU trong quá trình huấn luyện mô hình và điều chỉnh siêu tham số giúp các nhà phát triển tinh chỉnh mô hình để định vị tốt hơn. Các công cụ như Ultralytics HUB cho phép theo dõi IoU và các số liệu khác, giúp đơn giản hóa chu trình cải tiến mô hình. Mặc dù có tính ứng dụng rộng rãi, IoU tiêu chuẩn đôi khi có thể không nhạy, đặc biệt là đối với các hộp không chồng lấn. Hạn chế này đã thúc đẩy sự phát triển của các biến thể IoU đã đề cập ở trên. Tuy nhiên, IoU vẫn là nền tảng của đánh giá thị giác máy tính .
Mặc dù IoU rất quan trọng, nhưng điều quan trọng là phải hiểu mối quan hệ của nó với các số liệu khác: