Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Giao lộ qua Union ( IoU )

Tìm hiểu về Giao điểm trên Liên hợp ( IoU ) là cách tính toán và vai trò quan trọng của nó trong việc phát hiện đối tượng và đánh giá mô hình AI.

Giao lộ qua Union ( IoU ) là một chỉ số đánh giá cơ bản được sử dụng trong thị giác máy tính (CV) để đo độ chính xác của bộ phát hiện đối tượng trên một tập dữ liệu cụ thể. Thường được gọi trong giới học thuật là Chỉ số Jaccard . IoU định lượng mức độ chồng lấn giữa hai vùng: vùng giới hạn dự đoán được tạo ra bởi mô hình và vùng giới hạn thực tế, là chú thích được ghi nhãn thủ công thể hiện vị trí thực tế của đối tượng. Chỉ số này tạo ra một giá trị từ 0 đến 1, trong đó 0 biểu thị không có sự chồng lấn và 1 biểu thị sự trùng khớp hoàn hảo giữa dự đoán và thực tế.

Hiểu cách IoU Tác phẩm

Sự tính toán của IoU Về mặt khái niệm, nó đơn giản, trở thành chuẩn mực cho các tác vụ phát hiện đối tượngphân đoạn ảnh . Nó được xác định bằng cách chia diện tích giao nhau (vùng chồng lấn) cho diện tích hợp (tổng diện tích của cả hai hộp). Bằng cách chuẩn hóa diện tích chồng lấn với tổng diện tích, IoU cung cấp một phép đo bất biến theo tỷ lệ, nghĩa là nó đánh giá chất lượng phù hợp bất kể kích thước của vật thể.

Trong các ứng dụng thực tế, ngưỡng thường được áp dụng cho IoU ghi điểm cho classify dự đoán là phát hiện "tích cực" hoặc "tiêu cực". Ví dụ, trong các thử thách tiêu chuẩn như chuẩn mực bộ dữ liệu COCO , IoU Ngưỡng 0,5 (hoặc 50%) thường được sử dụng để xác định tính hợp lệ của một phát hiện. Ngưỡng này rất quan trọng để tính toán các số liệu tiếp theo như Độ chính xácĐộ thu hồi , cuối cùng sẽ được dùng để tính điểm Độ chính xác trung bình ( mAP ) dùng để xếp hạng hiệu suất mô hình.

Tính toán IoU với Python

Bạn có thể dễ dàng tính toán IoU giữa các hộp bằng cách sử dụng các chức năng tiện ích được cung cấp trong ultralytics gói. Điều này hữu ích cho các tập lệnh đánh giá tùy chỉnh hoặc hiểu hành vi của mô hình trong quá trình suy luận.

import torch
from ultralytics.utils.metrics import box_iou

# Define a ground truth box and a predicted box in (x1, y1, x2, y2) format
# Example: A 100x100 pixel box starting at (50,50) vs shifted prediction
ground_truth = torch.tensor([[50, 50, 150, 150]])
prediction = torch.tensor([[60, 60, 160, 160]])

# Calculate the Intersection over Union
iou_score = box_iou(ground_truth, prediction)

print(f"IoU Score: {iou_score.item():.4f}")
# Output represents the overlap ratio

Các Ứng dụng Thực tế

Độ chính xác của định vị được cung cấp bởi IoU rất quan trọng trong nhiều ngành công nghiệp, nơi mà sự an toàn và độ chính xác là tối quan trọng.

  • AI trong ô tô : Trong quá trình phát triển xe tự hành , hệ thống phải phân biệt chính xác giữa người đi bộ, các phương tiện khác và chướng ngại vật tĩnh. Một mức cao IoU Điểm số đảm bảo hệ thống nhận thức biết chính xác vị trí của vật thể so với xe, chứ không chỉ biết nó tồn tại. Khả năng định vị chính xác này rất cần thiết cho việc lập kế hoạch quỹ đạo và các hệ thống tránh va chạm được các công ty hàng đầu như Waymo và Tesla sử dụng.
  • Phân tích hình ảnh y tế : Khi sử dụng AI để detect các bất thường như khối u trong chụp MRI hoặc CT, ranh giới chính xác của tổn thương có ý nghĩa quan trọng đối với chẩn đoán và lập kế hoạch điều trị. Một mô hình có IoU đảm bảo rằng AI trong các công cụ chăm sóc sức khỏe sẽ làm nổi bật chính xác toàn bộ khu vực bị ảnh hưởng mà không bao gồm quá nhiều mô khỏe mạnh, hỗ trợ các bác sĩ X quang đưa ra quyết định quan trọng.

IoU trong Đào tạo và Suy luận Mô hình

Vượt ra ngoài sự đánh giá đơn giản, IoU đóng vai trò tích cực trong cơ chế bên trong của các kiến trúc hiện đại như YOLO11 .

  • Tối ưu hóa hàm mất mát : Các hàm mất mát truyền thống thường gặp khó khăn với các hộp giới hạn không chồng chéo. Để giải quyết vấn đề này, các biến thể như Tổng quát hóa IoU ( GIoU ), Khoảng cách IoU ( DIoU ), và Hoàn thành IoU ( CIoU ) được tích hợp trực tiếp vào quá trình đào tạo. Các biến thể này cung cấp độ dốc ngay cả khi các hộp không chạm vào nhau, giúp mô hình hội tụ nhanh hơn và đạt được độ định vị tốt hơn.
  • Loại bỏ không tối đa ( NMS ) : Trong quá trình suy luận, bộ phát hiện đối tượng có thể đưa ra nhiều hộp giới hạn cho một đối tượng duy nhất. NMS sử dụng IoU để lọc các kết quả này. Nếu hai hộp dự đoán có IoU cao hơn một mức cụ thể NMS ngưỡng (ví dụ: 0,7) và thuộc cùng một lớp, lớp có điểm tin cậy thấp hơn sẽ bị loại bỏ, chỉ để lại dự đoán tốt nhất.

IoU so với các số liệu liên quan

Điều quan trọng là phải phân biệt IoU từ các thuật ngữ tương tự để chọn số liệu phù hợp cho nhiệm vụ cụ thể của bạn.

  • IoU so với Độ chính xác : Độ chính xác thường đo lường tỷ lệ phân loại đúng (ví dụ: "Đây có phải là mèo không?"). Nó không tính đến vị trí của đối tượng. IoU đo lường cụ thể chất lượng của việc định vị (ví dụ: "Chiếc hộp có vừa với con mèo không?"). Một mô hình có thể có độ chính xác phân loại cao nhưng thấp IoU nếu các hộp bị lỏng hoặc không thẳng hàng.
  • Hệ số IoU so với Hệ số Dice : Mặc dù cả hai phép đo đều chồng chéo và có tương quan dương, Hệ số Dice (hay điểm F1 của pixel) sẽ có trọng số cao hơn cho giao điểm. Điểm Dice thường được ưu tiên hơn trong các tác vụ phân đoạn ngữ nghĩa , trong khi IoU là tiêu chuẩn để phát hiện đối tượng trong hộp giới hạn.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay