Tìm hiểu tầm quan trọng của Diện tích dưới đường cong (AUC) trong đánh giá mô hình ML. Khám phá những lợi ích, thông tin chi tiết về đường cong ROC và các ứng dụng thực tế của nó.
Diện tích dưới đường cong (AUC) là một chỉ số hiệu suất toàn diện được sử dụng trong học máy (ML) để đánh giá khả năng phân biệt của một mô hình phân loại. Cụ thể, nó đo diện tích hai chiều bên dưới đường cong đặc tính hoạt động của bộ thu (ROC) , cung cấp một giá trị vô hướng duy nhất nằm trong khoảng từ 0 đến 1. AUC bằng 1,0 cho thấy một bộ phân loại hoàn hảo, trong khi AUC bằng 0,5 cho thấy mô hình hoạt động không tốt hơn so với xác suất ngẫu nhiên. Bởi vì nó tổng hợp hiệu suất trên tất cả các ngưỡng phân loại có thể, AUC đặc biệt hiệu quả để đánh giá khả năng mô hình hóa dự đoán trong các trường hợp mà ranh giới quyết định tối ưu không được biết hoặc thay đổi.
Để hiểu đầy đủ về AUC, người ta phải hiểu đường cong ROC cơ bản. Đồ thị này biểu diễn Tỷ lệ dương tính thực (Recall) so với Tỷ lệ dương tính giả ở các ngưỡng khác nhau. Về cơ bản, AUC định lượng xác suất mà mô hình sẽ xếp hạng một trường hợp dương tính được chọn ngẫu nhiên cao hơn một trường hợp âm tính được chọn ngẫu nhiên.
AUC là một chỉ số được ưa chuộng trong các ngành liên quan đến việc ra quyết định quan trọng và các tập dữ liệu không cân bằng , nơi một lớp hiếm hơn đáng kể so với lớp khác.
Việc phân biệt AUC với các chỉ số đánh giá mô hình khác là rất quan trọng để lựa chọn công cụ phù hợp cho dự án của bạn.
Ví dụ sau đây minh họa cách tải mô hình phân loại YOLO26 đã được huấn luyện trước và chạy quá trình xác thực. Trong khi đó, YOLO Các mô hình chủ yếu báo cáo độ chính xác top 1 và top 5, quy trình xác thực tạo ra dữ liệu dự đoán cần thiết để phân tích các chỉ số dựa trên đường cong.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Validate the model on a standard dataset (e.g., imagenet10)
# This generates precision, recall, and accuracy metrics
results = model.val(data="imagenet10")
# Access top-1 accuracy, a key point on the ROC curve
print(f"Top-1 Accuracy: {results.top1:.4f}")
print(f"Top-5 Accuracy: {results.top5:.4f}")
Để quản lý vòng đời toàn diện, bao gồm chú thích tập dữ liệu và huấn luyện trên nền tảng đám mây, nơi các chỉ số này được hiển thị tự động, các nhà phát triển có thể sử dụng Nền tảng Ultralytics . Điều này giúp đơn giản hóa quá trình diễn giải các chỉ số phức tạp như AUC mà không cần tính toán thủ công.