Khám phá tầm quan trọng của F1-score trong máy học! Tìm hiểu cách nó cân bằng giữa độ chính xác (precision) và độ phủ (recall) để đánh giá mô hình tối ưu.
Điểm F1 là một chỉ số hiệu suất quan trọng trong học máy, kết hợp độ chính xác (precision) và độ thu hồi (recall) thành một giá trị trung bình điều hòa duy nhất. Nó đặc biệt hữu ích để đánh giá các mô hình phân loại khi tập dữ liệu không cân bằng hoặc khi sai sót dương tính giả và âm tính giả có chi phí khác nhau. Không giống như độ chính xác đơn thuần, có thể gây hiểu lầm nếu một lớp chiếm ưu thế trong tập dữ liệu, điểm F1 cung cấp một cái nhìn cân bằng hơn về khả năng của mô hình trong việc xác định chính xác các trường hợp liên quan đồng thời giảm thiểu lỗi. Bằng cách phạt các giá trị cực đoan, nó đảm bảo rằng điểm số cao chỉ đạt được khi cả độ chính xác và độ thu hồi đều ở mức khá cao, khiến nó trở thành một chỉ số thiết yếu trong các lĩnh vực từ chẩn đoán y tế đến truy xuất thông tin.
Trong nhiều tình huống thực tế, chỉ biết tỷ lệ dự đoán chính xác (độ chính xác) là không đủ. Ví dụ, trong phát hiện bất thường , số trường hợp bình thường nhiều hơn rất nhiều so với các trường hợp bất thường. Một mô hình dự đoán "bình thường" cho mọi đầu vào có thể đạt độ chính xác 99% nhưng sẽ vô dụng trong việc phát hiện các vấn đề thực sự. Chỉ số F1 giải quyết vấn đề này bằng cách cân bằng hai chỉ số cạnh tranh:
Vì thường có sự đánh đổi—việc cải thiện độ chính xác thường làm giảm độ thu hồi và ngược lại—điểm F1 đóng vai trò là thước đo thống nhất để tìm ra điểm cân bằng tối ưu. Điều này rất quan trọng khi tinh chỉnh các mô hình bằng cách tối ưu hóa siêu tham số để đảm bảo hiệu suất mạnh mẽ trong các điều kiện khác nhau.
Tính hữu ích của chỉ số F1-Score trải rộng trong nhiều ngành công nghiệp khác nhau, nơi mà chi phí do sai sót gây ra là rất đáng kể.
Các khung phần mềm thị giác máy tính hiện đại đơn giản hóa việc tính toán các chỉ số này. Khi huấn luyện các mô hình phát hiện đối tượng, điểm F1 được tính toán tự động trong giai đoạn xác thực. Nền tảng Ultralytics trực quan hóa các chỉ số này trên biểu đồ thời gian thực, cho phép người dùng xem đường cong của điểm F1 so với các ngưỡng độ tin cậy khác nhau.
Dưới đây là cách bạn có thể truy cập các chỉ số xác thực, bao gồm các thành phần của điểm F1, bằng cách sử dụng... Python API:
from ultralytics import YOLO
# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on a dataset (metrics are computed automatically)
# This returns a validator object containing precision, recall, and mAP
metrics = model.val(data="coco8.yaml")
# Print the Mean Average Precision (mAP50-95), which correlates with F1 performance
print(f"mAP50-95: {metrics.box.map}")
# Access precision and recall arrays to manually inspect the balance
print(f"Precision: {metrics.box.p}")
print(f"Recall: {metrics.box.r}")
Hiểu rõ sự khác biệt giữa điểm F1 và các tiêu chí đánh giá khác là điều cần thiết để lựa chọn công cụ phù hợp cho dự án của bạn.
Nếu mô hình của bạn có điểm F1 thấp, một số chiến lược có thể giúp ích. Tăng cường dữ liệu có thể làm tăng sự đa dạng của các ví dụ tích cực, giúp mô hình tổng quát hóa tốt hơn. Sử dụng học chuyển giao từ các mô hình nền tảng mạnh mẽ cho phép mạng tận dụng các đặc trưng đã được học trước đó. Ngoài ra, điều chỉnh ngưỡng độ tin cậy trong quá trình suy luận có thể điều chỉnh thủ công sự cân bằng giữa độ chính xác và độ thu hồi để tối đa hóa điểm F1 cho trường hợp sử dụng cụ thể của bạn.