Khám phá tầm quan trọng của độ thu hồi trong học máy. Tìm hiểu cách đo lường và cải thiện độ nhạy. Ultralytics Các mẫu YOLO26 đảm bảo tỷ lệ phát hiện cao.
Độ nhạy (Recall), hay còn gọi là độ chính xác (Sensity) hoặc tỷ lệ dương tính thực (True Positive Rate), là một chỉ số hiệu suất cơ bản trong học máy, đo lường khả năng của mô hình trong việc xác định tất cả các trường hợp liên quan trong một tập dữ liệu. Trong bối cảnh phát hiện hoặc phân loại đối tượng , nó trả lời cụ thể câu hỏi: "Trong tất cả các trường hợp dương tính thực tế, mô hình đã tìm thấy chính xác bao nhiêu trường hợp?" Đạt được độ nhạy cao là rất quan trọng trong các trường hợp bỏ sót một trường hợp dương tính—thường được gọi là âm tính giả—có thể dẫn đến những hậu quả nghiêm trọng. Không giống như độ chính xác (Accuracy) , có thể gây hiểu nhầm khi xử lý dữ liệu không cân bằng, độ nhạy cung cấp một cái nhìn tập trung vào hiệu quả của mô hình trong việc "nắm bắt" lớp mục tiêu.
Trong nhiều ứng dụng trí tuệ nhân tạo , chi phí của việc thất bại là rất lớn. detect Chi phí để phát hiện một đối tượng cụ thể cao hơn nhiều so với chi phí của một cảnh báo sai. Một mô hình được tối ưu hóa cho khả năng thu hồi sẽ giảm thiểu các trường hợp bỏ sót sai, đảm bảo rằng hệ thống bao quát đủ rộng để phát hiện các mối đe dọa tiềm tàng, các bất thường hoặc các điều kiện nghiêm trọng. Điều này thường liên quan đến sự đánh đổi, vì việc tăng khả năng thu hồi đôi khi có thể dẫn đến điểm chính xác thấp hơn, nghĩa là mô hình có thể đánh dấu nhiều mục không liên quan là tích cực. Hiểu được sự cân bằng này là chìa khóa để phát triển các giải pháp học máy mạnh mẽ.
Khả năng nhớ lại là chỉ số quan trọng hàng đầu trong nhiều giải pháp AI an toàn. Dưới đây là hai ví dụ nổi bật cho thấy độ nhạy được ưu tiên:
Điều cần thiết là phải phân biệt giữa độ thu hồi (recall) và độ chính xác (precision). Trong khi độ thu hồi đo lường số lượng các trường hợp liên quan được tìm thấy (tính đầy đủ), độ chính xác đo lường chất lượng của các dự đoán tích cực (tính chính xác).
Hai chỉ số này thường có mối quan hệ nghịch đảo, được thể hiện trực quan thông qua đường cong Độ chính xác-Độ thu hồi (Precision-Recall curve ). Để đánh giá sự cân bằng tổng thể giữa chúng, các nhà phát triển thường xem xét điểm F1 , là trung bình điều hòa của cả hai. Trong các tập dữ liệu không cân bằng , việc xem xét độ thu hồi cùng với ma trận nhầm lẫn sẽ cho thấy bức tranh hiệu suất rõ ràng hơn nhiều so với chỉ xem xét độ chính xác.
Khi huấn luyện các mô hình như YOLO26 tiên tiến, độ thu hồi (recall) được tính toán tự động trong giai đoạn xác thực . Khung phần mềm tính toán độ thu hồi cho mỗi lớp và độ chính xác trung bình ( mAP ) , giúp các nhà phát triển đánh giá mức độ hiệu quả của mô hình trong việc tìm kiếm đối tượng.
Bạn có thể dễ dàng xác thực mô hình đã được huấn luyện và xem các chỉ số độ chính xác của nó bằng cách sử dụng Python Đoạn mã này minh họa cách tải một mô hình và kiểm tra hiệu năng của nó trên một tập dữ liệu chuẩn:
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on the COCO8 dataset
# The results object contains metrics like Precision, Recall, and mAP
metrics = model.val(data="coco8.yaml")
# Access and print the mean recall score for box detection
print(f"Mean Recall: {metrics.results_dict['metrics/recall(B)']:.4f}")
Đoạn mã này sử dụng API Ultralytics để chạy quá trình xác thực. Nếu độ thu hồi (recall) thấp hơn mức yêu cầu cho dự án của bạn, bạn có thể xem xét các kỹ thuật như tăng cường dữ liệu để tạo ra nhiều ví dụ huấn luyện đa dạng hơn hoặc điều chỉnh siêu tham số để điều chỉnh độ nhạy của mô hình. Sử dụng nền tảng Ultralytics cũng có thể giúp đơn giản hóa quá trình quản lý tập dữ liệu và theo dõi các chỉ số này qua nhiều lần huấn luyện.
Để nâng cao khả năng nhận diện (recall) của mô hình, các nhà khoa học dữ liệu thường điều chỉnh ngưỡng độ tin cậy được sử dụng trong quá trình suy luận . Hạ thấp ngưỡng làm cho mô hình "lạc quan" hơn, chấp nhận nhiều dự đoán hơn là tích cực, điều này làm tăng khả năng nhận diện nhưng có thể làm giảm độ chính xác. Ngoài ra, việc thu thập dữ liệu huấn luyện đa dạng hơn giúp mô hình học cách nhận biết các trường hợp phủ định khó và các trường hợp ít được biết đến. Đối với các tác vụ phức tạp, việc sử dụng các kiến trúc tiên tiến như khối Transformer hoặc khám phá các phương pháp kết hợp cũng có thể cải thiện khả năng của hệ thống. detect Những chi tiết tinh tế mà các mô hình đơn giản hơn có thể bỏ sót.