Tìm hiểu Recall là gì trong machine learning, tại sao nó lại quan trọng và cách nó đảm bảo các mô hình AI nắm bắt hiệu quả các trường hợp dương tính quan trọng.
Độ nhạy (Recall), thường được gọi là độ chính xác hoặc tỷ lệ dương tính thực, là một chỉ số hiệu suất cơ bản được sử dụng để đánh giá hiệu quả của các mô hình phân loại và phát hiện. Trong lĩnh vực học máy (ML) rộng lớn, độ nhạy đo lường khả năng của một mô hình trong việc xác định tất cả các trường hợp liên quan trong một tập dữ liệu. Nói một cách đơn giản, nó trả lời câu hỏi quan trọng: "Trong tất cả các trường hợp dương tính thực tế, mô hình đã tìm thấy thành công bao nhiêu trường hợp?" Chỉ số này đặc biệt quan trọng trong các trường hợp bỏ sót mục tiêu — một loại lỗi khác biệt được gọi là âm tính giả — có thể dẫn đến những hậu quả nghiêm trọng.
Mặc dù độ chính xác cung cấp một cái nhìn tổng quát về các dự đoán đúng, nhưng nó có thể gây hiểu lầm, đặc biệt khi xử lý các tập dữ liệu không cân bằng . Ví dụ, nếu một tập dữ liệu chứa 99 bệnh nhân khỏe mạnh và chỉ có 1 bệnh nhân bị bệnh, một mô hình dự đoán "khỏe mạnh" cho tất cả mọi người sẽ đạt được độ chính xác 99% nhưng độ thu hồi (recall) cho bệnh tật là 0%. Độ thu hồi cao đảm bảo rằng hệ thống sẽ bao quát một phạm vi rộng để thu thập càng nhiều trường hợp dương tính thực sự càng tốt.
Điều này thường liên quan đến sự đánh đổi với độ chính xác , thước đo chất lượng hoặc độ tin cậy của các dự đoán tích cực. Việc tăng độ thu hồi bằng cách hạ thấp ngưỡng tin cậy thường dẫn đến nhiều kết quả dương tính giả (báo động sai), do đó làm giảm độ chính xác. Các kỹ sư thường phân tích đường cong Độ chính xác-Độ thu hồi để tìm điểm hoạt động tối ưu cho ứng dụng cụ thể của họ.
Hiểu được mối liên hệ giữa độ thu hồi và các chỉ số khác là điều cần thiết để diễn giải những hiểu biết từ việc đánh giá mô hình .
Khả năng nhớ lại là chỉ số quan trọng hàng đầu trong nhiều giải pháp AI an toàn. Dưới đây là hai ví dụ nổi bật cho thấy độ nhạy được ưu tiên:
Khi huấn luyện các mô hình như YOLO26 tiên tiến hoặc YOLO11 được sử dụng rộng rãi, độ thu hồi (recall) được tính toán tự động trong giai đoạn xác thực . Khung phần mềm tính toán độ thu hồi cho mỗi lớp và độ chính xác trung bình ( mAP ) , giúp các nhà phát triển đánh giá mức độ hiệu quả của mô hình trong việc tìm kiếm đối tượng.
Bạn có thể dễ dàng xác thực mô hình đã được huấn luyện và xem các chỉ số độ chính xác của nó bằng cách sử dụng Python Đoạn mã này minh họa cách tải một mô hình và kiểm tra hiệu năng của nó trên một tập dữ liệu chuẩn:
from ultralytics import YOLO
# Load a pretrained model (YOLO11 used here for demonstration)
model = YOLO("yolo11n.pt")
# Validate the model on the COCO8 dataset
# The results object contains metrics like Precision, Recall, and mAP
metrics = model.val(data="coco8.yaml")
# Access and print the mean recall score for box detection
print(f"Mean Recall: {metrics.results_dict['metrics/recall(B)']}")
Đoạn mã này sử dụng API Ultralytics để chạy quá trình xác thực. Nếu độ thu hồi (recall) thấp hơn mức yêu cầu cho dự án của bạn, bạn có thể xem xét các kỹ thuật như tăng cường dữ liệu để tạo ra nhiều ví dụ huấn luyện đa dạng hơn hoặc điều chỉnh siêu tham số để điều chỉnh độ nhạy của mô hình.