Tìm hiểu Recall là gì trong machine learning, tại sao nó lại quan trọng và cách nó đảm bảo các mô hình AI nắm bắt hiệu quả các trường hợp dương tính quan trọng.
Độ phủ (Recall), còn được gọi là độ nhạy (sensitivity) hoặc tỷ lệ dương tính thực (true positive rate), là một số liệu đánh giá cơ bản trong học máy (ML) và thống kê. Nó đo lường khả năng của một mô hình trong việc xác định chính xác tất cả các trường hợp có liên quan trong một tập dữ liệu. Nói một cách đơn giản, Recall trả lời câu hỏi: "Trong số tất cả các trường hợp dương tính thực tế, mô hình đã dự đoán chính xác bao nhiêu trường hợp là dương tính?" Điểm Recall cao cho thấy rằng mô hình có hiệu quả trong việc tìm kiếm những gì nó phải tìm, giảm thiểu số lượng các trường hợp dương tính bị bỏ sót (âm tính giả). Số liệu này đặc biệt quan trọng trong các ứng dụng mà việc không phát hiện ra một trường hợp dương tính sẽ gây ra những hậu quả đáng kể.
Trong nhiều tình huống thực tế, chi phí của một âm tính giả (bỏ lỡ một phát hiện) cao hơn nhiều so với chi phí của một dương tính giả (báo động sai). Đây là nơi ưu tiên độ phủ (Recall) cao trở nên cần thiết. Ví dụ: trong các tác vụ như phân tích hình ảnh y tế hoặc phát hiện gian lận, một mô hình có độ phủ cao đảm bảo rằng càng nhiều trường hợp thực càng tốt được thu thập để xem xét thêm, ngay cả khi điều đó có nghĩa là một số trường hợp không phải là trường hợp thực bị gắn cờ không chính xác.
Trong bối cảnh thị giác máy tính (CV) và các mô hình như Ultralytics YOLO, Recall là một số liệu chính được sử dụng cùng với Precision và độ chính xác trung bình (mAP) để đánh giá hiệu suất trên các tác vụ như phát hiện đối tượng và phân vùng thể hiện. Đạt được sự cân bằng tốt giữa Recall và Precision thường rất cần thiết cho hiệu suất thực tế mạnh mẽ. Ví dụ: khi so sánh các mô hình như YOLOv8 so với YOLO11, Recall giúp hiểu rõ hơn về mức độ mỗi mô hình xác định tất cả các đối tượng mục tiêu. Người dùng có thể huấn luyện các mô hình tùy chỉnh bằng các framework như PyTorch hoặc TensorFlow và theo dõi Recall bằng các công cụ như Weights & Biases hoặc các tính năng tích hợp trong Ultralytics HUB. Hiểu Recall giúp tối ưu hóa các mô hình cho các trường hợp sử dụng cụ thể, có thể liên quan đến điều chỉnh siêu tham số hoặc khám phá các kiến trúc mô hình khác nhau như YOLOv10 hoặc YOLO11 mới nhất. Các tài nguyên như tài liệu Ultralytics cung cấp các hướng dẫn toàn diện về huấn luyện và đánh giá.
Điều quan trọng là phân biệt Recall với các số liệu đánh giá phổ biến khác.