Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Recall

Tìm hiểu Recall là gì trong machine learning, tại sao nó lại quan trọng và cách nó đảm bảo các mô hình AI nắm bắt hiệu quả các trường hợp dương tính quan trọng.

Độ phủ (Recall), còn được gọi là độ nhạy (sensitivity) hoặc tỷ lệ dương tính thực (true positive rate), là một số liệu đánh giá cơ bản trong học máy (ML) và thống kê. Nó đo lường khả năng của một mô hình trong việc xác định chính xác tất cả các trường hợp có liên quan trong một tập dữ liệu. Nói một cách đơn giản, Recall trả lời câu hỏi: "Trong số tất cả các trường hợp dương tính thực tế, mô hình đã dự đoán chính xác bao nhiêu trường hợp là dương tính?" Điểm Recall cao cho thấy rằng mô hình có hiệu quả trong việc tìm kiếm những gì nó phải tìm, giảm thiểu số lượng các trường hợp dương tính bị bỏ sót (âm tính giả). Số liệu này đặc biệt quan trọng trong các ứng dụng mà việc không phát hiện ra một trường hợp dương tính sẽ gây ra những hậu quả đáng kể.

Tầm quan trọng của Độ Phủ Cao

Trong nhiều tình huống thực tế, chi phí của một âm tính giả (bỏ lỡ một phát hiện) cao hơn nhiều so với chi phí của một dương tính giả (báo động sai). Đây là nơi ưu tiên độ phủ (Recall) cao trở nên cần thiết. Ví dụ: trong các tác vụ như phân tích hình ảnh y tế hoặc phát hiện gian lận, một mô hình có độ phủ cao đảm bảo rằng càng nhiều trường hợp thực càng tốt được thu thập để xem xét thêm, ngay cả khi điều đó có nghĩa là một số trường hợp không phải là trường hợp thực bị gắn cờ không chính xác.

  • Chẩn đoán y khoa: Trong một hệ thống hỗ trợ bởi AI để phát hiện ung thư từ ảnh chụp y tế, mô hình có độ Recall cao là rất quan trọng. Thà để hệ thống gắn cờ một bệnh nhân khỏe mạnh để bác sĩ радиologist xem xét (dương tính giả) còn hơn là bỏ sót một khối u ung thư (âm tính giả), điều này có thể trì hoãn việc điều trị cứu sống. Nhiều giải pháp ứng dụng AI trong chăm sóc sức khỏe được tối ưu hóa cho độ nhạy cao.
  • Bảo mật và Giám sát: Đối với một hệ thống báo động an ninh được thiết kế để phát hiện những kẻ xâm nhập, độ Recall cao là tối quan trọng. Hệ thống phải xác định mọi mối đe dọa tiềm ẩn, ngay cả khi thỉnh thoảng nó nhầm một con vật đi lạc với một kẻ xâm nhập. Bỏ lỡ một vi phạm an ninh thực sự sẽ khiến hệ thống không hiệu quả.

Độ phủ (Recall) trong các mô hình Ultralytics YOLO

Trong bối cảnh thị giác máy tính (CV) và các mô hình như Ultralytics YOLO, Recall là một số liệu chính được sử dụng cùng với Precision và độ chính xác trung bình (mAP) để đánh giá hiệu suất trên các tác vụ như phát hiện đối tượngphân vùng thể hiện. Đạt được sự cân bằng tốt giữa Recall và Precision thường rất cần thiết cho hiệu suất thực tế mạnh mẽ. Ví dụ: khi so sánh các mô hình như YOLOv8 so với YOLO11, Recall giúp hiểu rõ hơn về mức độ mỗi mô hình xác định tất cả các đối tượng mục tiêu. Người dùng có thể huấn luyện các mô hình tùy chỉnh bằng các framework như PyTorch hoặc TensorFlow và theo dõi Recall bằng các công cụ như Weights & Biases hoặc các tính năng tích hợp trong Ultralytics HUB. Hiểu Recall giúp tối ưu hóa các mô hình cho các trường hợp sử dụng cụ thể, có thể liên quan đến điều chỉnh siêu tham số hoặc khám phá các kiến trúc mô hình khác nhau như YOLOv10 hoặc YOLO11 mới nhất. Các tài nguyên như tài liệu Ultralytics cung cấp các hướng dẫn toàn diện về huấn luyện và đánh giá.

So sánh Recall với các số liệu khác

Điều quan trọng là phân biệt Recall với các số liệu đánh giá phổ biến khác.

  • Độ chính xác (Precision): Trong khi Độ phủ (Recall) tập trung vào việc tìm tất cả các mẫu dương tính, thì Độ chính xác (Precision) đo lường độ chính xác của các dự đoán dương tính được thực hiện. Nó trả lời: "Trong tất cả các trường hợp mà mô hình dự đoán là dương tính, có bao nhiêu trường hợp thực sự là dương tính?" Thường có sự đánh đổi giữa Độ chính xác và Độ phủ; tăng một có thể làm giảm cái kia. Khái niệm này được gọi là sự đánh đổi giữa Độ chính xác và Độ phủ.
  • Độ chính xác (Accuracy): Đo lường tỷ lệ phần trăm chung của các dự đoán đúng (cả dương tính và âm tính). Độ chính xác có thể là một số liệu gây hiểu lầm đối với các bộ dữ liệu không cân bằng, trong đó một lớp vượt trội hơn hẳn so với lớp còn lại. Ví dụ: trong một bộ dữ liệu có 99% mẫu âm tính, một mô hình dự đoán mọi thứ là âm tính sẽ đạt được độ chính xác 99% nhưng có độ Nhớ (Recall) bằng không cho lớp dương tính.
  • F1-Score: Đây là trung bình điều hòa của Precision (Độ chính xác) và Recall (Độ phủ). F1-Score cung cấp một con số duy nhất cân bằng cả hai số liệu, làm cho nó trở thành một thước đo hữu ích khi bạn cần xem xét cả dương tính giả và âm tính giả. Nó thường được sử dụng khi có sự phân phối lớp không đồng đều.
  • Diện tích dưới đường cong (AUC): Đặc biệt đối với phân loại nhị phân, đường cong Đặc tính hoạt động của máy thu (ROC) biểu thị tỷ lệ dương tính thực (Độ nhớ) so với tỷ lệ dương tính giả. AUC cung cấp một điểm số duy nhất tóm tắt hiệu suất của mô hình trên tất cả các ngưỡng phân loại. Diện tích dưới đường cong Độ chính xác-Độ nhớ (AUC-PR) thường cung cấp nhiều thông tin hơn cho các tác vụ phân loại không cân bằng.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard