Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Recall

Tìm hiểu Recall là gì trong machine learning, tại sao nó lại quan trọng và cách nó đảm bảo các mô hình AI nắm bắt hiệu quả các trường hợp dương tính quan trọng.

Độ nhạy (Recall), thường được gọi là độ chính xác hoặc tỷ lệ dương tính thực, là một chỉ số hiệu suất cơ bản được sử dụng để đánh giá hiệu quả của các mô hình phân loại và phát hiện. Trong lĩnh vực học máy (ML) rộng lớn, độ nhạy đo lường khả năng của một mô hình trong việc xác định tất cả các trường hợp liên quan trong một tập dữ liệu. Nói một cách đơn giản, nó trả lời câu hỏi quan trọng: "Trong tất cả các trường hợp dương tính thực tế, mô hình đã tìm thấy thành công bao nhiêu trường hợp?" Chỉ số này đặc biệt quan trọng trong các trường hợp bỏ sót mục tiêu — một loại lỗi khác biệt được gọi là âm tính giả — có thể dẫn đến những hậu quả nghiêm trọng.

Tầm quan trọng của việc thu hồi trong AI

Mặc dù độ chính xác cung cấp một cái nhìn tổng quát về các dự đoán đúng, nhưng nó có thể gây hiểu lầm, đặc biệt khi xử lý các tập dữ liệu không cân bằng . Ví dụ, nếu một tập dữ liệu chứa 99 bệnh nhân khỏe mạnh và chỉ có 1 bệnh nhân bị bệnh, một mô hình dự đoán "khỏe mạnh" cho tất cả mọi người sẽ đạt được độ chính xác 99% nhưng độ thu hồi (recall) cho bệnh tật là 0%. Độ thu hồi cao đảm bảo rằng hệ thống sẽ bao quát một phạm vi rộng để thu thập càng nhiều trường hợp dương tính thực sự càng tốt.

Điều này thường liên quan đến sự đánh đổi với độ chính xác , thước đo chất lượng hoặc độ tin cậy của các dự đoán tích cực. Việc tăng độ thu hồi bằng cách hạ thấp ngưỡng tin cậy thường dẫn đến nhiều kết quả dương tính giả (báo động sai), do đó làm giảm độ chính xác. Các kỹ sư thường phân tích đường cong Độ chính xác-Độ thu hồi để tìm điểm hoạt động tối ưu cho ứng dụng cụ thể của họ.

Phân biệt các khái niệm liên quan

Hiểu được mối liên hệ giữa độ thu hồi và các chỉ số khác là điều cần thiết để diễn giải những hiểu biết từ việc đánh giá mô hình .

  • Độ nhạy so với Độ chính xác: Độ chính xác tính đến cả trường hợp dương tính thật và âm tính thật. Độ nhạy bỏ qua hoàn toàn các trường hợp âm tính thật, chỉ tập trung vào số lượng trường hợp dương tính thực sự được phát hiện. Điều này làm cho độ nhạy trở thành thước đo vượt trội hơn cho các nhiệm vụ phát hiện bất thường khi các trường hợp dương tính hiếm gặp.
  • Độ nhạy (Recall) so với độ chính xác (Precision): Độ chính xác hỏi, "Trong tất cả các trường hợp dương tính được dự đoán, có bao nhiêu trường hợp là dương tính thật?" Độ nhạy hỏi, "Trong tất cả các trường hợp dương tính thật, có bao nhiêu trường hợp đã được dự đoán?"
  • Điểm F1: Khi cần cân bằng giữa độ thu hồi và độ chính xác, điểm F1 cung cấp giá trị trung bình hài hòa của cả hai, đưa ra một chỉ số duy nhất để đánh giá hiệu quả tổng thể.
  • Ma trận nhầm lẫn: Độ thu hồi được tính toán bằng cách sử dụng các giá trị thu được từ ma trận nhầm lẫn , cụ thể là tỷ lệ giữa số lượng kết quả dương tính thật và tổng số kết quả dương tính thật cộng với kết quả âm tính giả.

Các Ứng dụng Thực tế

Khả năng nhớ lại là chỉ số quan trọng hàng đầu trong nhiều giải pháp AI an toàn. Dưới đây là hai ví dụ nổi bật cho thấy độ nhạy được ưu tiên:

  • Chẩn đoán y tế: Trong phân tích hình ảnh y tế , chẳng hạn như chụp X-quang sàng lọc các dấu hiệu sớm của bệnh, độ chính xác cao là điều không thể thiếu. Nếu trí tuệ nhân tạo được sử dụng trong hệ thống chăm sóc sức khỏe để detect Đối với các khối u, việc hệ thống phát hiện một vùng mờ đáng ngờ hóa ra là lành tính (dương tính giả) còn tốt hơn là bỏ sót hoàn toàn một khối u ác tính. Các bác sĩ dựa vào những công cụ này như một mạng lưới an toàn, đảm bảo không bỏ sót bất kỳ rủi ro sức khỏe tiềm ẩn nào.
  • An ninh và Giám sát: Đối với hệ thống báo động an ninh , mục tiêu chính là detect mọi nỗ lực xâm nhập. Một hệ thống được tối ưu hóa cho khả năng ghi nhớ cao đảm bảo rằng nếu một người đi vào khu vực hạn chế, báo động sẽ được kích hoạt. Mặc dù điều này có thể dẫn đến một số báo động giả do động vật hoang dã gây ra, nhưng điều này vẫn tốt hơn là hệ thống không hoạt động. detect Một kẻ xâm nhập thực sự. Các mô hình phát hiện đối tượng trong những tình huống này được tinh chỉnh để đảm bảo độ nhạy tối đa đối với các mối đe dọa tiềm tàng.

Đo lường thu hồi với Ultralytics YOLO

Khi huấn luyện các mô hình như YOLO26 tiên tiến hoặc YOLO11 được sử dụng rộng rãi, độ thu hồi (recall) được tính toán tự động trong giai đoạn xác thực . Khung phần mềm tính toán độ thu hồi cho mỗi lớp và độ chính xác trung bình ( mAP ) , giúp các nhà phát triển đánh giá mức độ hiệu quả của mô hình trong việc tìm kiếm đối tượng.

Bạn có thể dễ dàng xác thực mô hình đã được huấn luyện và xem các chỉ số độ chính xác của nó bằng cách sử dụng Python Đoạn mã này minh họa cách tải một mô hình và kiểm tra hiệu năng của nó trên một tập dữ liệu chuẩn:

from ultralytics import YOLO

# Load a pretrained model (YOLO11 used here for demonstration)
model = YOLO("yolo11n.pt")

# Validate the model on the COCO8 dataset
# The results object contains metrics like Precision, Recall, and mAP
metrics = model.val(data="coco8.yaml")

# Access and print the mean recall score for box detection
print(f"Mean Recall: {metrics.results_dict['metrics/recall(B)']}")

Đoạn mã này sử dụng API Ultralytics để chạy quá trình xác thực. Nếu độ thu hồi (recall) thấp hơn mức yêu cầu cho dự án của bạn, bạn có thể xem xét các kỹ thuật như tăng cường dữ liệu để tạo ra nhiều ví dụ huấn luyện đa dạng hơn hoặc điều chỉnh siêu tham số để điều chỉnh độ nhạy của mô hình.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay