Xác định điểm tin cậy của AI. Tìm hiểu cách các mô hình đánh giá mức độ chắc chắn của dự đoán, đặt ngưỡng cho độ tin cậy và phân biệt độ tin cậy với độ chính xác.
Độ tin cậy, trong bối cảnh Trí tuệ nhân tạo (AI) và Học máy (ML) , biểu thị điểm số do mô hình gán cho dự đoán của nó, cho biết mức độ chắc chắn của mô hình về đầu ra cụ thể đó. Đối với các tác vụ như phát hiện đối tượng hoặc phân loại hình ảnh , mỗi đối tượng được phát hiện hoặc nhãn lớp được gán đều đi kèm với điểm tin cậy, thường nằm trong khoảng từ 0 đến 1 (hoặc 0% đến 100%). Điểm số này giúp người dùng đánh giá độ tin cậy của từng dự đoán do các mô hình như Ultralytics YOLO đưa ra. Điểm số cao hơn cho thấy mô hình chắc chắn hơn về dự đoán của mình dựa trên các mẫu đã học trong quá trình đào tạo . Hiểu được độ tin cậy là rất quan trọng để diễn giải đầu ra của mô hình và đưa ra quyết định sáng suốt dựa trên dự đoán của AI, đặc biệt là trong các ứng dụng quan trọng đối với sự an toàn như AI trong các giải pháp ô tô .
Điểm tin cậy thường được lấy từ lớp đầu ra của mạng nơ-ron (NN) . Đối với các tác vụ phân loại, điều này thường liên quan đến việc áp dụng hàm kích hoạt như Softmax hoặc Sigmoid vào các đầu ra thô (logits) để tạo ra các giá trị giống xác suất cho mỗi lớp. Trong các mô hình phát hiện đối tượng như YOLO , điểm tin cậy có thể kết hợp xác suất một đối tượng có mặt trong hộp giới hạn được đề xuất (thường được gọi là "điểm đối tượng") và xác suất đối tượng đó thuộc về một lớp cụ thể, tùy thuộc vào việc đối tượng đó có mặt hay không. Đây là đầu ra chính được sử dụng trong quá trình suy luận để đánh giá tính hợp lệ của các phát hiện. Điểm này được tính toán dựa trên trọng số mô hình học được từ các tập dữ liệu như COCO .
Trên thực tế, không phải tất cả các dự đoán từ một mô hình đều hữu ích hoặc đáng tin cậy như nhau. Các dự đoán có điểm tin cậy rất thấp thường biểu thị tiếng ồn nền hoặc phân loại không chắc chắn. Để lọc những điều này, một "ngưỡng tin cậy" thường được áp dụng. Đây là giá trị do người dùng xác định (ví dụ: 0,5 hoặc 50%); chỉ những dự đoán có điểm tin cậy cao hơn ngưỡng này mới được coi là đầu ra hợp lệ. Việc thiết lập một ngưỡng thích hợp là rất quan trọng và thường phụ thuộc vào ứng dụng cụ thể:
Ngưỡng tin cậy thường hoạt động kết hợp với các kỹ thuật như Non-Maximum Suppression (NMS) để tinh chỉnh bộ phát hiện cuối cùng bằng cách loại bỏ các hộp giới hạn chồng chéo cho cùng một đối tượng. Bạn có thể dễ dàng cấu hình ngưỡng này khi sử dụng Ultralytics mô hình thông qua giao diện dòng lệnh ( CLI ) hoặc Python API . Việc tìm ngưỡng tối ưu có thể liên quan đến việc điều chỉnh siêu tham số .
Điểm tin cậy đóng vai trò cơ bản trong việc triển khai các mô hình AI một cách có trách nhiệm và hiệu quả:
Điều quan trọng là không nhầm lẫn điểm tin cậy của một dự đoán riêng lẻ với các số liệu đánh giá mô hình tổng thể. Mặc dù có liên quan, chúng đo lường các khía cạnh khác nhau của hiệu suất:
Tóm lại, sự tự tin là một đầu ra có giá trị để đánh giá mức độ chắc chắn của các dự đoán AI riêng lẻ, cho phép lọc, ưu tiên và ra quyết định tốt hơn trong các ứng dụng thực tế. Nó bổ sung, nhưng khác biệt với, các số liệu đánh giá hiệu suất tổng thể của một mô hình như những số liệu được theo dõi trong Ultralytics HUB .