Xác định điểm tin cậy của AI. Tìm hiểu cách các mô hình đánh giá mức độ chắc chắn của dự đoán, đặt ngưỡng cho độ tin cậy và phân biệt độ tin cậy với độ chính xác.
Trong lĩnh vực học máy và trí tuệ nhân tạo, điểm tin cậy là một giá trị số biểu thị khả năng một dự đoán cụ thể do mô hình đưa ra là chính xác. Thường được biểu thị dưới dạng xác suất từ 0 đến 1 (hoặc tỷ lệ phần trăm từ 0% đến 100%), điểm số này định lượng mức độ chắc chắn của mạng nơ-ron liên quan đến kết quả đầu ra của nó. Ví dụ, trong một tác vụ phát hiện vật thể , hệ thống có thể dự đoán sự hiện diện của một "con mèo" với độ tin cậy là 0,95, cho thấy mức độ tin cậy cao vào độ chính xác của nhãn đó. Những điểm số này thường được lấy từ lớp cuối cùng của mô hình bằng cách sử dụng các hàm kích hoạt như hàm softmax cho các bài toán đa lớp hoặc hàm sigmoid cho phân loại nhị phân.
Điểm tin cậy là một thành phần cơ bản của quy trình làm việc của công cụ suy luận . Chúng cho phép các nhà phát triển lọc dự đoán dựa trên mức độ chắc chắn cần thiết, một quy trình được gọi là ngưỡng. Bằng cách thiết lập một ngưỡng tin cậy cụ thể, bạn có thể quản lý hiệu quả sự cân bằng giữa việc xác định mọi đối tượng có thể (độ nhớ lại cao) và đảm bảo các đối tượng được xác định là chính xác (độ chính xác cao).
Trong triển khai mô hình thực tế, các dự đoán thô thường chứa nhiễu hoặc phát hiện xác suất thấp. Các kỹ thuật như triệt tiêu không tối đa ( NMS ) sử dụng điểm tin cậy để loại bỏ các hộp chồng chéo dư thừa, chỉ giữ lại phát hiện có xác suất cao nhất. Điều này đảm bảo đầu ra cuối cùng được trình bày cho người dùng là rõ ràng và có thể thực hiện được.
Ví dụ sau đây minh họa cách áp dụng ngưỡng tin cậy trong quá trình suy luận bằng Ultralytics YOLO11 :
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image with a confidence threshold of 0.6 (60%)
# This filters out any detections with a confidence score lower than 0.6
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.6)
# Display the count of objects detected above the threshold
print(f"Detected {len(results[0].boxes)} objects with high confidence.")
Tiện ích của điểm số tin cậy mở rộng đến hầu hết mọi ngành triển khai giải pháp thị giác máy tính và AI.
Điều quan trọng đối với người thực hành là phải phân biệt "sự tin cậy" với các số liệu đánh giá tiêu chuẩn được sử dụng để đánh giá chuẩn các mô hình.
Nếu một mô hình liên tục cho kết quả độ tin cậy thấp đối với các đối tượng hợp lệ, điều đó có thể chỉ ra vấn đề với dữ liệu huấn luyện . Các chiến lược để cải thiện điều này bao gồm tăng cường dữ liệu để mô hình tiếp xúc với nhiều ánh sáng và hướng khác nhau hơn, hoặc sử dụng học tập chủ động để chú thích và huấn luyện lại các "trường hợp ngoại lệ" cụ thể mà mô hình hiện chưa chắc chắn. Việc đảm bảo các tập dữ liệu đa dạng và chất lượng cao là điều cần thiết để xây dựng các hệ thống mạnh mẽ mà người dùng có thể tin tưởng.