Khám phá tầm quan trọng của độ chính xác trong học máy, tính toán của nó, những hạn chế với tập dữ liệu mất cân bằng và cách cải thiện hiệu suất mô hình.
Độ chính xác là một trong những số liệu cơ bản và trực quan nhất được sử dụng để đánh giá hiệu suất của các mô hình Học máy (ML) , đặc biệt là trong các tác vụ phân loại trong Trí tuệ nhân tạo (AI) và Thị giác máy tính (CV) . Nó biểu thị tỷ lệ dự đoán chính xác do mô hình AI đưa ra trong tổng số dự đoán. Mặc dù dễ hiểu và tính toán, nhưng đôi khi chỉ dựa vào độ chính xác có thể gây hiểu lầm, đặc biệt là khi xử lý một số loại tập dữ liệu hoặc yêu cầu vấn đề cụ thể.
Độ chính xác được tính bằng cách chia số dự đoán đúng (cả dương tính thật và âm tính thật) cho tổng số dự đoán được đưa ra. Ví dụ, nếu một mô hình xác định đúng 90 trong số 100 hình ảnh, độ chính xác của nó là 90%. Sự đơn giản này khiến nó trở thành điểm khởi đầu phổ biến để đánh giá hiệu suất của mô hình.
Độ chính xác cung cấp một thước đo trực tiếp về tần suất chính xác của một mô hình nói chung. Nó được sử dụng rộng rãi trong các giai đoạn đầu của quá trình phát triển mô hình và đào tạo mô hình để có được cảm nhận chung về hiệu suất. Độ chính xác cao thường là mục tiêu chính của nhiều ứng dụng, cho thấy mô hình tổng quát hóa tốt với dữ liệu mới, chưa từng thấy. Nhiều mô hình tiên tiến, chẳng hạn như Ultralytics YOLO để phát hiện đối tượng , phấn đấu đạt được độ chính xác cao trong khi cân bằng các yếu tố khác như tốc độ. Bạn có thể xem các so sánh như YOLO11 so với YOLOv8 thường làm nổi bật các điểm chuẩn về độ chính xác.
Mặc dù có tính trực quan, độ chính xác vẫn có những hạn chế đáng kể:
Do những hạn chế về độ chính xác, đặc biệt là với dữ liệu mất cân bằng hoặc chi phí lỗi khác nhau, các số liệu khác thường được ưu tiên hoặc sử dụng cùng với nó:
Hiểu được các số liệu hiệu suất YOLO khác nhau này cho phép đánh giá sắc thái hơn về hiệu suất của mô hình phù hợp với các nhu cầu cụ thể.
Một số kỹ thuật có thể giúp cải thiện độ chính xác của mô hình, mặc dù thường liên quan đến sự đánh đổi với các số liệu khác hoặc chi phí tính toán:
Các nguồn tham khảo như Model Training Tips có thể cung cấp hướng dẫn thực tế. Các nền tảng như Ultralytics HUB cho phép người dùng đào tạo các mô hình và dễ dàng theo dõi độ chính xác cùng với các số liệu quan trọng khác, thường được trực quan hóa bằng các công cụ như TensorBoard . Việc theo dõi tiến độ trong lĩnh vực này có thể được thực hiện thông qua các nguồn như Báo cáo chỉ số AI của Stanford hoặc duyệt các tập dữ liệu trên Papers With Code . Các khuôn khổ như PyTorch (xem trang web chính thức ) và TensorFlow (xem trang web chính thức ) thường được sử dụng để xây dựng và đào tạo các mô hình này.
Tóm lại, trong khi độ chính xác là một số liệu có giá trị và trực quan để đánh giá hiệu suất của mô hình AI , thì nó hiếm khi được sử dụng riêng lẻ. Việc xem xét các mục tiêu cụ thể của tác vụ ML và bản chất của dữ liệu, đặc biệt là sự mất cân bằng tiềm ẩn hoặc chi phí khác nhau của lỗi, là điều cần thiết để lựa chọn các số liệu đánh giá phù hợp nhất như độ chính xác, khả năng thu hồi, điểm F1 hoặc mAP. Việc sử dụng các kỹ thuật từ AI có thể giải thích (XAI) cũng có thể cung cấp những hiểu biết sâu sắc hơn ngoài các giá trị số liệu đơn lẻ.