Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Độ chính xác (Accuracy)

Khám phá tầm quan trọng của độ chính xác trong học máy, cách tính toán, các hạn chế với bộ dữ liệu không cân bằng và các cách để cải thiện hiệu suất mô hình.

Độ chính xác là một trong những số liệu đánh giá cơ bản và trực quan nhất trong học máy (ML). Nó đo lường tỷ lệ dự đoán đúng được thực hiện bởi một mô hình trên tổng số các dự đoán đã được thực hiện. Do tính đơn giản của nó, độ chính xác thường là số liệu đầu tiên mà các nhà phát triển xem xét để có được cảm nhận chung về hiệu suất của một mô hình AI, đặc biệt là trong các tác vụ phân loại. Nó đóng vai trò như một kiểm tra nhanh về tình trạng trước khi đi sâu vào các đánh giá sắc thái hơn.

Các Ứng dụng Thực tế

Độ chính xác là một chỉ số hiệu suất quan trọng trong nhiều lĩnh vực mà phân loại là rất quan trọng. Dưới đây là hai ví dụ:

  • Chẩn đoán y tế: Trong chăm sóc sức khỏe được hỗ trợ bởi AI, một mô hình được thiết kế để phân tích hình ảnh y tế có thể được huấn luyện để phân loại hình ảnh X-quang là có dấu hiệu viêm phổi hay không. Độ chính xác cao có nghĩa là mô hình xác định chính xác sự hiện diện hoặc không có bệnh trong một tỷ lệ phần trăm cao của các trường hợp, cung cấp hỗ trợ đáng tin cậy cho các bác sĩ радиologist.
  • Kiểm soát Chất lượng Sản xuất: Trong sản xuất thông minh, một hệ thống thị giác máy tính có thể được triển khai để kiểm tra các sản phẩm trên băng chuyền. Mô hình phân loại từng mặt hàng là "lỗi" hoặc "không lỗi". Độ chính xác cao đảm bảo rằng các sản phẩm bị lỗi được xác định chính xác để loại bỏ đồng thời giảm thiểu việc gắn cờ sai các sản phẩm tốt, ảnh hưởng trực tiếp đến hiệu quả và chất lượng sản xuất.

Hạn chế về Độ chính xác

Mặc dù hữu ích, độ chính xác có thể gây hiểu lầm, đặc biệt khi xử lý các tập dữ liệu không cân bằng. Một tập dữ liệu không cân bằng là tập dữ liệu mà số lượng ví dụ trong các lớp khác nhau thay đổi đáng kể. Ví dụ: trong phát hiện gian lận, các giao dịch hợp pháp vượt trội hơn rất nhiều so với các giao dịch gian lận. Một mô hình luôn dự đoán "không gian lận" có thể đạt được độ chính xác trên 99% nhưng sẽ hoàn toàn vô dụng cho mục đích dự định của nó. Điều này là do nó không xác định được các trường hợp hiếm gặp nhưng quan trọng. Kịch bản này làm nổi bật nghịch lý về độ chính xác, trong đó điểm số độ chính xác cao mang lại cảm giác sai lầm về hiệu quả của mô hình.

Độ chính xác so với các số liệu khác

Để có được bức tranh đầy đủ về hiệu suất của một mô hình, điều quan trọng là phải xem xét các số liệu khác bên cạnh độ chính xác.

  • Độ chính xác (Precision): Đo lường tỷ lệ các dự đoán dương tính thực sự chính xác. Nó trả lời câu hỏi: "Trong tất cả các dự đoán tôi đã thực hiện cho lớp dương tính, có bao nhiêu dự đoán đúng?" Độ chính xác cao là rất quan trọng khi chi phí của một dương tính giả là cao.
  • Recall (Độ phủ): Còn được gọi là độ nhạy, số liệu này đo lường tỷ lệ các kết quả dương tính thực tế được xác định chính xác. Nó trả lời, "Trong tất cả các trường hợp dương tính thực tế, mô hình của tôi đã tìm thấy bao nhiêu?" Độ phủ cao là rất quan trọng khi chi phí của một âm tính giả là cao, chẳng hạn như trong sàng lọc y tế.
  • F1-Score: Đây là trung bình điều hòa của độ chính xác (precision) và độ phủ (recall), cung cấp một điểm số duy nhất cân bằng cả hai. Nó đặc biệt hữu ích để đánh giá các mô hình trên các tập dữ liệu không cân bằng, nơi cả dương tính giả và âm tính giả đều quan trọng.
  • Confusion Matrix (Ma trận nhầm lẫn): Một bảng trực quan hóa hiệu suất của một mô hình phân loại bằng cách hiển thị số lượng true positives (dự đoán đúng là dương tính), true negatives (dự đoán đúng là âm tính), false positives (dự đoán sai là dương tính) và false negatives (dự đoán sai là âm tính). Nó cung cấp dữ liệu cần thiết để tính toán độ chính xác (accuracy), độ chuẩn xác (precision) và độ bao phủ (recall).
  • Độ chính xác trung bình (mAP): Đối với các tác vụ phức tạp hơn như phát hiện đối tượng, mAP là thước đo tiêu chuẩn. Nó đánh giá không chỉ tính đúng đắn của phân loại mà còn cả độ chính xác vị trí của bounding box được dự đoán trên các mức độ tin cậy khác nhau. Để hiểu sâu hơn, bạn có thể khám phá nhiều so sánh mô hình khác nhau.

Cải thiện độ chính xác của mô hình

Một số kỹ thuật có thể giúp cải thiện độ chính xác của mô hình, mặc dù thường liên quan đến sự đánh đổi với các số liệu khác hoặc chi phí tính toán:

Tham khảo các tài nguyên như Mẹo huấn luyện mô hình có thể cung cấp hướng dẫn thực tế. Các nền tảng như Ultralytics HUB cho phép người dùng huấn luyện mô hình và dễ dàng theo dõi độ chính xác cùng với các số liệu quan trọng khác, thường được trực quan hóa bằng các công cụ như TensorBoard. Việc theo dõi tiến trình trong lĩnh vực này có thể được thực hiện thông qua các tài nguyên như Báo cáo chỉ số AI của Stanford hoặc duyệt các bộ dữ liệu trên Papers With Code. Các framework như PyTorchTensorFlow thường được sử dụng để xây dựng và huấn luyện các mô hình này.

Tóm lại, mặc dù độ chính xác là một số liệu trực quan và có giá trị để đánh giá hiệu suất của mô hình AI, nhưng hiếm khi nó được sử dụng một cách độc lập. Việc xem xét các mục tiêu cụ thể của tác vụ ML và bản chất của dữ liệu, đặc biệt là sự mất cân bằng tiềm ẩn hoặc chi phí khác nhau của các lỗi, là điều cần thiết để chọn các số liệu đánh giá phù hợp nhất. Sử dụng các kỹ thuật từ AI có thể giải thích (Explainable AI - XAI) cũng có thể cung cấp những hiểu biết sâu sắc hơn ngoài các giá trị số liệu đơn lẻ.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard