Confusion Matrix

Tìm hiểu cách confusion matrix đánh giá hiệu suất phân loại. Khám phá TP, FP, TN và FN để tối ưu hóa các model Ultralytics YOLO26 của bạn nhằm đạt độ chính xác tốt hơn.

Ma trận nhầm lẫn là một công cụ đo lường hiệu suất cho các bài toán phân loại trong học máy, nơi đầu ra có thể bao gồm hai hoặc nhiều lớp. Đây là một bảng bao gồm bốn tổ hợp khác nhau giữa giá trị dự đoán và giá trị thực tế, đóng vai trò là yếu tố nền tảng cho trực quan hóa dữ liệu trong đánh giá mô hình. Khác với độ chính xác (accuracy) đơn thuần, vốn có thể gây hiểu lầm nếu tập dữ liệu không cân bằng, ma trận nhầm lẫn cung cấp một sự phân tích chi tiết về vị trí mà mô hình thị giác máy tính (CV) đang mắc lỗi. Bằng cách so sánh các dự đoán với nhãn sự thật cơ sở, các nhà phát triển có thể xác định xem hệ thống có đang nhầm lẫn giữa hai lớp cụ thể hay hoàn toàn không phát hiện được đối tượng.

Link to this sectionCác thành phần cốt lõi của ma trận#

Bản thân ma trận thường được chia thành bốn góc phần tư cho phân loại nhị phân, mặc dù nó mở rộng đối với các bài toán đa lớp như những bài toán được xử lý bởi Ultralytics YOLO26. Bốn thành phần này đại diện cho sự giao thoa giữa những gì mô hình dự đoán so với những gì thực sự tồn tại trong hình ảnh.

True Positives (TP): Mô hình dự đoán chính xác lớp dương tính. Ví dụ, trong một tác vụ phát hiện đối tượng, mô hình vẽ thành công khung bao quanh một người thực sự có mặt trong khung hình.
True Negatives (TN): Mô hình dự đoán chính xác lớp âm tính. Điều này rất quan trọng trong các kịch bản như phát hiện bất thường, nơi hệ thống xác định chính xác rằng một linh kiện sản xuất không có lỗi.
False Positives (FP): Mô hình dự đoán sai lớp dương tính. Thường được gọi là "lỗi loại I", điều này xảy ra khi hệ thống phát hiện một đối tượng không tồn tại, chẳng hạn như camera an ninh gắn cờ một cái bóng là kẻ xâm nhập.
False Negatives (FN): Mô hình dự đoán sai lớp âm tính. Được biết đến là "lỗi loại II", điều này xảy ra khi mô hình không phát hiện được một đối tượng hiện có, về cơ bản là "bỏ lỡ" mục tiêu.

Link to this sectionCác số liệu bắt nguồn và ý nghĩa#

Các con số thô trong ma trận nhầm lẫn được sử dụng để tính toán các số liệu nâng cao hơn nhằm mô tả hiệu suất mô hình. Hiểu được các giá trị phái sinh này là điều cần thiết để tối ưu hóa mạng thần kinh.

Precision: Được tính bằng TP / (TP + FP), số liệu này tiết lộ mức độ chính xác của các dự đoán dương tính. Độ chính xác cao nghĩa là ít báo động giả hơn.
Recall (Sensitivity): Được tính bằng TP / (TP + FN), số liệu này đo lường khả năng tìm thấy tất cả các trường hợp dương tính của mô hình. Độ nhạy cao là rất quan trọng khi việc bỏ sót một đối tượng có hậu quả nghiêm trọng.
F1 Score: Trung bình điều hòa của precision và recall. Nó cung cấp một điểm số duy nhất cân bằng sự đánh đổi giữa hai yếu tố, hữu ích cho việc so sánh các mô hình YOLO26 khác nhau.

Link to this sectionCác ứng dụng trong thực tế#

Chi phí cụ thể của các lỗi được xác định bởi ma trận nhầm lẫn quyết định cách các mô hình được tinh chỉnh cho các ngành công nghiệp khác nhau.

Trong lĩnh vực AI trong chăm sóc sức khỏe, ma trận nhầm lẫn là vấn đề về an toàn. Khi huấn luyện một mô hình cho phân tích hình ảnh y tế để phát hiện khối u, một False Negative (bỏ sót khối u) tồi tệ hơn nhiều so với một False Positive (đánh dấu một điểm lành tính để bác sĩ xem xét). Do đó, các kỹ sư ưu tiên Recall hơn Precision trong các ma trận này để đảm bảo không bỏ sót các rủi ro sức khỏe tiềm ẩn.

Ngược lại, trong kiểm soát chất lượng sản xuất, hiệu quả là yếu tố then chốt. Nếu một hệ thống phân loại linh kiện trên dây chuyền lắp ráp tạo ra quá nhiều False Positives (đánh dấu linh kiện tốt là bị lỗi), nó gây ra sự lãng phí không cần thiết và làm chậm quá trình sản xuất. Ở đây, ma trận nhầm lẫn giúp các kỹ sư tinh chỉnh mô hình để tối đa hóa Precision, đảm bảo rằng những gì bị từ chối thực sự bị lỗi, hợp lý hóa các quy trình học máy tự động.

Link to this sectionTạo ma trận nhầm lẫn với YOLO26#

Khi sử dụng các framework hiện đại, việc tạo ra ma trận này thường là một phần của quy trình xác thực tiêu chuẩn. Ví dụ dưới đây minh họa cách xác thực một mô hình YOLO26 và truy cập dữ liệu ma trận nhầm lẫn bằng cách sử dụng gói ultralytics.

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")

# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)

Link to this sectionPhân biệt các khái niệm liên quan#

Điều quan trọng là phải phân biệt ma trận nhầm lẫn với các thuật ngữ đánh giá tương tự.

So với Accuracy: Accuracy chỉ đơn giản là tỷ lệ dự đoán đúng trên tổng số dự đoán. Mặc dù hữu ích, accuracy có thể rất dễ gây hiểu lầm trong các tập dữ liệu không cân bằng. Ví dụ, nếu 95% email không phải là spam, một mô hình dự đoán "không phải spam" cho mọi email sẽ đạt độ chính xác 95% nhưng lại vô dụng. Ma trận nhầm lẫn tiết lộ sai sót này bằng cách hiển thị không có True Positives nào cho lớp spam.
So với ROC Curve: Ma trận nhầm lẫn cung cấp một ảnh chụp nhanh về hiệu suất tại một ngưỡng tự tin cụ thể. Ngược lại, đường cong Receiver Operating Characteristic (ROC) trực quan hóa cách tỷ lệ True Positive và tỷ lệ False Positive thay đổi khi ngưỡng đó thay đổi. Các công cụ như Nền tảng Ultralytics cho phép người dùng khám phá cả hai hình ảnh trực quan để chọn điểm vận hành tối ưu cho việc triển khai của họ.

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Confusion Matrix

Link to this sectionCác thành phần cốt lõi của ma trận#

Link to this sectionCác số liệu bắt nguồn và ý nghĩa#

Link to this sectionCác ứng dụng trong thực tế#

Link to this sectionTạo ma trận nhầm lẫn với YOLO26#

Link to this sectionPhân biệt các khái niệm liên quan#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!