Accuracy
Khám phá các nguyên lý cơ bản của độ chính xác trong AI. Tìm hiểu cách đánh giá hiệu suất, tránh nghịch lý chính xác và đo lường kết quả bằng Ultralytics YOLO26.
Độ chính xác đóng vai trò là một tiêu chuẩn cơ bản trong việc đánh giá các hệ thống trí tuệ nhân tạo, định lượng tỷ lệ phần trăm các dự đoán đúng mà một model thực hiện so với tổng số dự đoán. Trong bối cảnh của machine learning và cụ thể là supervised learning, số liệu này cung cấp cái nhìn tổng quan về mức độ hiệu quả mà một thuật toán căn chỉnh với ground truth được cung cấp trong quá trình huấn luyện. Mặc dù đây là thước đo hiệu suất trực quan nhất—trả lời cho câu hỏi đơn giản, "Model đúng bao nhiêu lần?"—nó đóng vai trò là chỉ báo chính về độ tin cậy của hệ thống trước khi các lập trình viên đi sâu vào các số liệu chi tiết hơn.
Link to this sectionSự tinh tế trong việc đánh giá hiệu suất#
Mặc dù độ chính xác là một điểm khởi đầu tuyệt vời, nhưng nó hiệu quả nhất khi được áp dụng cho training data cân bằng, nơi tất cả các lớp (class) được đại diện như nhau. Ví dụ, trong một tác vụ image classification tiêu chuẩn phân biệt giữa mèo và chó, nếu tập dữ liệu chứa 500 hình ảnh của mỗi loại, độ chính xác là một số liệu đáng tin cậy. Tuy nhiên, các thách thức sẽ nảy sinh với imbalanced datasets, dẫn đến "nghịch lý độ chính xác."
Nếu một model được huấn luyện cho fraud detection nơi chỉ có 1% giao dịch là gian lận, một model chỉ đơn giản dự đoán mọi giao dịch là "hợp lệ" sẽ đạt được độ chính xác 99% trong khi thất bại hoàn toàn ở tác vụ dự định của nó. Để giảm thiểu điều này, các kỹ sư thường sử dụng Ultralytics Platform để trực quan hóa sự phân phối của tập dữ liệu và đảm bảo các model không chỉ đơn thuần ghi nhớ lớp chiếm đa số.
Link to this sectionPhân biệt độ chính xác với các thuật ngữ liên quan#
Để hiểu đầy đủ về hiệu suất của model, việc phân biệt độ chính xác với các số liệu tương tự là rất quan trọng:
- Precision: Số liệu này đo lường chất lượng của các dự đoán dương tính. Nó đặt câu hỏi: "Trong tất cả các trường hợp được dự đoán là dương tính, bao nhiêu trường hợp thực sự là dương tính?"
- Recall: Còn được gọi là độ nhạy, số liệu này đo lường khả năng của model trong việc tìm ra tất cả các trường hợp liên quan. Nó đặt câu hỏi: "Trong tất cả các trường hợp dương tính thực tế, model đã xác định đúng bao nhiêu trường hợp?"
- F1-Score: Đây là trung bình điều hòa của precision và recall, cung cấp một điểm số duy nhất giúp cân bằng hai số liệu này, đặc biệt hữu ích cho các phân phối lớp không đồng đều.
Trong khi độ chính xác cung cấp cái nhìn tổng thể về sự đúng đắn, precision và recall cung cấp thông tin chi tiết về các loại lỗi cụ thể, chẳng hạn như dương tính giả hoặc âm tính giả.
Link to this sectionCác ứng dụng trong thực tế#
Tiện ích của độ chính xác mở rộng trên nhiều ngành công nghiệp đa dạng, xác thực độ tin cậy của computer vision và các model dự đoán trong các môi trường quan trọng.
- Chẩn đoán y tế: Trong lĩnh vực medical image analysis, các model được sử dụng để phân loại ảnh X-quang hoặc quét MRI. Một model phân loại các bản quét là "khỏe mạnh" hoặc "bệnh lý" dựa vào độ chính xác cao để đảm bảo bệnh nhân nhận được chẩn đoán chính xác. Các đổi mới trong AI in healthcare phụ thuộc rất nhiều vào việc xác thực nghiêm ngặt để giảm thiểu các lỗi tự động.
- Kiểm soát chất lượng trong sản xuất: Các hệ thống tự động trong smart manufacturing sử dụng kiểm tra trực quan để xác định lỗi trên dây chuyền lắp ráp. Độ chính xác cao đảm bảo rằng chỉ những sản phẩm không có lỗi mới được xuất xưởng, giảm thiểu lãng phí và chi phí bảo hành. Bằng cách sử dụng object detection để phát hiện các lỗ hổng, các nhà máy duy trì tiêu chuẩn sản xuất một cách tự động.
Link to this sectionĐo lường độ chính xác trong code#
Trong các kịch bản thực tế sử dụng Python, các lập trình viên có thể dễ dàng đo lường độ chính xác của một model bằng cách sử dụng các thư viện đã được thiết lập. Ví dụ sau đây minh họa cách xác thực một model phân loại YOLO26 để có được độ chính xác top-1. Độ chính xác top-1 đề cập đến tần suất mà dự đoán có xác suất cao nhất của model khớp với nhãn đúng.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Validate the model on a standard dataset (e.g., MNIST)
metrics = model.val(data="mnist")
# Print the Top-1 Accuracy
print(f"Top-1 Accuracy: {metrics.top1:.4f}")Link to this sectionCác chiến lược để cải thiện#
Khi một model gặp vấn đề về độ chính xác thấp, một số kỹ thuật có thể được áp dụng để nâng cao hiệu suất. Các kỹ sư thường sử dụng data augmentation để tăng cường nhân tạo tính đa dạng của tập huấn luyện, ngăn chặn model bị overfitting. Ngoài ra, hyperparameter tuning—điều chỉnh các thiết lập như learning rate—có thể ảnh hưởng đáng kể đến sự hội tụ. Đối với các tác vụ phức tạp, transfer learning cho phép một model tận dụng kiến thức từ một tập dữ liệu lớn đã được huấn luyện trước (như ImageNet) để đạt được độ chính xác cao hơn trên một tập dữ liệu nhỏ hơn, cụ thể hơn.






