Tối ưu hóa các mô hình máy học bằng dữ liệu validation để ngăn ngừa overfitting, tinh chỉnh các siêu tham số và đảm bảo hiệu suất mạnh mẽ trong thế giới thực.
Dữ liệu xác thực đóng vai trò là điểm kiểm tra quan trọng trong vòng đời phát triển máy học, hoạt động như một tập dữ liệu trung gian được sử dụng để đánh giá hiệu suất của mô hình trong quá trình huấn luyện. Không giống như tập dữ liệu chính được sử dụng để dạy thuật toán, tập dữ liệu xác thực cung cấp ước tính khách quan về mức độ hệ thống học cách khái quát hóa đối với thông tin mới, chưa từng thấy. Bằng cách theo dõi các chỉ số trên tập con cụ thể này, các nhà phát triển có thể tinh chỉnh cấu hình của mô hình và xác định các vấn đề tiềm ẩn như quá khớp , trong đó hệ thống ghi nhớ các ví dụ huấn luyện thay vì hiểu các mẫu cơ bản. Vòng phản hồi này rất cần thiết để tạo ra các giải pháp trí tuệ nhân tạo (AI) mạnh mẽ hoạt động đáng tin cậy trong thế giới thực.
Chức năng chính của dữ liệu kiểm định là hỗ trợ tối ưu hóa các siêu tham số . Trong khi các tham số nội bộ, chẳng hạn như trọng số mô hình , được học tự động thông qua quá trình huấn luyện, thì các siêu tham số—bao gồm tốc độ học , kích thước lô và kiến trúc mạng—phải được thiết lập thủ công hoặc được tìm ra thông qua thử nghiệm.
Validation data allows engineers to compare different configurations effectively via model selection. For example, if a developer is training a YOLO26 model, they might test three different learning rates. The version that yields the highest accuracy on the validation set is typically selected. This process helps navigate the bias-variance tradeoff, ensuring the model is complex enough to capture data nuances but simple enough to remain generalizable.
Để đảm bảo tính chính xác khoa học, một tập dữ liệu hoàn chỉnh thường được chia thành ba tập con riêng biệt. Hiểu rõ mục đích riêng của từng tập con là điều vô cùng quan trọng để quản lý dữ liệu hiệu quả.
Trong Ultralytics Trong hệ sinh thái này, việc xác thực mô hình là một quy trình được đơn giản hóa. Khi người dùng bắt đầu huấn luyện hoặc xác thực, khung phần mềm sẽ tự động sử dụng các hình ảnh được chỉ định trong cấu hình YAML của tập dữ liệu. Điều này tính toán các chỉ số hiệu suất chính như Độ chính xác trung bình ( mAP ) , giúp người dùng đánh giá độ chính xác của các tác vụ phát hiện hoặc phân đoạn đối tượng của họ.
Ví dụ sau đây minh họa cách xác thực mô hình YOLO26 đã được huấn luyện trước trên tập dữ liệu COCO8 tiêu chuẩn bằng cách sử dụng Python :
from ultralytics import YOLO
# Load the YOLO26 model (recommended for state-of-the-art performance)
model = YOLO("yolo26n.pt")
# Validate the model using the 'val' mode
# The 'data' argument points to the dataset config containing the validation split
metrics = model.val(data="coco8.yaml")
# Print the Mean Average Precision at IoU 0.5-0.95
print(f"Validation mAP50-95: {metrics.box.map}")
Dữ liệu xác thực là không thể thiếu trong nhiều ngành công nghiệp, nơi độ chính xác và độ tin cậy là yếu tố không thể thỏa hiệp.
In scenarios where data is scarce, setting aside a dedicated 20% for validation might remove too much valuable training information. In such cases, practitioners often employ Cross-Validation, specifically K-Fold Cross-Validation. This technique involves partitioning the data into 'K' subsets and rotating which subset serves as the validation data. This ensures that every data point is used for both training and validation, providing a statistically more robust estimate of model performance as described in statistical learning theory.
Effective use of validation data is a cornerstone of professional Machine Learning Operations (MLOps). By leveraging tools like the Ultralytics Platform, teams can automate the management of these datasets, ensuring that models are rigorously tested and optimized before they ever reach production.