Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Cross-Validation

Khám phá sức mạnh của kiểm định chéo (cross-validation) trong học máy để nâng cao độ chính xác của mô hình, ngăn ngừa tình trạng quá khớp (overfitting) và đảm bảo hiệu suất mạnh mẽ.

Cross-Validation (Kiểm định chéo) là một kỹ thuật đánh giá mô hình mạnh mẽ trong học máy (ML) được sử dụng để đánh giá mức độ khái quát hóa kết quả của một phân tích thống kê cho một tập dữ liệu độc lập. Đây là một quy trình lấy mẫu lại (resampling procedure) được sử dụng để đánh giá các mô hình ML trên một mẫu dữ liệu giới hạn. Mục tiêu chính là ngăn chặn tình trạng quá khớp (overfitting), khi một mô hình học dữ liệu huấn luyện quá tốt đến mức nó hoạt động kém trên dữ liệu mới, chưa từng thấy. Bằng cách mô phỏng cách một mô hình sẽ hoạt động trong thế giới thực, Cross-Validation cung cấp một ước tính mạnh mẽ và đáng tin cậy hơn về hiệu suất của mô hình.

Cách Cross-Validation hoạt động

Phương pháp phổ biến nhất của Cross-Validation là K-Fold Cross-Validation. Quá trình này bao gồm việc phân vùng một tập dữ liệu duy nhất thành nhiều phần:

  1. Chia dữ liệu: Toàn bộ tập dữ liệu huấn luyện được chia ngẫu nhiên thành 'k' tập hợp con có kích thước bằng nhau, hoặc "folds".
  2. Huấn luyện và Xác thực Lặp đi lặp lại: Mô hình được huấn luyện 'k' lần. Trong mỗi lần lặp, một trong các fold được giữ lại làm tập validation và mô hình được huấn luyện trên k-1 fold còn lại.
  3. Đánh giá hiệu suất: Hiệu suất của mô hình được đánh giá trên phần giữ lại. Các số liệu chính, chẳng hạn như độ chính xác hoặc độ chính xác trung bình (mAP), được ghi lại cho mỗi lần lặp.
  4. Trung bình kết quả: Sau khi hoàn thành tất cả 'k' lần lặp, các số liệu hiệu suất được tính trung bình để tạo ra một ước tính duy nhất, ổn định hơn về hiệu quả của mô hình.

Phương pháp này đảm bảo rằng mọi điểm dữ liệu đều có mặt trong tập dữ liệu kiểm định chính xác một lần và trong tập dữ liệu huấn luyện k-1 lần. Hướng dẫn chi tiết về cách triển khai có thể được tìm thấy trong hướng dẫn K-Fold Cross-Validation của Ultralytics.

Cross-Validation so với Chia Tách Kiểm Định Đơn Giản

Trong một dự án ML điển hình, dữ liệu được chia thành các tập huấn luyện, xác thực và kiểm tra.

Một phân chia train/validation đơn giản đôi khi có thể gây hiểu lầm nếu tập hợp validation, do may mắn, chứa các mẫu đặc biệt dễ hoặc khó. Cross-Validation khắc phục điều này bằng cách sử dụng mọi phần của bộ dữ liệu cho cả training và validation, cung cấp một thước đo đáng tin cậy hơn về khả năng khái quát hóa của mô hình. Điều này làm cho nó đặc biệt hữu ích khi lượng dữ liệu có sẵn bị hạn chế. Các framework phổ biến như Scikit-learn cung cấp các triển khai mạnh mẽ các kỹ thuật cross-validation.

Các Ứng dụng Thực tế

Cross-Validation (Kiểm định chéo) là không thể thiếu trong việc xây dựng các hệ thống AI đáng tin cậy trong nhiều lĩnh vực khác nhau:

  1. Phân tích ảnh y tế: Khi phát triển một Mạng nơ-ron tích chập (CNN) cho phân tích ảnh y tế, chẳng hạn như phát hiện khối u trong ảnh chụp não bằng cách sử dụng các bộ dữ liệu như bộ dữ liệu U não, CV được sử dụng để đánh giá nghiêm ngặt độ chính xác chẩn đoán và khả năng tổng quát hóa của mô hình trên dữ liệu bệnh nhân đa dạng. Đánh giá mạnh mẽ này là rất quan trọng trước khi xem xét các thử nghiệm lâm sàng hoặc tìm kiếm sự chấp thuận theo quy định từ các cơ quan như FDA.
  2. Xe tự hành: Đối với các mô hình phát hiện đối tượng như Ultralytics YOLO được sử dụng trong xe tự hành, CV giúp đảm bảo hiệu suất đáng tin cậy trong việc phát hiện người đi bộ, người đi xe đạp và các phương tiện khác trong các điều kiện môi trường khác nhau. Việc xác thực này trên các bộ dữ liệu phức tạp như Argoverse là rất quan trọng trước khi triển khai mô hình trong các hệ thống quan trọng về an toàn như trong các giải pháp AI trong ngành ô tô.

Các ứng dụng khác bao gồm đánh giá các mô hình cho phân đoạn hình ảnh, các tác vụ xử lý ngôn ngữ tự nhiên (NLP) như phân tích tình cảm và đánh giá rủi ro trong mô hình tài chính. Các nền tảng như Ultralytics HUB có thể giúp quản lý các thử nghiệm và tạo tác được tạo ra trong các kỹ thuật đánh giá như vậy, hợp lý hóa vòng đời phát triển.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard