Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Bộ dữ liệu chuẩn

Khám phá cách các bộ dữ liệu chuẩn thúc đẩy sự đổi mới AI bằng cách cho phép đánh giá mô hình công bằng, khả năng tái tạo và tiến bộ trong máy học.

Một bộ dữ liệu chuẩn là một bộ dữ liệu tiêu chuẩn hóa, chất lượng cao được sử dụng trong học máy (ML) để đánh giá và so sánh hiệu suất của các thuật toán và mô hình khác nhau một cách công bằng, có thể tái tạo. Các bộ dữ liệu này được tuyển chọn cẩn thận và được cộng đồng nghiên cứu chấp nhận rộng rãi, đóng vai trò là nền tảng chung để đo lường tiến bộ trong các tác vụ cụ thể như phát hiện đối tượng hoặc phân loại hình ảnh. Bằng cách kiểm tra các mô hình dựa trên cùng một dữ liệu và các số liệu đánh giá, các nhà nghiên cứu và nhà phát triển có thể xác định một cách khách quan phương pháp nào hiệu quả hơn, nhanh hơn hoặc hiệu quả hơn. Việc sử dụng các chuẩn mực là nền tảng để nâng cao trình độ hiện tại trong trí tuệ nhân tạo (AI).

Tầm quan trọng của việc Đánh giá hiệu năng (Benchmarking)

Trong lĩnh vực thị giác máy tính (CV) đang phát triển nhanh chóng, các tập dữ liệu chuẩn (benchmark datasets) là không thể thiếu. Chúng cung cấp một cơ sở ổn định để đánh giá các cải tiến và đổi mới của mô hình. Nếu không có chúng, sẽ rất khó để biết liệu một kiến trúc mô hình mới hoặc kỹ thuật huấn luyện có thực sự đại diện cho một tiến bộ hay không, hay hiệu suất của nó chỉ đơn giản là do được thử nghiệm trên một tập dữ liệu khác, có khả năng dễ hơn. Bảng xếp hạng công khai, thường liên quan đến các thử thách như ImageNet Large Scale Visual Recognition Challenge (ILSVRC), sử dụng các tập dữ liệu này để thúc đẩy sự cạnh tranh lành mạnh và theo dõi tiến độ một cách minh bạch. Quá trình này khuyến khích sự phát triển của các mô hình mạnh mẽ và tổng quát hơn, điều này rất quan trọng đối với việc triển khai mô hình trong thế giới thực.

Các ví dụ thực tế

  1. So Sánh Các Mô Hình Nhận Diện Đối Tượng: Khi Ultralytics phát triển một mô hình mới như YOLO11, hiệu suất của nó được kiểm tra nghiêm ngặt trên các tập dữ liệu chuẩn như COCO. Các kết quả, được đo bằng các chỉ số như độ chính xác trung bình (mAP), được so sánh với các phiên bản trước đó (YOLOv8, YOLOv10) và các mô hình hiện đại khác. Các so sánh mô hình này giúp người dùng chọn mô hình tốt nhất cho nhu cầu của họ. Các nền tảng như Ultralytics HUB cho phép người dùng huấn luyện các mô hình và đánh giá chúng trên dữ liệu tùy chỉnh.
  2. Thúc đẩy Lái xe Tự hành: Các công ty phát triển công nghệ cho xe tự hành dựa nhiều vào các bộ tiêu chuẩn như Argoverse hoặc nuScenes. Các bộ dữ liệu này chứa các tình huống lái xe đô thị phức tạp với các chú thích chi tiết cho ô tô, người đi bộ và người đi xe đạp. Bằng cách đánh giá các mô hình tri giác của họ trên các bộ tiêu chuẩn này, các công ty có thể đo lường những cải tiến về độ chính xác phát hiện, độ tin cậy theo dõi và tính ổn định tổng thể của hệ thống, điều này rất quan trọng để đảm bảo an toàn trong AI cho xe tự lái.

So sánh hiệu năng với các bộ dữ liệu khác

Điều quan trọng là phải phân biệt bộ dữ liệu benchmark (chuẩn) với các phân tách dữ liệu khác được sử dụng trong vòng đời ML:

  • Dữ liệu huấn luyện: Được sử dụng để dạy mô hình bằng cách điều chỉnh các tham số của nó dựa trên các ví dụ đầu vào và các nhãn tương ứng của chúng. Đây thường là phần lớn nhất của dữ liệu. Các kỹ thuật như tăng cường dữ liệu thường được áp dụng ở đây.
  • Dữ liệu xác thực: Được sử dụng trong quá trình huấn luyện để điều chỉnh siêu tham số của mô hình (như tốc độ học hoặc các lựa chọn kiến trúc) và cung cấp ước tính khách quan về kỹ năng của mô hình. Nó giúp ngăn ngừa quá khớp với dữ liệu huấn luyện.
  • Dữ liệu kiểm tra: Được sử dụng sau khi mô hình được huấn luyện đầy đủ để cung cấp đánh giá cuối cùng, khách quan về hiệu suất của nó trên dữ liệu chưa từng thấy.

Mặc dù một tập dữ liệu chuẩn thường đóng vai trò là một bộ kiểm tra tiêu chuẩn, nhưng mục đích chính của nó rộng hơn: cung cấp một tiêu chuẩn chung để so sánh trong toàn bộ cộng đồng nghiên cứu. Nhiều tập dữ liệu chuẩn được liệt kê và theo dõi trên các nền tảng như Papers with Code, nơi lưu trữ bảng xếp hạng cho các tác vụ ML khác nhau. Các tập dữ liệu đáng chú ý khác bao gồm Open Images V7 từ Google và thử thách Pascal VOC. Quyền truy cập vào các tập dữ liệu computer vision chất lượng cao như vậy là rất cần thiết cho bất kỳ ai xây dựng hệ thống AI đáng tin cậy.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard