Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

ImageNet

Khám phá ImageNet, bộ dữ liệu đột phá thúc đẩy những tiến bộ trong thị giác máy tính với hơn 14 triệu hình ảnh, cung cấp sức mạnh cho nghiên cứu, mô hình và ứng dụng AI.

ImageNet là một bộ dữ liệu khổng lồ, có thể truy cập công khai với hơn 14 triệu hình ảnh đã được chú thích thủ công để cho biết đối tượng mà chúng mô tả. Được tổ chức theo hệ thống phân cấp WordNet, nó chứa hơn 20.000 danh mục, với một danh mục điển hình, chẳng hạn như "bong bóng" hoặc "dâu tây", bao gồm vài trăm hình ảnh. Bộ sưu tập rộng lớn và đa dạng này đã đóng vai trò quan trọng trong việc thúc đẩy các lĩnh vực thị giác máy tính (CV)học sâu (DL), đóng vai trò là tiêu chuẩn để đào tạo và đánh giá các mô hình.

Việc tạo ra ImageNet bởi các nhà nghiên cứu tại Đại học Stanford là một thời điểm then chốt cho trí tuệ nhân tạo (AI). Trước ImageNet, các tập dữ liệu thường quá nhỏ để huấn luyện các mạng nơ-ron (NN) phức tạp một cách hiệu quả, dẫn đến các vấn đề như quá khớp (overfitting). ImageNet cung cấp quy mô cần thiết để huấn luyện các mô hình sâu, mở đường cho cuộc cách mạng AI hiện đại. Bạn có thể tìm hiểu thêm bằng cách đọc bài nghiên cứu gốc về ImageNet.

Thử thách Nhận dạng Hình ảnh Quy mô Lớn Imagenet (ILSVRC)

Ảnh hưởng của ImageNet được khuếch đại bởi Cuộc thi Nhận dạng Hình ảnh Quy mô Lớn ImageNet (ILSVRC), một cuộc thi thường niên được tổ chức từ năm 2010 đến năm 2017. Thử thách này đã trở thành một chuẩn mực quan trọng để đánh giá hiệu suất của các thuật toán thị giác máy tính. Vào năm 2012, một mạng nơ-ron tích chập (CNN) có tên là AlexNet đã đạt được một chiến thắng mang tính đột phá, vượt trội hơn đáng kể so với tất cả các mô hình trước đó. Thành công này đã chứng minh sức mạnh của học sâu và tính toán GPU, tạo ra một làn sóng đổi mới trong lĩnh vực này. ILSVRC là động lực chính trong sự phát triển của nhiều kiến trúc hiện đại và bạn có thể thấy các mô hình ngày nay hoạt động như thế nào trên các chuẩn mực khác nhau trên các trang web như Papers with Code.

Ứng dụng thực tế của Imagenet

Mục đích sử dụng chính của ImageNet là làm tài nguyên cho các mô hình tiền huấn luyện. Bằng cách huấn luyện một mô hình trên bộ dữ liệu khổng lồ này, nó học cách nhận ra một tập hợp phong phú các đặc điểm trực quan. Kiến thức này sau đó có thể được chuyển sang các tác vụ mới, cụ thể hơn. Kỹ thuật này được gọi là học chuyển giao.

  1. Phân tích hình ảnh y tế: Một mô hình được huấn luyện trước trên ImageNet, chẳng hạn như mô hình Ultralytics YOLO, có thể được tinh chỉnh trên một bộ dữ liệu chuyên dụng nhỏ hơn nhiều gồm ảnh chụp y tế để phát hiện các tình trạng cụ thể như khối u. Quá trình huấn luyện ban đầu trên ImageNet cung cấp một nền tảng vững chắc về hiểu biết trực quan chung, điều này rất quan trọng để đạt được độ chính xác cao trong các tác vụ phân tích hình ảnh y tế nơi dữ liệu được gắn nhãn khan hiếm. Đây là một ứng dụng quan trọng cho ứng dụng AI trong chăm sóc sức khỏe.
  2. Nhận dạng sản phẩm bán lẻ: Trong lĩnh vực bán lẻ, các mô hình có thể được điều chỉnh để xác định hàng nghìn sản phẩm khác nhau trên kệ nhằm tự động hóa việc quản lý hàng tồn kho. Thay vì huấn luyện từ đầu, một mô hình được huấn luyện trước trên ImageNet có thể nhanh chóng được điều chỉnh cho phù hợp với các sản phẩm cụ thể của một cửa hàng. Điều này giúp giảm nhu cầu về lượng lớn dữ liệu huấn luyện tùy chỉnh và đẩy nhanh quá trình triển khai mô hình. Nhiều giải pháp AI mạnh mẽ trong lĩnh vực bán lẻ đang tận dụng phương pháp này.

So sánh Imagenet với các khái niệm liên quan

Điều quan trọng là phân biệt ImageNet với các thuật ngữ và bộ dữ liệu liên quan khác:

Các mô hình như YOLO11 thường được huấn luyện trước trên ImageNet cho backbone phân loại của chúng trước khi được huấn luyện trên COCO cho các tác vụ phát hiện. Quá trình huấn luyện đa giai đoạn này tận dụng thế mạnh của cả hai bộ dữ liệu. Bạn có thể thấy cách các mô hình khác nhau so sánh trên các chuẩn mực này trên các trang so sánh mô hình của chúng tôi. Mặc dù có ảnh hưởng lớn, nhưng điều đáng chú ý là ImageNet có những hạn chế, bao gồm cả sai lệch bộ dữ liệu đã biết mà điều quan trọng cần xem xét từ góc độ đạo đức AI.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard