Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Gán Nhãn Dữ Liệu (Data Labeling)

Khám phá vai trò quan trọng của việc gán nhãn dữ liệu (data labeling) trong machine learning, quy trình, thách thức và các ứng dụng thực tế của nó trong phát triển AI.

Gắn nhãn dữ liệu là quá trình cơ bản gắn nhãn hoặc chú thích dữ liệu thô với ngữ cảnh có ý nghĩa để tạo ra một tập dữ liệu phù hợp cho việc huấn luyện các mô hình học máy (ML) . Trong bối cảnh học có giám sát , các thuật toán yêu cầu các ví dụ bao gồm cả dữ liệu đầu vào (chẳng hạn như hình ảnh) và đầu ra dự kiến (nhãn). Thông tin được gắn nhãn này đóng vai trò là dữ liệu nền tảng , là tiêu chuẩn xác định để đo lường và cải thiện các dự đoán của mô hình. Nếu không có gắn nhãn chất lượng cao, ngay cả những kiến trúc tinh vi nhất, chẳng hạn như Ultralytics YOLO11 , cũng không thể học cách nhận dạng chính xác các mẫu hoặc xác định đối tượng.

Tầm quan trọng của việc dán nhãn chính xác

Hiệu suất của bất kỳ hệ thống AI nào đều gắn liền chặt chẽ với chất lượng dữ liệu huấn luyện của nó. Nếu các nhãn không nhất quán, không chính xác hoặc không đúng, mô hình sẽ học được các liên kết lỗi - một vấn đề thường được biết đến trong khoa học máy tính là "đầu vào rác, đầu ra rác". Việc gắn nhãn chính xác cho phép các mô hình khái quát hóa tốt với dữ liệu mới, chưa được biết đến, điều này rất quan trọng để triển khai các ứng dụng thị giác máy tính (CV) mạnh mẽ. Các bộ dữ liệu chuẩn chính như bộ dữ liệu COCOImageNet đã trở thành tiêu chuẩn công nghiệp chính xác nhờ vào việc gắn nhãn rộng rãi và cẩn thận của chúng.

Các loại nhãn phổ biến trong thị giác máy tính

Phương pháp dán nhãn dữ liệu cụ thể phụ thuộc rất nhiều vào nhiệm vụ thị giác máy tính dự định:

  • Phân loại hình ảnh : Gán một thẻ loại hoặc thẻ lớp duy nhất cho toàn bộ hình ảnh (ví dụ: dán nhãn ảnh là "nắng" hoặc "mưa").
  • Phát hiện Đối tượng : Vẽ các khung giới hạn 2D xung quanh các đối tượng quan tâm và gán một lớp cho mỗi khung. Điều này sẽ dạy cho mô hình biết đối tượng là gì và vị trí của nó.
  • Phân đoạn hình ảnh : Tạo mặt nạ pixel hoàn hảo. Phân đoạn ngữ nghĩa gắn nhãn các vùng theo danh mục (ví dụ: tất cả các pixel "đường"), trong khi phân đoạn thể hiện phân biệt các đối tượng riêng lẻ thuộc cùng một lớp (ví dụ: "xe 1", "xe 2").
  • Ước tính tư thế : Chú thích các điểm chính cụ thể về một chủ đề, chẳng hạn như các khớp trên cơ thể con người (theo dõi bộ xương), để hiểu chuyển động và tư thế.

Các Ứng dụng Thực tế

Việc gắn nhãn dữ liệu cho phép AI hoạt động trong các môi trường thực tế phức tạp. Hai ví dụ nổi bật bao gồm:

  1. Xe tự hành : Để xe tự lái di chuyển an toàn, nó dựa vào dữ liệu huấn luyện, trong đó con người đã dán nhãn tỉ mỉ các làn đường, biển báo giao thông, người đi bộ và các phương tiện khác. Điều này cho phép hệ thống nhận thức của xe phân tích hình dạng đường và các mối nguy hiểm tiềm ẩn ngay lập tức. Bạn có thể tìm hiểu thêm về điều này trong các giải pháp AI trong Ô tô của chúng tôi.
  2. Phân tích hình ảnh y tế : Trong chăm sóc sức khỏe, các bác sĩ X-quang dán nhãn hình ảnh chụp để xác định các bất thường. Ví dụ, trên tập dữ liệu khối u não , các chuyên gia có thể phác thảo ranh giới chính xác của tổn thương. Dữ liệu được dán nhãn này sẽ huấn luyện các mô hình để hỗ trợ bác sĩ chẩn đoán sớm, cải thiện kết quả điều trị cho bệnh nhân. Đọc thêm về AI trong Chăm sóc Sức khỏe để xem các mô hình này hoạt động như thế nào.

Gắn nhãn Dữ liệu so với Các Khái niệm Liên quan

Sẽ rất hữu ích khi phân biệt nhãn với các thuật ngữ tương tự được sử dụng trong quy trình chuẩn bị dữ liệu:

  • So với Chú thích Dữ liệu : Hai thuật ngữ này thường được dùng thay thế cho nhau. Tuy nhiên, "gắn nhãn" đôi khi được dùng cho các tác vụ đơn giản hơn như phân loại (gắn thẻ), trong khi "chú thích" ngụ ý siêu dữ liệu phong phú hơn, chẳng hạn như vẽ đa giác hoặc vẽ các điểm chính.
  • So với Tăng cường Dữ liệu : Việc gắn nhãn tạo ra tập dữ liệu ban đầu. Việc tăng cường diễn ra sau đó, trong đó phần mềm sẽ thay đổi các hình ảnh đã được gắn nhãn một cách toán học (xoay, lật, thêm nhiễu) để tăng tính đa dạng của tập dữ liệu một cách nhân tạo mà không cần đến sự can thiệp thủ công của con người.
  • So với Dọn dẹp Dữ liệu : Điều này bao gồm việc sửa lỗi trong tập dữ liệu, chẳng hạn như xóa các tệp bị hỏng hoặc sửa các mục bị gắn nhãn sai. Dọn dẹp đảm bảo tính toàn vẹn của các nhãn do người chú thích cung cấp.

Ví dụ về công cụ và mã

Mặc dù việc gắn nhãn thủ công tốn nhiều thời gian, các quy trình làm việc hiện đại thường sử dụng phần mềm chuyên dụng như CVAT (Công cụ Chú thích Thị giác Máy tính) hoặc tận dụng học tập chủ động để tăng tốc quy trình. Nền tảng Ultralytics sắp ra mắt được thiết kế để hợp lý hóa toàn bộ vòng đời này, từ việc thu thập dữ liệu đến chú thích tự động.

Sau đây là Python đoạn trích minh họa cách đào tạo một YOLO11 mô hình sử dụng tập dữ liệu được gắn nhãn trước (coco8.yaml). Quá trình đào tạo hoàn toàn dựa vào sự tồn tại của các nhãn chính xác được xác định trong tệp cấu hình tập dữ liệu.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
# The dataset YAML file contains paths to images and their corresponding labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

# The model updates its weights based on the labeled data provided

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay