Thuật ngữ

Nhãn dữ liệu

Khám phá vai trò quan trọng của việc dán nhãn dữ liệu trong học máy, quy trình, thách thức và ứng dụng thực tế của nó trong phát triển AI.

Gắn nhãn dữ liệu là quá trình xác định dữ liệu thô (chẳng hạn như hình ảnh, tệp văn bản hoặc video) và thêm một hoặc nhiều nhãn hoặc chú thích thông tin để cung cấp ngữ cảnh, cho phép mô hình học máy học hỏi từ dữ liệu đó. Quá trình này là nền tảng của học có giám sát , trong đó tập dữ liệu được gắn nhãn đóng vai trò là "giá trị nền tảng" mà thuật toán sử dụng để tự đào tạo nhằm đưa ra dự đoán chính xác trên dữ liệu mới, chưa được gắn nhãn. Gắn nhãn dữ liệu chất lượng cao là một trong những bước quan trọng và tốn thời gian nhất trong việc xây dựng một mô hình AI mạnh mẽ, vì hiệu suất của mô hình phụ thuộc trực tiếp vào chất lượng và độ chính xác của các nhãn mà nó học được.

Tại sao việc dán nhãn dữ liệu lại quan trọng?

Việc gắn nhãn dữ liệu cung cấp nền tảng cần thiết cho các mô hình hiểu và diễn giải thế giới. Trong thị giác máy tính (CV) , nhãn dạy mô hình nhận dạng đối tượng là gì và vị trí của nó trong ảnh. Nếu không có nhãn chính xác, mô hình không thể học các mẫu cần thiết để thực hiện nhiệm vụ, dẫn đến độ chính xác và độ tin cậy thấp. Chất lượng dữ liệu huấn luyện , được tạo ra thông qua việc gắn nhãn, quyết định trực tiếp đến chất lượng của AI kết quả. Nguyên tắc này thường được tóm tắt là "đầu vào rác, đầu ra rác". Các bộ dữ liệu chuẩn được gắn nhãn tốt như COCOImageNet đã đóng vai trò quan trọng trong việc thúc đẩy công nghệ tiên tiến trong thị giác máy tính.

Các loại nhãn dữ liệu trong thị giác máy tính

Mỗi tác vụ CV yêu cầu các loại chú thích khác nhau. Các phương pháp phổ biến nhất bao gồm:

  • Phân loại hình ảnh : Dạng đơn giản nhất, trong đó một nhãn duy nhất được gán cho toàn bộ hình ảnh để mô tả nội dung của nó (ví dụ: "mèo", "chó"). Bạn có thể khám phá các tập dữ liệu cho nhiệm vụ này như CIFAR-100 .
  • Phát hiện Đối tượng : Bao gồm việc vẽ một khung giới hạn xung quanh mỗi đối tượng quan tâm trong ảnh và gán nhãn lớp cho nó. Điều này cho mô hình biết đối tượng đó là gì và vị trí của nó.
  • Phân đoạn hình ảnh : Một phương pháp chi tiết hơn liên quan đến việc phác thảo hình dạng chính xác của một đối tượng ở cấp độ pixel. Phương pháp này có thể được chia thành phân đoạn ngữ nghĩa , trong đó tất cả các đối tượng cùng lớp dùng chung một mặt nạ, và phân đoạn thể hiện , trong đó mỗi thể hiện đối tượng riêng lẻ được phân đoạn riêng biệt.
  • Ước lượng Tư thế : Kỹ thuật này xác định vị trí và hướng của vật thể bằng cách chú thích các điểm chính. Ví dụ, trong ước lượng tư thế của con người, các điểm chính sẽ đánh dấu các khớp như khuỷu tay, đầu gối và cổ tay. Bộ dữ liệu Điểm chính COCO là một nguồn tài nguyên phổ biến cho nhiệm vụ này.

Ứng dụng trong thế giới thực

  1. Xe tự hành: Việc gắn nhãn dữ liệu là thiết yếu để đào tạo hệ thống nhận thức của xe tự lái. Các chuyên gia chú thích tỉ mỉ gắn nhãn hàng triệu hình ảnh và khung hình video, vẽ các khung giới hạn xung quanh xe hơi, người đi bộ và người đi xe đạp, phân đoạn vạch kẻ đường và phân loại biển báo giao thông. Dữ liệu được gắn nhãn phong phú này cho phép các mô hình như Ultralytics YOLO11 học cách điều hướng trong các môi trường đô thị phức tạp một cách an toàn. Công việc của các công ty như Waymo phụ thuộc rất nhiều vào các tập dữ liệu khổng lồ, được gắn nhãn chính xác. Bạn có thể tìm hiểu thêm về lĩnh vực này trên trang Giải pháp AI trong Ô tô của chúng tôi.
  2. Phân tích hình ảnh y tế: Trong lĩnh vực AI chăm sóc sức khỏe , các bác sĩ X quang và chuyên gia y tế dán nhãn các hình ảnh quét như MRI, CT và X-quang để xác định khối u, tổn thương và các bất thường khác. Ví dụ, trên một tập dữ liệu khối u não , các chuyên gia sẽ phác thảo ranh giới chính xác của khối u. Dữ liệu được dán nhãn này được sử dụng để đào tạo các mô hình có thể hỗ trợ chẩn đoán sớm, có khả năng giảm khối lượng công việc cho các chuyên gia y tế và cải thiện kết quả điều trị cho bệnh nhân. Hiệp hội X quang Bắc Mỹ (RSNA) đang tích cực tìm hiểu vai trò của AI trong chẩn đoán y tế.

Ghi nhãn dữ liệu so với các khái niệm liên quan

Việc gắn nhãn dữ liệu thường được thực hiện cùng với các nhiệm vụ chuẩn bị dữ liệu khác, nhưng điều quan trọng là phải phân biệt giữa chúng:

  • Tăng cường dữ liệu : Kỹ thuật này mở rộng tập dữ liệu huấn luyện một cách nhân tạo bằng cách tạo ra các phiên bản đã sửa đổi của dữ liệu đã được gắn nhãn (ví dụ: xoay, lật hoặc thay đổi độ sáng của ảnh). Tăng cường dữ liệu làm tăng tính đa dạng của dữ liệu nhưng phụ thuộc vào tập dữ liệu được gắn nhãn ban đầu. Tổng quan về tăng cường dữ liệu sẽ cung cấp thêm chi tiết.
  • Dọn dẹp Dữ liệu : Quá trình này bao gồm việc xác định và sửa chữa hoặc loại bỏ lỗi, sự không nhất quán và sai sót trong một tập dữ liệu. Mặc dù việc này có thể bao gồm việc sửa các nhãn không chính xác, dọn dẹp dữ liệu là một bước đảm bảo chất lượng, trong khi dán nhãn dữ liệu là bước đầu tiên để tạo chú thích. Dọn dẹp dữ liệu trên Wikipedia cung cấp thêm ngữ cảnh.
  • Tiền xử lý dữ liệu : Đây là một thuật ngữ bao quát hơn, bao gồm việc gắn nhãn dữ liệu, làm sạch và các chuyển đổi khác như chuẩn hóa hoặc thay đổi kích thước hình ảnh để chuẩn bị cho mô hình. Gắn nhãn là một bước cụ thể, quan trọng trong quy trình tiền xử lý rộng hơn.

Thách thức và giải pháp

Mặc dù có tầm quan trọng, việc dán nhãn dữ liệu vẫn tiềm ẩn nhiều thách thức, bao gồm chi phí cao, đầu tư thời gian đáng kể và khả năng xảy ra sai sót do con người hoặc chủ quan. Việc đảm bảo chất lượng và tính nhất quán của nhãn trên nhiều nhóm chú thích viên là một rào cản hậu cần lớn.

Để đơn giản hóa quy trình này, các nhóm thường sử dụng các công cụ chú thích chuyên dụng như CVAT hoặc các nền tảng như Ultralytics HUB , cung cấp một môi trường cộng tác để quản lý tập dữ liệu và dán nhãn quy trình làm việc. Hơn nữa, các kỹ thuật tiên tiến như Học tập Chủ động có thể hỗ trợ bằng cách lựa chọn thông minh các điểm dữ liệu giàu thông tin nhất để dán nhãn, tối ưu hóa việc sử dụng thời gian và công sức của người chú thích. Như đã được trình bày chi tiết trong một bài viết của Phòng thí nghiệm AI Stanford , việc tập trung vào chất lượng dữ liệu là chìa khóa cho sự thành công của AI.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard