Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Gán nhãn dữ liệu (Data Annotation)

Tìm hiểu cách chú thích dữ liệu tạo ra dữ liệu tham chiếu cho máy học. Khám phá các kỹ thuật phát hiện và phân đoạn đối tượng để tăng cường sức mạnh cho máy học. Ultralytics YOLO26.

Chú thích dữ liệu là quá trình quan trọng bổ sung siêu dữ liệu mô tả hoặc thẻ vào dữ liệu thô—như hình ảnh, video, văn bản hoặc âm thanh—để làm cho dữ liệu dễ hiểu hơn đối với các mô hình học máy (ML) . Quá trình này thiết lập một "sự thật cơ bản" mà các thuật toán sử dụng để học các mẫu, nhận dạng đối tượng và đưa ra dự đoán. Trong bối cảnh học có giám sát , các chú thích chất lượng cao đóng vai trò như người hướng dẫn, chỉ dẫn mô hình về đầu ra mong đợi cho một đầu vào nhất định. Nếu không có chú thích dữ liệu chính xác, ngay cả các kiến ​​trúc tiên tiến như Ultralytics YOLO26 cũng không thể xử lý chính xác dữ liệu. detect các đối tượng hoặc diễn giải các cảnh phức tạp, vì hiệu suất của mô hình gắn liền mật thiết với chất lượng dữ liệu huấn luyện của nó.

Vai trò của chú thích trong phát triển trí tuệ nhân tạo

Việc xây dựng các hệ thống AI mạnh mẽ đòi hỏi phải chuyển đổi dữ liệu phi cấu trúc thành các tập dữ liệu có cấu trúc. Chú thích dữ liệu giúp thu hẹp khoảng cách này bằng cách đánh dấu rõ ràng các đặc điểm quan trọng. Ví dụ, trong thị giác máy tính (CV) , điều này có thể bao gồm việc vẽ các khung bao quanh ô tô hoặc theo dõi đường viền của khối u trong ảnh chụp y tế.

Độ phức tạp của nhiệm vụ chú thích thay đổi tùy thuộc vào ứng dụng dự định:

  • Phát hiện đối tượng : Bao gồm việc vẽ các hình chữ nhật 2D xung quanh các đối tượng để dạy cho mô hình biết đối tượng đó là vị trí của nó.
  • Phân đoạn đối tượng : Yêu cầu các đa giác chính xác đến từng pixel xung quanh các đối tượng để phân biệt các đối tượng riêng lẻ và hình dạng chính xác của chúng.
  • Ước lượng tư thế : Tập trung vào việc đánh dấu các điểm mấu chốt cụ thể, chẳng hạn như các khớp trên cơ thể người, để phân tích chuyển động hoặc tư thế.
  • Phân loại hình ảnh : Gán một nhãn phân loại duy nhất cho toàn bộ hình ảnh, chẳng hạn như xác định một bức ảnh là "nắng" hoặc "mưa".

Các Ứng dụng Thực tế

Việc chú thích dữ liệu thúc đẩy sự đổi mới trong nhiều ngành công nghiệp khác nhau bằng cách cho phép máy móc nhận thức thế giới một cách chính xác.

  1. Xe tự hành: Xe tự lái dựa trên các tập dữ liệu khổng lồ, trong đó mọi người đi bộ, đèn giao thông và vạch kẻ làn đường đều được chú thích. Dữ liệu được gắn nhãn này cho phép hệ thống nhận thức điều hướng an toàn. Các công ty sử dụng chú thích đám mây điểm LiDAR cùng với dữ liệu video để tạo bản đồ 3D của môi trường.
  2. Hình ảnh y tế: Trong lĩnh vực trí tuệ nhân tạo chăm sóc sức khỏe , các bác sĩ X-quang chú thích ảnh chụp X-quang và MRI để làm nổi bật các bất thường. Các tập dữ liệu được chú thích này được sử dụng để huấn luyện các mô hình hỗ trợ chẩn đoán sớm, chẳng hạn như phát hiện khối u với độ chính xác cao hơn so với chỉ dựa vào đánh giá của con người.

Chú thích so với Ghi nhãn so với Bổ sung

Mặc dù thường được sử dụng thay thế cho nhau, nhưng việc phân biệt chú thích dữ liệu với các khái niệm liên quan trong quy trình vận hành học máy (MLOps) là rất hữu ích.

  • Chú thích so với Ghi nhãn dữ liệu : "Ghi nhãn" thường là một thuật ngữ rộng hơn, có thể đề cập đến việc phân loại đơn giản (ví dụ: gắn thẻ email là thư rác). "Chú thích" thường hàm ý một quy trình phong phú hơn, chi tiết hơn, chẳng hạn như đánh dấu các vùng không gian cụ thể trong hình ảnh hoặc các đoạn thời gian trong tệp âm thanh.
  • Chú thích so với Tăng cường dữ liệu : Chú thích tạo ra dữ liệu tham chiếu ban đầu. Tăng cường là bước tiếp theo nhằm mở rộng tập dữ liệu một cách nhân tạo bằng cách áp dụng các phép biến đổi—như xoay, lật hoặc thêm nhiễu—vào các mẫu đã được chú thích. Điều này giúp ngăn ngừa hiện tượng quá khớp và cải thiện khả năng khái quát hóa của mô hình.

Công cụ và quy trình làm việc

Việc chú thích dữ liệu hiện đại hiếm khi là một công việc thủ công, đơn lẻ. Nó liên quan đến các nền tảng hợp tác và ngày càng nhiều công cụ hỗ trợ bởi trí tuệ nhân tạo (AI). Nền tảng Ultralytics đơn giản hóa quy trình làm việc này bằng cách cung cấp các công cụ tích hợp để quản lý tập dữ liệu và tự động chú thích. Sử dụng mô hình được huấn luyện trước để đề xuất các nhãn ban đầu có thể tăng tốc đáng kể quá trình, một kỹ thuật được gọi là học chủ động .

Sau khi được chú thích, dữ liệu thường được xuất ra ở các định dạng chuẩn như JSON hoặc YOLO TXT để huấn luyện. Tiếp theo là... Python Đoạn mã này minh họa cách xác minh cấu hình tập dữ liệu đã được chú thích trước khi huấn luyện mô hình YOLO26 .

from ultralytics import YOLO

# Load a YOLO26 model (recommended for new projects)
model = YOLO("yolo26n.pt")

# Train the model using a dataset configuration file
# The YAML file defines paths to your annotated training and validation images
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Việc chú thích dữ liệu chính xác là nền tảng của trí tuệ nhân tạo hiệu năng cao. Bằng cách đầu tư vào các chú thích chất lượng cao, các nhà phát triển đảm bảo mô hình của họ học hỏi từ các ví dụ rõ ràng, nhất quán, dẫn đến các dự đoán đáng tin cậy trong triển khai thực tế.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay