Data Annotation
Tìm hiểu cách chú thích dữ liệu (data annotation) tạo ra ground truth cho machine learning. Khám phá các kỹ thuật phát hiện vật thể và phân đoạn để hỗ trợ Ultralytics YOLO26.
Gán nhãn dữ liệu là quá trình quan trọng trong việc thêm siêu dữ liệu hoặc thẻ mô tả vào dữ liệu thô—như hình ảnh, video, văn bản hoặc âm thanh—để giúp các mô hình machine learning (ML) có thể hiểu được chúng. Thực tiễn này thiết lập một "ground truth" (sự thật cơ bản) mà các thuật toán sử dụng để học các mẫu, nhận diện đối tượng và thực hiện dự đoán. Trong ngữ cảnh của supervised learning, các nhãn chất lượng cao đóng vai trò như người hướng dẫn, chỉ đạo mô hình biết kết quả đầu ra nào là cần thiết cho một đầu vào nhất định. Nếu không có việc gán nhãn dữ liệu chính xác, ngay cả các kiến trúc tiên tiến như Ultralytics YOLO26 cũng không thể phát hiện đối tượng hoặc diễn giải các cảnh phức tạp một cách chính xác, vì hiệu suất của mô hình gắn liền mật thiết với chất lượng của training data (dữ liệu huấn luyện).
Link to this sectionVai trò của gán nhãn trong phát triển AI#
Việc xây dựng các hệ thống AI mạnh mẽ đòi hỏi phải chuyển đổi dữ liệu phi cấu trúc thành các tập dữ liệu có cấu trúc. Gán nhãn dữ liệu thu hẹp khoảng cách này bằng cách đánh dấu rõ ràng các đặc trưng cần quan tâm. Ví dụ, trong computer vision (CV), điều này có thể bao gồm việc vẽ bounding boxes quanh xe cộ hoặc vẽ đường viền của khối u trong kết quả quét y tế.
Độ phức tạp của tác vụ gán nhãn thay đổi tùy theo ứng dụng dự kiến:
- Object Detection: Bao gồm việc vẽ các hình chữ nhật 2D quanh các đối tượng để dạy cho mô hình biết đối tượng đó là gì và nằm ở đâu.
- Instance Segmentation: Yêu cầu các polygons hoàn hảo đến từng pixel quanh các đối tượng để phân biệt các cá thể riêng lẻ và hình dạng chính xác của chúng.
- Pose Estimation: Tập trung vào việc đánh dấu các keypoints cụ thể, chẳng hạn như các khớp trên cơ thể người, để phân tích chuyển động hoặc tư thế.
- Image Classification: Gán một nhãn phân loại duy nhất cho toàn bộ hình ảnh, chẳng hạn như xác định một bức ảnh là "nắng" hoặc "mưa".
Link to this sectionCác ứng dụng trong thực tế#
Gán nhãn dữ liệu thúc đẩy sự đổi mới trong nhiều ngành công nghiệp khác nhau bằng cách cho phép máy móc nhận thức thế giới một cách chính xác.
-
Xe tự hành: Xe tự lái dựa vào các tập dữ liệu khổng lồ nơi mọi người đi bộ, đèn giao thông và vạch kẻ làn đường đều được gán nhãn. Dữ liệu được gán nhãn này cho phép các hệ thống nhận thức di chuyển an toàn. Các công ty sử dụng tính năng gán nhãn đám mây điểm LiDAR cùng với dữ liệu video để tạo ra bản đồ 3D của môi trường.
-
Hình ảnh y tế: Trong healthcare AI, các bác sĩ chẩn đoán hình ảnh thực hiện gán nhãn trên phim chụp X-quang và MRI để làm nổi bật các điểm bất thường. Những tập dữ liệu được gán nhãn này huấn luyện các mô hình hỗ trợ chẩn đoán sớm, chẳng hạn như detecting tumors với độ nhất quán cao hơn so với chỉ xem xét thủ công bởi con người.
Link to this sectionGán nhãn (Annotation) so với Gán nhãn (Labeling) so với Tăng cường dữ liệu (Augmentation)#
Mặc dù thường được sử dụng thay thế cho nhau, việc phân biệt gán nhãn dữ liệu với các khái niệm liên quan trong quy trình ML operations (MLOps) là rất hữu ích.
- Annotation (Gán nhãn chi tiết) so với Data Labeling (Gán nhãn dữ liệu): "Labeling" thường là một thuật ngữ rộng hơn có thể chỉ việc phân loại đơn giản (ví dụ: đánh dấu email là spam). "Annotation" thường ngụ ý một quá trình phong phú và chi tiết hơn, chẳng hạn như đánh dấu các vùng không gian cụ thể trong hình ảnh hoặc phân đoạn thời gian trong tệp âm thanh.
- Annotation so với Data Augmentation: Annotation tạo ra ground truth ban đầu. Augmentation là một bước tiếp theo giúp mở rộng tập dữ liệu một cách nhân tạo bằng cách áp dụng các biến đổi—như xoay, lật hoặc thêm nhiễu—vào các mẫu đã được gán nhãn hiện có. Điều này giúp ngăn chặn overfitting và cải thiện khả năng tổng quát hóa của mô hình.
Link to this sectionCông cụ và Quy trình làm việc#
Gán nhãn dữ liệu hiện đại hiếm khi là một tác vụ thủ công, đơn độc. Nó liên quan đến các nền tảng cộng tác và ngày càng có nhiều công cụ hỗ trợ bởi AI. Ultralytics Platform đơn giản hóa quy trình này bằng cách cung cấp các công cụ tích hợp để quản lý tập dữ liệu và tự động gán nhãn. Sử dụng một mô hình đã được huấn luyện trước để gợi ý các nhãn ban đầu có thể tăng tốc đáng kể quy trình, một kỹ thuật được gọi là active learning.
Sau khi được gán nhãn, dữ liệu thường được xuất ra các định dạng chuẩn như JSON hoặc YOLO TXT format để huấn luyện. Đoạn mã Python sau đây minh họa cách xác minh cấu hình tập dữ liệu đã gán nhãn của bạn trước khi huấn luyện mô hình YOLO26.
from ultralytics import YOLO
# Load a YOLO26 model (recommended for new projects)
model = YOLO("yolo26n.pt")
# Train the model using a dataset configuration file
# The YAML file defines paths to your annotated training and validation images
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)Gán nhãn dữ liệu chính xác là nền tảng của AI hiệu suất cao. Bằng cách đầu tư vào các nhãn chất lượng cao, các nhà phát triển đảm bảo mô hình của họ học hỏi từ các ví dụ rõ ràng, nhất quán, dẫn đến các dự đoán đáng tin cậy khi triển khai trong thế giới thực.






