Data Labeling

Tìm hiểu các nguyên tắc cơ bản của việc gắn nhãn dữ liệu cho machine learning. Khám phá các loại hình chính như phát hiện vật thể và cách tăng tốc quy trình làm việc bằng Ultralytics YOLO26.

Gán nhãn dữ liệu là quá trình cơ bản trong việc xác định dữ liệu thô—chẳng hạn như hình ảnh, khung hình video, văn bản hoặc âm thanh—và thêm các thẻ hoặc siêu dữ liệu mang tính thông tin để cung cấp ngữ cảnh. Trong lĩnh vực machine learning (ML), các thuật toán không thể tự hiểu thế giới vật lý; chúng cần một "giáo viên" để hướng dẫn. Sự hướng dẫn này đến từ các tập dữ liệu được gán nhãn, được sử dụng trong quá trình supervised learning. Các nhãn đóng vai trò là ground truth, đại diện cho các câu trả lời đúng mà mô hình cố gắng dự đoán. Cho dù huấn luyện một bộ phân loại đơn giản hay một kiến trúc phức tạp như Ultralytics YOLO26, thì độ chính xác, tính nhất quán và chất lượng của các nhãn này là yếu tố quyết định hàng đầu đối với sự thành công của mô hình.

Link to this sectionGán nhãn dữ liệu so với Chú thích dữ liệu#

Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau trong các cuộc hội thoại thông thường, nhưng có một sự khác biệt tinh tế cần lưu ý. "Gán nhãn dữ liệu" (Data labeling) thường đề cập đến hành động rộng hơn là gán một danh mục hoặc thẻ cho một mảnh dữ liệu (ví dụ: gắn thẻ email là "spam"). Ngược lại, data annotation thường cụ thể hơn đối với computer vision (CV), bao gồm việc xác định chính xác các đối tượng bằng cách sử dụng bounding box, đa giác hoặc keypoints. Tuy nhiên, trong hầu hết các quy trình ML operations (MLOps), cả hai thuật ngữ này đều mô tả quá trình tạo ra training data chất lượng cao.

Link to this sectionCác loại chính trong Thị giác máy tính#

Phương pháp gán nhãn thay đổi dựa trên tác vụ mà mô hình phải thực hiện. Các loại phổ biến bao gồm:

Image Classification: Gán một nhãn duy nhất cho toàn bộ hình ảnh, chẳng hạn như xác định điều kiện thời tiết là "nhiều mây" hoặc "nắng".
Object Detection: Vẽ các bounding boxes 2D xung quanh các đối tượng riêng biệt để dạy mô hình đối tượng đó là gì và nó nằm ở đâu.
Instance Segmentation: Tạo các mặt nạ hoặc polygons chính xác đến từng pixel xung quanh đối tượng, điều này rất cần thiết để xác định hình dạng và ranh giới chính xác.
Pose Estimation: Đánh dấu các keypoints cụ thể trên một đối tượng, chẳng hạn như các khớp xương, để phân tích chuyển động hoặc tư thế.

Link to this sectionCác ứng dụng trong thực tế#

Tiện ích của việc gán nhãn dữ liệu mở rộng trên hầu hết mọi ngành công nghiệp sử dụng AI.

Xe tự lái: Xe tự lái dựa vào các tập dữ liệu khổng lồ, nơi mọi phương tiện, người đi bộ, biển báo giao thông và vạch kẻ làn đường đều được gán nhãn tỉ mỉ. Dữ liệu được gán nhãn này cho phép hệ thống nhận thức điều hướng các môi trường phức tạp một cách an toàn. Các công ty autonomous vehicle đầu tư rất nhiều vào việc gán nhãn ở cấp độ pixel để đảm bảo tuân thủ an toàn.
Nông nghiệp chính xác: Trong canh tác hiện đại, AI in agriculture được sử dụng để phát hiện bệnh cây trồng hoặc giám sát các giai đoạn tăng trưởng. Nông dân sử dụng các mô hình được huấn luyện trên hình ảnh được gán nhãn là lá "khỏe mạnh" so với "bị bệnh" để tự động hóa việc xử lý, giảm sử dụng hóa chất và tăng năng suất.

Link to this sectionQuy trình gán nhãn#

Tạo một tập dữ liệu được gán nhãn thường là phần tốn thời gian nhất của một dự án AI. Quá trình này thường bao gồm phương pháp "Human-in-the-Loop" (HITL), nơi các cộng tác viên con người xác minh nhãn để đảm bảo độ chính xác cao. Các quy trình hiện đại tận dụng các công cụ như Ultralytics Platform, giúp đơn giản hóa việc quản lý tập dữ liệu và cho phép các nhóm cộng tác về chú thích. Các kỹ thuật tiên tiến như active learning cũng có thể được sử dụng, nơi một mô hình tự gán nhãn trước cho dữ liệu và con người chỉ chỉnh sửa các dự đoán có độ tin cậy thấp, giúp tăng tốc đáng kể quy trình.

Ví dụ sau đây minh họa cách sử dụng mô hình YOLO26 đã được huấn luyện trước để tự động tạo nhãn (tự động gán nhãn) cho một hình ảnh mới, sau đó có thể được con người chỉnh sửa:

from ultralytics import YOLO

# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Save the detection results to a text file in standard YOLO format
# This file can now be used as a starting point for data labeling
results[0].save_txt("bus_labels.txt")

Data Labeling

Link to this sectionGán nhãn dữ liệu so với Chú thích dữ liệu#

Link to this sectionCác loại chính trong Thị giác máy tính#

Link to this sectionCác ứng dụng trong thực tế#

Link to this sectionQuy trình gán nhãn#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!