Semi-Supervised Learning

Khám phá cách học bán giám sát (semi-supervised learning) kết hợp dữ liệu có nhãn và không nhãn để tăng độ chính xác của mô hình. Tìm hiểu cách triển khai các quy trình SSL bằng Ultralytics YOLO26.

Học bán giám sát (SSL) là một mô hình chiến lược trong học máy (ML) đóng vai trò là cầu nối giữa hai phương pháp huấn luyện truyền thống. Trong khi học có giám sát dựa hoàn toàn vào các bộ dữ liệu được gán nhãn đầy đủ và học không giám sát tìm cách phát hiện các mẫu trong dữ liệu mà không cần bất kỳ nhãn nào, thì SSL hoạt động bằng cách kết hợp một lượng nhỏ dữ liệu có nhãn với một tập hợp lớn hơn đáng kể dữ liệu không nhãn. Cách tiếp cận này đặc biệt có giá trị trong các kịch bản thị giác máy tính (CV) thực tế, nơi việc thu thập dữ liệu thô—như video từ camera an ninh hoặc vệ tinh—là tương đối rẻ, nhưng quy trình gán nhãn dữ liệu bởi các chuyên gia lại đắt đỏ, chậm và đòi hỏi nhiều nhân lực. Bằng cách tận dụng hiệu quả cấu trúc ẩn bên trong các ví dụ không nhãn, SSL có thể cải thiện đáng kể độ chính xác của model và khả năng tổng quát hóa mà không cần ngân sách gán nhãn khổng lồ.

Link to this sectionCác cơ chế cốt lõi của học bán giám sát#

Mục tiêu chính của SSL là lan truyền thông tin từ tập hợp nhỏ các ví dụ có nhãn sang tập lớn hơn không có nhãn. Điều này cho phép mạng thần kinh học được các ranh giới quyết định đi qua các vùng có mật độ dữ liệu thấp, từ đó mang lại kết quả phân loại hoặc phát hiện mạnh mẽ hơn.

Hai kỹ thuật phổ biến thúc đẩy hầu hết các quy trình làm việc bán giám sát:

Gán nhãn giả (Pseudo-Labeling): Trong phương pháp này, một model được huấn luyện trước trên dữ liệu có nhãn hạn chế. Sau đó, nó được sử dụng để chạy suy luận (inference) trên dữ liệu không nhãn. Các dự đoán vượt qua một ngưỡng độ tin cậy cụ thể được coi là "nhãn giả" hoặc sự thật cơ sở. Những dự đoán có độ tin cậy cao này được thêm vào dữ liệu huấn luyện, và model được huấn luyện lại, qua đó cải thiện hiệu suất một cách lặp đi lặp lại.
Điều hòa nhất quán (Consistency Regularization): Kỹ thuật này dựa vào tăng cường dữ liệu. Ý tưởng là model nên đưa ra các dự đoán tương tự cho một hình ảnh gốc và một phiên bản đã được sửa đổi nhẹ (tăng cường) của chính hình ảnh đó. Bằng cách giảm thiểu sự khác biệt trong dự đoán giữa bản gốc và bản được tăng cường, model học cách tập trung vào các đặc trưng cốt lõi của đối tượng thay vì nhiễu, giúp cải thiện khả năng xử lý hiện tượng quá khớp (overfitting).

Link to this sectionTriển khai thực tế với YOLO#

Ví dụ Python sau đây minh họa một quy trình gán nhãn giả đơn giản sử dụng gói ultralytics. Tại đây, chúng ta huấn luyện một model YOLO26 trên một bộ dữ liệu nhỏ, sau đó sử dụng nó để tạo nhãn cho một thư mục chứa các hình ảnh chưa được gán nhãn.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train initially on a small available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on unlabeled data to generate pseudo-labels
# Setting save_txt=True saves the detections as text files for future training
results = model.predict(source="./unlabeled_images", save_txt=True, conf=0.85)

Link to this sectionCác ứng dụng trong thực tế#

Học bán giám sát đang thay đổi các ngành công nghiệp nơi dữ liệu dồi dào nhưng chuyên môn lại khan hiếm.

Chẩn đoán hình ảnh y tế: Trong AI y tế, việc thu thập các bản quét (X-quang, MRI) là quy trình tiêu chuẩn, nhưng việc yêu cầu một bác sĩ chẩn đoán hình ảnh có chứng chỉ phải chú thích từng pixel để phát hiện khối u lại vô cùng đắt đỏ. SSL cho phép các nhà nghiên cứu huấn luyện các model hiệu năng cao chỉ với một phần nhỏ các trường hợp được chuyên gia chú thích, tận dụng hàng ngàn bản quét lưu trữ để tinh chỉnh khả năng hiểu các cấu trúc sinh học của model.
Xe tự lái: Các công ty xe tự lái thu thập hàng petabyte dữ liệu video mỗi ngày từ các đội xe của họ. Việc gán nhãn từng khung hình cho phát hiện đối tượng và phân đoạn ngữ nghĩa là điều bất khả thi. Thông qua SSL, hệ thống có thể học hỏi từ đại đa số các giờ lái xe không có nhãn để hiểu rõ hơn về môi trường đường bộ phức tạp, điều kiện thời tiết và các trường hợp biên hiếm gặp.

Link to this sectionPhân biệt các khái niệm liên quan#

Để triển khai các giải pháp AI hiệu quả, điều quan trọng là phải hiểu cách SSL khác biệt như thế nào so với các chiến lược tương tự:

So với Học chủ động (Active Learning): Mặc dù cả hai đều xử lý dữ liệu không nhãn, cách tiếp cận việc gán nhãn của chúng lại khác nhau. SSL tự động gán nhãn dựa trên các dự đoán của model. Ngược lại, học chủ động xác định các điểm dữ liệu "gây bối rối" hoặc không chắc chắn nhất và yêu cầu rõ ràng một con người tham gia vào vòng lặp để gán nhãn chúng, từ đó tối ưu hóa thời gian của con người thay vì loại bỏ hoàn toàn sự can thiệp của họ.
So với Học chuyển tiếp (Transfer Learning): Học chuyển tiếp bao gồm việc lấy một model đã được huấn luyện trước trên một bộ dữ liệu khổng lồ bên ngoài (như ImageNet) và tinh chỉnh nó trên tác vụ cụ thể của bạn. Tuy nhiên, SSL tập trung vào việc tận dụng phần không nhãn của phân phối tập dữ liệu cụ thể của bạn ngay trong quá trình huấn luyện.
So với Học tự giám sát (Self-Supervised Learning): Mặc dù tên gọi tương tự nhau, học tự giám sát thường đề cập đến các "tác vụ tiền đề" (như giải trò chơi ghép hình từ các mảnh ảnh) nơi dữ liệu tự tạo ra các tín hiệu giám sát mà không cần bất kỳ nhãn bên ngoài nào. SSL đặc biệt ngụ ý việc sử dụng một tập hợp nhỏ các nhãn đã xác minh để hướng dẫn quy trình.

Link to this sectionCông cụ và Triển vọng tương lai#

Khi các model học sâu (DL) ngày càng lớn hơn, hiệu quả sử dụng dữ liệu trở nên quan trọng hàng đầu. Các framework hiện đại như PyTorch và TensorFlow cung cấp nền tảng tính toán cho các vòng lặp huấn luyện nâng cao này. Hơn nữa, các công cụ như Ultralytics Platform đang đơn giản hóa vòng đời quản lý dữ liệu. Bằng cách sử dụng các tính năng như tự động gán nhãn, các nhóm có thể triển khai quy trình bán giám sát dễ dàng hơn, nhanh chóng chuyển đổi dữ liệu thô thành trọng số model sẵn sàng cho sản xuất. Sự tiến hóa này trong MLOps đảm bảo rằng rào cản gia nhập để tạo ra các hệ thống thị giác có độ chính xác cao tiếp tục được hạ thấp.

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Semi-Supervised Learning

Link to this sectionCác cơ chế cốt lõi của học bán giám sát#

Link to this sectionTriển khai thực tế với YOLO#

Link to this sectionCác ứng dụng trong thực tế#

Link to this sectionPhân biệt các khái niệm liên quan#

Link to this sectionCông cụ và Triển vọng tương lai#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!