Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Học bán giám sát

Khám phá cách Học bán giám sát kết hợp dữ liệu được gắn nhãn và không được gắn nhãn để nâng cao các mô hình AI, giảm chi phí gắn nhãn và tăng độ chính xác.

Học bán giám sát (Semi-supervised learning - SSL) là một kỹ thuật học máy (machine learning - ML) giúp thu hẹp khoảng cách giữa học có giám sát (supervised learning)học không giám sát (unsupervised learning). Nó tận dụng một lượng nhỏ dữ liệu được gắn nhãn cùng với một lượng lớn dữ liệu chưa được gắn nhãn để cải thiện độ chính xác học tập. Trong nhiều tình huống thực tế, việc thu thập dữ liệu chưa được gắn nhãn là không tốn kém, nhưng quá trình gắn nhãn dữ liệu (data labeling) tốn kém và mất thời gian. SSL giải quyết thách thức này bằng cách cho phép các mô hình học hỏi từ nhóm lớn các ví dụ chưa được gắn nhãn, được hướng dẫn bởi cấu trúc và thông tin do tập dữ liệu nhỏ hơn đã được gắn nhãn cung cấp. Cách tiếp cận này đặc biệt mạnh mẽ trong học sâu (deep learning - DL), nơi các mô hình yêu cầu bộ dữ liệu khổng lồ để đạt được hiệu suất cao.

Cách thức hoạt động của Học Bán Giám Sát

Ý tưởng cốt lõi đằng sau SSL là sử dụng dữ liệu được gắn nhãn để xây dựng một mô hình ban đầu, và sau đó sử dụng mô hình này để đưa ra dự đoán trên dữ liệu chưa được gắn nhãn. Các dự đoán tự tin nhất của mô hình sau đó được coi là "nhãn giả" (pseudo-labels) và được thêm vào tập huấn luyện. Sau đó, mô hình được huấn luyện lại trên sự kết hợp này của các nhãn gốc và các nhãn giả có độ tin cậy cao. Quá trình lặp đi lặp lại này cho phép mô hình học cấu trúc cơ bản của toàn bộ tập dữ liệu, không chỉ phần nhỏ được gắn nhãn.

Các kỹ thuật SSL phổ biến bao gồm:

  • Điều chuẩn hóa tính nhất quán: Phương pháp này thực thi ý tưởng rằng các dự đoán của mô hình phải nhất quán ngay cả khi dữ liệu đầu vào bị nhiễu nhẹ. Ví dụ: một hình ảnh có tăng cường dữ liệu nhỏ phải cho ra cùng một phân loại.
  • Mô Hình Tạo Sinh (Generative Models): Các kỹ thuật như Mạng Đối Nghịch Tạo Sinh (GANs) có thể học cách tạo dữ liệu giống với phân phối dữ liệu thực, giúp xác định rõ hơn ranh giới quyết định giữa các lớp.
  • Các phương pháp dựa trên đồ thị: Các phương pháp này biểu diễn các điểm dữ liệu dưới dạng các nút trong một đồ thị và truyền bá nhãn từ các nút được gắn nhãn sang các nút không được gắn nhãn dựa trên sự gần gũi hoặc tương đồng của chúng. Có thể tìm thấy tổng quan kỹ thuật trong các khảo sát học thuật.

Các Ứng dụng Thực tế

SSL có hiệu quả cao trong các lĩnh vực mà việc gắn nhãn là một trở ngại. Hai ví dụ nổi bật bao gồm:

  1. Phân tích hình ảnh y tế : Việc gắn nhãn các hình ảnh quét y tế như MRI hoặc CT để phát hiện khối u đòi hỏi các bác sĩ X quang chuyên môn và rất tốn kém. Với SSL, một mô hình có thể được đào tạo trên vài trăm hình ảnh quét được gắn nhãn và sau đó được tinh chỉnh bằng cách sử dụng hàng nghìn hình ảnh quét chưa được gắn nhãn từ kho lưu trữ của bệnh viện. Điều này cho phép phát triển các mô hình phân loại và phân đoạn hình ảnh mạnh mẽ với ít công sức thủ công hơn đáng kể.
  2. Phân loại tài liệu và nội dung web: Việc phân loại thủ công hàng tỷ trang web, bài báo hoặc đánh giá của khách hàng là bất khả thi. SSL có thể sử dụng một tập hợp nhỏ các tài liệu được phân loại thủ công để huấn luyện một bộ phân loại văn bản ban đầu. Sau đó, mô hình phân loại khối lượng lớn các tài liệu chưa được gắn nhãn, sử dụng các dự đoán của chính nó để cải thiện theo thời gian cho các tác vụ như phân tích tình cảm (sentiment analysis) hoặc phân loại chủ đề.

So sánh với các mô hình học khác

Điều quan trọng là phải phân biệt SSL với các khái niệm Trí tuệ nhân tạo (AI) liên quan:

  • Học Tự Giám Sát (SSL) : Mặc dù cùng chung một từ viết tắt, học tự giám sát lại khác. Đây là một loại học không giám sát, trong đó các nhãn được tạo ra từ chính dữ liệu thông qua các tác vụ giả định (ví dụ: dự đoán một từ bị che khuất trong câu). Nó không sử dụng bất kỳ dữ liệu được gắn nhãn thủ công nào, trong khi học bán giám sát yêu cầu một tập dữ liệu nhỏ, được gắn nhãn rõ ràng để hướng dẫn quá trình huấn luyện mô hình .
  • Học tập chủ động : Kỹ thuật này cũng nhằm mục đích giảm chi phí dán nhãn. Tuy nhiên, thay vì sử dụng toàn bộ dữ liệu chưa được dán nhãn, mô hình học tập chủ động sẽ truy vấn một người chú thích một cách thông minh để dán nhãn các điểm dữ liệu có nhiều thông tin nhất. Ngược lại, SSL thường sử dụng dữ liệu chưa được dán nhãn mà không cần tương tác trực tiếp của con người trong quá trình đào tạo.
  • Học chuyển giao : Phương pháp này bao gồm việc sử dụng một mô hình được đào tạo trước trên một tập dữ liệu lớn (như ImageNet ) và sau đó tinh chỉnh nó trên một tập dữ liệu nhỏ hơn, dành riêng cho từng tác vụ. Mặc dù cả hai đều tận dụng kiến thức hiện có, SSL học từ dữ liệu chưa được gắn nhãn của chính tác vụ mục tiêu, trong khi học chuyển giao tận dụng kiến thức từ một tác vụ khác (mặc dù thường có liên quan).

Công cụ và Đào tạo

Nhiều framework Deep Learning (DL) hiện đại, bao gồm PyTorch (trang chính thức của PyTorch) và TensorFlow (trang chính thức của TensorFlow), cung cấp các chức năng hoặc có thể được điều chỉnh để triển khai các thuật toán SSL. Các thư viện như Scikit-learn cung cấp một số phương pháp SSL. Các nền tảng như Ultralytics HUB hợp lý hóa quy trình bằng cách tạo điều kiện quản lý tập dữ liệu có thể chứa hỗn hợp dữ liệu được gắn nhãn và không được gắn nhãn, đơn giản hóa việc huấn luyệntriển khai các mô hình được thiết kế để tận dụng các cấu trúc dữ liệu đó. Nghiên cứu về SSL tiếp tục phát triển, với những đóng góp thường được trình bày tại các hội nghị AI lớn như NeurIPSICML.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard