Thuật ngữ

Học bán giám sát

Khám phá cách Học bán giám sát kết hợp dữ liệu có nhãn và không có nhãn để cải thiện mô hình AI, giảm chi phí gắn nhãn và tăng độ chính xác.

Học bán giám sát (SSL) là một kỹ thuật học máy (ML) giúp thu hẹp khoảng cách giữa học có giám sáthọc không giám sát . Nó tận dụng một lượng nhỏ dữ liệu đã được gán nhãn cùng với một lượng lớn dữ liệu chưa được gán nhãn để cải thiện độ chính xác của việc học. Trong nhiều tình huống thực tế, việc thu thập dữ liệu chưa được gán nhãn không tốn kém, nhưng quá trình gán nhãn lại tốn kém và mất thời gian. SSL giải quyết thách thức này bằng cách cho phép các mô hình học từ một kho dữ liệu khổng lồ các ví dụ chưa được gán nhãn, được hướng dẫn bởi cấu trúc và thông tin do tập dữ liệu được gán nhãn nhỏ hơn cung cấp. Phương pháp này đặc biệt hiệu quả trong học sâu (DL) , nơi các mô hình yêu cầu bộ dữ liệu khổng lồ để đạt được hiệu suất cao.

Học bán giám sát hoạt động như thế nào

Ý tưởng cốt lõi đằng sau SSL là sử dụng dữ liệu đã được gắn nhãn để xây dựng một mô hình ban đầu, sau đó sử dụng mô hình này để đưa ra dự đoán trên dữ liệu chưa được gắn nhãn. Những dự đoán chắc chắn nhất của mô hình sau đó được coi là "nhãn giả" và được thêm vào tập huấn luyện. Mô hình sau đó được huấn luyện lại trên sự kết hợp giữa các nhãn gốc và các nhãn giả có độ tin cậy cao này. Quá trình lặp lại này cho phép mô hình học được cấu trúc cơ bản của toàn bộ tập dữ liệu, chứ không chỉ riêng phần nhỏ đã được gắn nhãn.

Các kỹ thuật SSL phổ biến bao gồm:

  • Chuẩn hóa tính nhất quán: Phương pháp này củng cố ý tưởng rằng các dự đoán của mô hình phải duy trì tính nhất quán ngay cả khi dữ liệu đầu vào bị nhiễu nhẹ. Ví dụ, một hình ảnh có dữ liệu được tăng cường một chút sẽ cho ra cùng một kết quả phân loại.
  • Mô hình sáng tạo: Các kỹ thuật như Mạng đối nghịch sáng tạo (GAN) có thể học cách tạo dữ liệu giống với phân phối dữ liệu thực tế, giúp xác định tốt hơn ranh giới quyết định giữa các lớp.
  • Phương pháp dựa trên đồ thị: Các phương pháp này biểu diễn các điểm dữ liệu dưới dạng các nút trong đồ thị và truyền nhãn từ các nút có nhãn đến các nút không có nhãn dựa trên mức độ gần hoặc tương đồng của chúng. Tổng quan kỹ thuật có thể được tìm thấy trong các khảo sát học thuật .

Ứng dụng trong thế giới thực

SSL cực kỳ hiệu quả trong các lĩnh vực mà việc gắn nhãn là một nút thắt cổ chai. Hai ví dụ nổi bật bao gồm:

  1. Phân tích hình ảnh y tế : Việc gắn nhãn các hình ảnh quét y tế như MRI hoặc CT để phát hiện khối u đòi hỏi các bác sĩ X quang chuyên môn và rất tốn kém. Với SSL, một mô hình có thể được đào tạo trên vài trăm hình ảnh quét được gắn nhãn và sau đó được tinh chỉnh bằng cách sử dụng hàng nghìn hình ảnh quét chưa được gắn nhãn từ kho lưu trữ của bệnh viện. Điều này cho phép phát triển các mô hình phân loại và phân đoạn hình ảnh mạnh mẽ với ít công sức thủ công hơn đáng kể.
  2. Phân loại Nội dung Web và Tài liệu: Việc phân loại thủ công hàng tỷ trang web, bài viết tin tức hoặc đánh giá của khách hàng là không thực tế. SSL có thể sử dụng một tập hợp tài liệu nhỏ, được phân loại thủ công để huấn luyện bộ phân loại văn bản ban đầu. Sau đó, mô hình sẽ phân loại khối lượng lớn các tài liệu chưa được gắn nhãn, sử dụng các dự đoán riêng của nó để cải thiện theo thời gian cho các tác vụ như phân tích cảm xúc hoặc phân loại chủ đề.

So sánh với các mô hình học tập khác

Điều quan trọng là phải phân biệt SSL với các khái niệm Trí tuệ nhân tạo (AI) liên quan:

  • Học Tự Giám Sát (SSL) : Mặc dù cùng chung một từ viết tắt, học tự giám sát lại khác. Đây là một loại học không giám sát, trong đó các nhãn được tạo ra từ chính dữ liệu thông qua các tác vụ giả định (ví dụ: dự đoán một từ bị che khuất trong câu). Nó không sử dụng bất kỳ dữ liệu được gắn nhãn thủ công nào, trong khi học bán giám sát yêu cầu một tập dữ liệu nhỏ, được gắn nhãn rõ ràng để hướng dẫn quá trình huấn luyện mô hình .
  • Học tập chủ động : Kỹ thuật này cũng nhằm mục đích giảm chi phí dán nhãn. Tuy nhiên, thay vì sử dụng toàn bộ dữ liệu chưa được dán nhãn, mô hình học tập chủ động sẽ truy vấn một người chú thích một cách thông minh để dán nhãn các điểm dữ liệu có nhiều thông tin nhất. Ngược lại, SSL thường sử dụng dữ liệu chưa được dán nhãn mà không cần tương tác trực tiếp của con người trong quá trình đào tạo.
  • Học chuyển giao : Phương pháp này bao gồm việc sử dụng một mô hình được đào tạo trước trên một tập dữ liệu lớn (như ImageNet ) và sau đó tinh chỉnh nó trên một tập dữ liệu nhỏ hơn, dành riêng cho từng tác vụ. Mặc dù cả hai đều tận dụng kiến thức hiện có, SSL học từ dữ liệu chưa được gắn nhãn của chính tác vụ mục tiêu, trong khi học chuyển giao tận dụng kiến thức từ một tác vụ khác (mặc dù thường có liên quan).

Công cụ và đào tạo

Nhiều nền tảng Học sâu (DL) hiện đại, bao gồm PyTorch ( trang web chính thức của PyTorch ) và TensorFlow ( trang web chính thức của TensorFlow ), cung cấp các chức năng hoặc có thể được điều chỉnh để triển khai các thuật toán SSL. Các thư viện như Scikit-learn cung cấp một số phương pháp SSL . Các nền tảng như Ultralytics HUB hợp lý hóa quy trình bằng cách tạo điều kiện thuận lợi cho việc quản lý các tập dữ liệu có thể chứa hỗn hợp dữ liệu đã được gắn nhãn và chưa được gắn nhãn, giúp đơn giản hóa việc đào tạotriển khai các mô hình được thiết kế để tận dụng các cấu trúc dữ liệu đó. Nghiên cứu về SSL tiếp tục phát triển, với các đóng góp thường được trình bày tại các hội nghị AI lớn như NeurIPSICML .

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard