Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Học bán giám sát

Khám phá cách Học bán giám sát kết hợp dữ liệu được gắn nhãn và không được gắn nhãn để nâng cao các mô hình AI, giảm chi phí gắn nhãn và tăng độ chính xác.

Học bán giám sát (SSL) là một mô hình mạnh mẽ trong học máy (ML) , giúp thu hẹp khoảng cách giữa học có giám sát hoàn toàn và học không giám sát . Trong khi các phương pháp có giám sát yêu cầu các tập dữ liệu được chú thích đầy đủ và các phương pháp không giám sát hoạt động hoàn toàn mà không cần nhãn, SSL hoạt động bằng cách tận dụng một lượng nhỏ dữ liệu đã được gắn nhãn cùng với một lượng lớn dữ liệu chưa được gắn nhãn. Trong nhiều tình huống thực tế, việc thu thập dữ liệu thô tương đối rẻ, nhưng quá trình gắn nhãn dữ liệu lại tốn kém, mất thời gian và đòi hỏi chuyên môn của con người. SSL giải quyết nút thắt này bằng cách sử dụng các ví dụ được gắn nhãn hạn chế để hướng dẫn quá trình học, cho phép mô hình trích xuất cấu trúc và mẫu từ các phân đoạn chưa được gắn nhãn rộng lớn, do đó cải thiện độ chính xác và khả năng khái quát hóa tổng thể của mô hình .

Cách thức hoạt động của Học Bán Giám Sát

Cơ chế cơ bản đằng sau SSL liên quan đến việc truyền thông tin từ dữ liệu đã được gán nhãn sang dữ liệu chưa được gán nhãn. Quá trình này thường bắt đầu bằng việc huấn luyện một mô hình ban đầu trên tập dữ liệu nhỏ đã được gán nhãn. Mô hình này sau đó được sử dụng để suy ra các dự đoán trên dữ liệu chưa được gán nhãn. Các dự đoán chắc chắn nhất - thường được gọi là nhãn giả - được coi là dữ liệu nền, và mô hình được huấn luyện lại trên tập dữ liệu mở rộng này. Chu trình lặp này cho phép mạng nơ-ron học các ranh giới quyết định mạnh mẽ hơn so với các ranh giới được học chỉ từ dữ liệu đã được gán nhãn.

Các kỹ thuật phổ biến được sử dụng trong SSL bao gồm:

  • Gắn nhãn giả: Mô hình tạo nhãn cho dữ liệu chưa gắn nhãn và các dự đoán có độ tin cậy cao được thêm vào dữ liệu huấn luyện . Điều này thường được sử dụng kết hợp với ngưỡng tin cậy .
  • Chính quy hóa nhất quán: Phương pháp này khuyến khích mô hình đưa ra cùng một dự đoán cho ảnh gốc và ảnh nhiễu (ví dụ: sau khi áp dụng tăng cường dữ liệu ). Nếu mô hình hiểu được đối tượng, việc lật hoặc xoay nhẹ ảnh sẽ không làm thay đổi kết quả phân loại. Bạn có thể tìm hiểu thêm về các khái niệm chính quy hóa nhất quán trong tài liệu học thuật.
  • Phương pháp dựa trên đồ thị: Các điểm dữ liệu được biểu diễn dưới dạng các nút trong đồ thị, trong đó các cạnh phản ánh sự tương đồng. Nhãn được truyền từ các nút có nhãn đến các nút lân cận chưa có nhãn của chúng, một kỹ thuật thường được thảo luận trong nghiên cứu mạng nơ-ron đồ thị (GNN) .

Các Ứng dụng Thực tế

Học bán giám sát đặc biệt có tính chuyển đổi trong các ngành công nghiệp nơi dữ liệu dồi dào nhưng chú thích của chuyên gia lại khan hiếm.

  1. Phân tích hình ảnh y tế: Trong chăm sóc sức khỏe, việc tạo tập dữ liệu được gắn nhãn cho các nhiệm vụ như phát hiện khối u đòi hỏi các bác sĩ X quang được trả lương cao phải chú thích thủ công các ảnh chụp MRI hoặc CT. Với SSL, các nhà nghiên cứu có thể đào tạo mô hình trên một tập hợp nhỏ các ảnh chụp đã được bác sĩ xác minh, sau đó tận dụng hàng nghìn kho lưu trữ chưa được chú thích của bệnh viện để cải thiện hiệu suất. Điều này giúp giảm đáng kể chi phí mà vẫn duy trì các tiêu chuẩn chẩn đoán cao trong AI chăm sóc sức khỏe .
  2. Nhận dạng giọng nói: Trợ lý giọng nói chuyên dụng đòi hỏi một lượng lớn dữ liệu âm thanh. Mặc dù việc ghi lại hàng nghìn giờ âm thanh là không khả thi, các công ty công nghệ có thể sử dụng một tập hợp nhỏ các giọng nói đã ghi lại để huấn luyện mô hình cơ sở. Mô hình này sau đó học hỏi từ các sắc thái của hàng triệu giờ âm thanh chưa được ghi lại trong dữ liệu web , tinh chỉnh khả năng hiểu các giọng điệu và phương ngữ đa dạng thông qua nhận dạng giọng nói tự động .

Phân biệt các khái niệm liên quan

Để hiểu đầy đủ về SSL, bạn cần phân biệt nó với các mô hình học tập tương tự:

  • SSL so với Học tự giám sát : Mặc dù cùng chung một từ viết tắt, nhưng chúng lại khác biệt. Học tự giám sát tạo ra các nhãn riêng từ cấu trúc dữ liệu (ví dụ: dự đoán từ tiếp theo trong câu hoặc một phần bị thiếu trong hình ảnh) mà không cần bất kỳ nhãn nào do con người tạo ra. Học bán giám sát vẫn dựa vào một tập hợp nhãn do con người cung cấp để định hướng quá trình.
  • SSL so với Học tập chủ động : Trong học tập chủ động, mô hình xác định điểm dữ liệu nào gây nhầm lẫn nhất và yêu cầu con người dán nhãn cho chúng một cách rõ ràng. Ngược lại, SSL cố gắng tự động phân giải dữ liệu chưa được dán nhãn mà không làm gián đoạn quy trình làm việc của con người.
  • SSL so với Học chuyển giao : Học chuyển giao bao gồm việc lấy trọng số mô hình từ một tác vụ nguồn (như ImageNet ) và tinh chỉnh chúng trên một tác vụ mục tiêu. SSL tập trung vào việc sử dụng dữ liệu chưa được gắn nhãn từ cùng một phân phối mục tiêu để cải thiện khả năng học tập ngay từ đầu.

Triển khai thực tế

Việc triển khai quy trình làm việc bán giám sát thường liên quan đến vòng lặp "giáo viên-học sinh" hoặc đào tạo lặp đi lặp lại. Dưới đây là một ví dụ khái niệm sử dụng ultralytics Python gói để chứng minh cách người ta có thể suy ra dữ liệu chưa được gắn nhãn để tạo ra các dự đoán có thể dùng làm nhãn giả cho quá trình đào tạo tiếp theo.

from ultralytics import YOLO

# Initialize the YOLO11 model (Teacher)
model = YOLO("yolo11n.pt")

# Train initially on a small, available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on a directory of unlabeled images to generate predictions
# These results can be filtered by confidence to create 'pseudo-labels'
results = model.predict(source="./unlabeled_data", save_txt=True, conf=0.8)

# The saved text files from prediction can now be combined with the original
# dataset to retrain a robust 'Student' model.

Công cụ và triển vọng tương lai

Các nền tảng học sâu như PyTorchTensorFlow cung cấp các khối xây dựng cần thiết để triển khai các vòng lặp SSL và hàm mất mát tùy chỉnh. Khi các mô hình ngày càng lớn và ngốn nhiều dữ liệu, các kỹ thuật như SSL đang trở thành thông lệ tiêu chuẩn để tối đa hóa hiệu quả dữ liệu.

Sắp tới Ultralytics Nền tảng được thiết kế để hợp lý hóa các quy trình công việc như thế này, giúp các nhóm quản lý quá trình chuyển đổi từ dữ liệu thô sang triển khai mô hình bằng cách tạo điều kiện thuận lợi cho quy trình quản lý dữ liệu và chú thích tự động . Bằng cách sử dụng hiệu quả dữ liệu chưa được gắn nhãn, các tổ chức có thể triển khai các giải pháp AI hiệu suất cao như YOLO11 nhanh hơn và tiết kiệm chi phí hơn so với việc chỉ dựa vào các phương pháp giám sát đơn thuần.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay