Khám phá cách học tự giám sát tận dụng dữ liệu chưa gắn nhãn để đào tạo hiệu quả, chuyển đổi AI trong thị giác máy tính, NLP, v.v.
Học tự giám sát (SSL) là một phương pháp học máy (ML) cho phép các mô hình học từ lượng lớn dữ liệu không có nhãn. Không giống như học có giám sát , phụ thuộc nhiều vào dữ liệu được gắn nhãn tỉ mỉ, SSL khéo léo tạo ra các tín hiệu giám sát của riêng nó trực tiếp từ chính dữ liệu đầu vào. Điều này làm cho nó cực kỳ có giá trị trong các lĩnh vực như thị giác máy tính (CV) và xử lý ngôn ngữ tự nhiên (NLP) , nơi dữ liệu không có nhãn rất phong phú, nhưng chi phí và công sức gắn nhãn thủ công ( chú thích dữ liệu ) có thể là quá cao.
Cơ chế cốt lõi đằng sau SSL liên quan đến việc thiết kế một "nhiệm vụ tiền đề". Đây là một nhiệm vụ phụ trợ, tự tạo, trong đó mô hình phải dự đoán một số thuộc tính nhất định của dữ liệu đã bị cố ý ẩn hoặc thay đổi. Bằng cách giải quyết nhiệm vụ tiền đề này, mô hình buộc phải học các cấu trúc và biểu diễn cơ bản có ý nghĩa ( nhúng ) của dữ liệu mà không có nhãn do con người cung cấp. Giai đoạn đào tạo ban đầu này thường được gọi là tiền đào tạo.
Ví dụ, trong thị giác máy tính, một nhiệm vụ giả định có thể bao gồm:
Trong NLP, một nhiệm vụ tiền đề nổi tiếng là mô hình ngôn ngữ bị che giấu, được sử dụng phổ biến bởi các mô hình như BERT . Ở đây, mô hình học cách dự đoán các từ đã bị che giấu ngẫu nhiên (ẩn) trong các câu.
Sau khi đào tạo trước trên các tập dữ liệu lớn không có nhãn, mô hình sẽ nắm bắt được các biểu diễn tính năng phong phú. Mô hình được đào tạo trước này sau đó có thể được điều chỉnh cho các tác vụ hạ lưu cụ thể—chẳng hạn như phát hiện đối tượng , phân loại hình ảnh hoặc phân tích tình cảm —thông qua một quy trình gọi là tinh chỉnh . Tinh chỉnh thường yêu cầu lượng dữ liệu có nhãn nhỏ hơn nhiều so với đào tạo mô hình từ đầu, khiến SSL trở thành một công cụ hỗ trợ chính cho việc học chuyển giao hiệu quả.
Điều quan trọng là phải phân biệt SSL với các mô hình ML liên quan:
SSL đã cải tiến đáng kể khả năng Trí tuệ nhân tạo (AI) :
SSL làm giảm đáng kể sự phụ thuộc vào các tập dữ liệu được gắn nhãn đắt tiền, dân chủ hóa việc phát triển các mô hình AI mạnh mẽ. Các công cụ như PyTorch và TensorFlow , cùng với các nền tảng như Ultralytics HUB , cung cấp môi trường để tận dụng các kỹ thuật SSL để xây dựng và triển khai các giải pháp AI tiên tiến.