Học chủ động (Active Learning)
Khám phá học chủ động, một phương pháp học máy hiệu quả về chi phí, giúp tăng độ chính xác với ít nhãn hơn. Tìm hiểu cách nó thay đổi quá trình huấn luyện AI!
Học chủ động là một phương pháp đào tạo chuyên biệt trong học máy (ML), trong đó một thuật toán học có thể tương tác để truy vấn người dùng hoặc một nguồn thông tin khác (một "oracle") để gắn nhãn các điểm dữ liệu mới. Ý tưởng cốt lõi là nếu một mô hình có thể chọn dữ liệu mà nó học từ đó, nó có thể đạt được độ chính xác cao hơn với ít dữ liệu huấn luyện hơn đáng kể. Điều này đặc biệt có giá trị trong các lĩnh vực mà gắn nhãn dữ liệu tốn kém, tốn thời gian hoặc đòi hỏi kiến thức chuyên môn. Thay vì gắn nhãn toàn bộ tập dữ liệu cùng một lúc, học chủ động ưu tiên các mẫu "nhiều thông tin" nhất để gắn nhãn, làm cho quá trình huấn luyện mô hình hiệu quả hơn nhiều.
Cách thức hoạt động của Học chủ động
Quy trình học chủ động (active learning) mang tính tuần hoàn và thường được mô tả như một quy trình làm việc human-in-the-loop. Nó thường tuân theo các bước sau:
- Đào tạo mô hình ban đầu: Một mô hình, chẳng hạn như một detector Ultralytics YOLO11, trước tiên được đào tạo trên một bộ dữ liệu nhỏ, được gắn nhãn ban đầu.
- Truy vấn Dữ liệu Chưa được Gắn nhãn (Querying Unlabeled Data): Mô hình được huấn luyện một phần sau đó được sử dụng để đưa ra dự đoán trên một nhóm lớn dữ liệu chưa được gắn nhãn. Dựa trên những dự đoán này, mô hình chọn một tập hợp con các mẫu mà nó "không chắc chắn" nhất.
- Chú thích thủ công: Các mẫu không chắc chắn này được trình bày cho một chuyên gia (oracle), người cung cấp nhãn chính xác.
- Tăng cường tập dữ liệu: Các mẫu được gắn nhãn mới được thêm vào tập huấn luyện.
- Huấn luyện lại: Mô hình được huấn luyện lại trên tập dữ liệu lớn hơn, được cập nhật. Chu kỳ này lặp lại cho đến khi hiệu suất của mô hình đạt đến ngưỡng mong muốn hoặc hết ngân sách gán nhãn.
Chìa khóa của quá trình này nằm ở chiến lược truy vấn. Các chiến lược phổ biến bao gồm lấy mẫu không chắc chắn (chọn các phiên bản mà mô hình ít tự tin nhất), truy vấn theo ủy ban (sử dụng nhiều mô hình và chọn các phiên bản mà chúng không đồng ý) hoặc ước tính thay đổi mô hình dự kiến. Một cái nhìn tổng quan tốt về những điều này có thể được tìm thấy trong khảo sát về Học Chủ động này.
Các Ứng dụng Thực tế
Học chủ động (Active learning) đặc biệt hiệu quả trong các lĩnh vực chuyên môn, nơi việc gán nhãn (annotation) bởi chuyên gia là một trở ngại.
- Phân tích ảnh y tế: Khi huấn luyện một AI để phát hiện các bệnh như ung thư từ ảnh chụp y tế, có thể có hàng triệu hình ảnh có sẵn nhưng chỉ có một lượng thời gian hạn chế của bác sĩ радиолог. Thay vì yêu cầu họ gán nhãn các hình ảnh ngẫu nhiên, một hệ thống học chủ động có thể xác định các trường hợp mơ hồ hoặc hiếm gặp nhất để xem xét. Điều này tập trung nỗ lực của chuyên gia vào nơi cần thiết nhất, đẩy nhanh quá trình phát triển một mô hình có độ chính xác cao cho các tác vụ như phát hiện khối u não. Nghiên cứu trong lĩnh vực này cho thấy sự giảm đáng kể trong nỗ lực gán nhãn, như được trình bày chi tiết trong các nghiên cứu như nghiên cứu này về phân đoạn hình ảnh y sinh.
- Lái xe tự động: Các hệ thống perception trong xe tự hành phải được huấn luyện trên các tập dữ liệu lớn và đa dạng, bao gồm vô số tình huống lái xe. Active learning có thể xác định các "edge case" từ dữ liệu lái xe thu thập được—chẳng hạn như người đi bộ bị che khuất một phần bởi chướng ngại vật hoặc điều kiện thời tiết bất thường—mà mô hình nhận diện đối tượng hiện tại đang gặp khó khăn. Bằng cách ưu tiên các tình huống đầy thách thức này để gán nhãn, các nhà phát triển có thể cải thiện hiệu quả độ mạnh mẽ và an toàn của mô hình.
Học chủ động so với các khái niệm liên quan
Điều quan trọng là phải phân biệt Active Learning (Học chủ động) với các mô hình học khác cũng sử dụng dữ liệu chưa được gắn nhãn:
- Học Bán Giám Sát (Semi-Supervised Learning): Sử dụng đồng thời cả dữ liệu được gán nhãn và dữ liệu không được gán nhãn trong quá trình huấn luyện. Không giống như Học Chủ Động (Active Learning), nó thường sử dụng tất cả dữ liệu không được gán nhãn có sẵn một cách thụ động, thay vì chọn lọc các thể hiện cụ thể để gán nhãn.
- Học Tự Giám Sát (Self-Supervised Learning): Học các biểu diễn từ dữ liệu không được gán nhãn bằng cách tạo ra các tác vụ giả (ví dụ: dự đoán một phần bị che khuất của hình ảnh). Nó không yêu cầu chú thích thủ công trong giai đoạn tiền huấn luyện, trong khi Học Chủ Động (Active Learning) dựa vào một "oracle" để gán nhãn. DeepMind đã khám phá sâu rộng lĩnh vực này.
- Học tăng cường (Reinforcement Learning): Học bằng cách thử và sai thông qua tương tác với một môi trường, nhận phần thưởng hoặc hình phạt cho các hành động. Nó không liên quan đến việc truy vấn các nhãn rõ ràng như Học chủ động.
- Học liên kết (Federated Learning): Tập trung vào việc đào tạo các mô hình trên các thiết bị phi tập trung trong khi vẫn giữ dữ liệu cục bộ, chủ yếu giải quyết các lo ngại về quyền riêng tư dữ liệu. Học chủ động (Active Learning) tập trung vào việc thu thập nhãn hiệu quả. Đôi khi, các kỹ thuật này có thể được kết hợp.
Công Cụ và Triển khai
Việc triển khai Active Learning thường liên quan đến việc tích hợp các mô hình ML với các công cụ chú thích và quản lý quy trình làm việc dữ liệu. Các framework như scikit-learn cung cấp một số chức năng, trong khi các thư viện chuyên dụng tồn tại cho các tác vụ cụ thể. Phần mềm chú thích như Label Studio có thể được tích hợp vào các quy trình active learning, cho phép người chú thích cung cấp nhãn cho các mẫu được truy vấn. Quản lý hiệu quả các tập dữ liệu đang phát triển và các mô hình đã được đào tạo là rất quan trọng, và các nền tảng như Ultralytics HUB cung cấp cơ sở hạ tầng để tổ chức các tài sản này trong suốt vòng đời phát triển. Khám phá kho lưu trữ Ultralytics GitHub để biết thêm thông tin về việc triển khai các kỹ thuật ML nâng cao.