Khám phá học chủ động, một phương pháp học máy hiệu quả về chi phí, giúp tăng độ chính xác với ít nhãn hơn. Tìm hiểu cách nó thay đổi quá trình huấn luyện AI!
Active Learning is a strategic approach in machine learning (ML) where the algorithm proactively selects the most informative data points for labeling, rather than passively accepting a pre-labeled dataset. In traditional supervised learning, models often require massive amounts of annotated data, which can be expensive and time-consuming to create. Active learning optimizes this process by identifying "uncertain" or "hard" examples—those near the decision boundary or where the model lacks confidence—and requesting human annotators to label only those specific instances. This iterative loop allows models to achieve high accuracy with significantly fewer labeled samples, making it highly efficient for projects with limited budgets or time constraints.
Cốt lõi của học tập chủ động là một vòng phản hồi thường được gọi là sự tham gia của con người (human-in-the-loop) . Thay vì chỉ huấn luyện một lần trên một tập dữ liệu tĩnh, mô hình sẽ phát triển thông qua các chu kỳ truy vấn và cập nhật.
Học tập chủ động là điều không thể thiếu trong các ngành công nghiệp nơi dữ liệu dồi dào nhưng việc gắn nhãn lại đòi hỏi kiến thức chuyên môn hoặc chi phí cao.
Ví dụ sau đây minh họa logic "lấy mẫu không chắc chắn" đơn giản bằng cách sử dụng Ultralytics YOLO26 . Chúng ta tải một mô hình, chạy suy luận trên hình ảnh và đánh dấu những hình ảnh có điểm tin cậy dưới một ngưỡng nhất định để xem xét thủ công.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# List of unlabeled image paths
unlabeled_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]
# Run inference
results = model(unlabeled_images)
# Identify samples with low confidence for active learning
uncertain_threshold = 0.6
for result in results:
# Check if any detection confidence is below the threshold
if result.boxes.conf.numel() > 0 and result.boxes.conf.min() < uncertain_threshold:
print(f"Active Learning Query: {result.path} needs human labeling.")
Điều quan trọng là phải phân biệt giữa học tập chủ động và các mô hình đào tạo tương tự:
Việc triển khai học tập chủ động hiệu quả đòi hỏi một quy trình Vận hành Học máy (MLOps) mạnh mẽ. Bạn cần cơ sở hạ tầng để quản lý phiên bản dữ liệu, kích hoạt các tác vụ huấn luyện lại và cung cấp giao diện chú thích cho người dùng. Các công cụ tích hợp với hệ sinh thái Ultralytics cho phép người dùng chuyển đổi liền mạch giữa suy luận, quản lý dữ liệu và huấn luyện. Ví dụ, việc sử dụng các tập lệnh huấn luyện tùy chỉnh cho phép các nhà phát triển nhanh chóng tích hợp các lô dữ liệu học tập chủ động mới vào hệ thống của họ. YOLO mô hình.
Để tìm hiểu thêm về các chiến lược lấy mẫu, các nhà nghiên cứu thường tham khảo các khảo sát toàn diện trong tài liệu về học tập chủ động . Ngoài ra, việc hiểu các chỉ số đánh giá mô hình là rất quan trọng để xác minh rằng vòng lặp học tập chủ động thực sự đang cải thiện hiệu suất.