Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Học chủ động (Active Learning)

Khám phá học chủ động, một phương pháp học máy hiệu quả về chi phí, giúp tăng độ chính xác với ít nhãn hơn. Tìm hiểu cách nó thay đổi quá trình huấn luyện AI!

Active Learning is a strategic approach in machine learning (ML) where the algorithm proactively selects the most informative data points for labeling, rather than passively accepting a pre-labeled dataset. In traditional supervised learning, models often require massive amounts of annotated data, which can be expensive and time-consuming to create. Active learning optimizes this process by identifying "uncertain" or "hard" examples—those near the decision boundary or where the model lacks confidence—and requesting human annotators to label only those specific instances. This iterative loop allows models to achieve high accuracy with significantly fewer labeled samples, making it highly efficient for projects with limited budgets or time constraints.

Chu trình học tập chủ động hoạt động như thế nào?

Cốt lõi của học tập chủ động là một vòng phản hồi thường được gọi là sự tham gia của con người (human-in-the-loop) . Thay vì chỉ huấn luyện một lần trên một tập dữ liệu tĩnh, mô hình sẽ phát triển thông qua các chu kỳ truy vấn và cập nhật.

  1. Khởi tạo : Quá trình bắt đầu với một tập dữ liệu huấn luyện nhỏ đã được gắn nhãn, được sử dụng để huấn luyện một mô hình ban đầu, chẳng hạn như Ultralytics YOLO26 .
  2. Lựa chọn truy vấn : Mô hình đánh giá một lượng lớn dữ liệu chưa được gắn nhãn. Sử dụng chiến lược truy vấn —thường là lấy mẫu dựa trên độ không chắc chắn—nó chọn các hình ảnh hoặc văn bản mà ở đó dự đoán của nó có độ tin cậy thấp nhất.
  3. Chú thích : Các mẫu dữ liệu ưu tiên cao này được gửi đến một chuyên gia, thường được gọi là "nhà tiên tri" trong các tài liệu về học tập chủ động , để dán nhãn dữ liệu .
  4. Huấn luyện lại : Dữ liệu được gán nhãn mới được thêm vào tập dữ liệu huấn luyện, và mô hình được huấn luyện lại. Mô hình được cập nhật này sau đó sẽ có khả năng tốt hơn trong việc chọn ra nhóm mẫu gây nhầm lẫn tiếp theo.

Các Ứng dụng Thực tế

Học tập chủ động là điều không thể thiếu trong các ngành công nghiệp nơi dữ liệu dồi dào nhưng việc gắn nhãn lại đòi hỏi kiến thức chuyên môn hoặc chi phí cao.

  • Phân tích hình ảnh y tế : Trong các lĩnh vực như X quang, việc dán nhãn đòi hỏi các chuyên gia được chứng nhận, và thời gian của họ vô cùng quý giá. Thay vì yêu cầu bác sĩ chú thích hàng nghìn hình ảnh rõ nét, một hệ thống học tập chủ động có thể lọc ra các trường hợp mơ hồ—chẳng hạn như khối u giai đoạn đầu hoặc các dị tật hiếm gặp—cho phép chuyên gia chỉ tập trung vào những hình ảnh thực sự cải thiện khả năng chẩn đoán của mô hình.
  • Xe tự hành : Xe tự lái tạo ra hàng petabyte dữ liệu video. Việc gắn nhãn cho từng khung hình là điều không thể. Học chủ động giúp các kỹ sư xác định các trường hợp ngoại lệ , chẳng hạn như người đi bộ mặc trang phục hóa trang hoặc lái xe trong điều kiện tuyết rơi dày, mà các mô hình phát hiện đối tượng tiêu chuẩn có thể bỏ sót. Bằng cách ưu tiên những tình huống hiếm gặp này, các công ty cải thiện an toàn mà không lãng phí nguồn lực vào các cảnh quay đường cao tốc lặp đi lặp lại.

Python Ví dụ: Lọc các dự đoán không chắc chắn

Ví dụ sau đây minh họa logic "lấy mẫu không chắc chắn" đơn giản bằng cách sử dụng Ultralytics YOLO26 . Chúng ta tải một mô hình, chạy suy luận trên hình ảnh và đánh dấu những hình ảnh có điểm tin cậy dưới một ngưỡng nhất định để xem xét thủ công.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# List of unlabeled image paths
unlabeled_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]

# Run inference
results = model(unlabeled_images)

# Identify samples with low confidence for active learning
uncertain_threshold = 0.6
for result in results:
    # Check if any detection confidence is below the threshold
    if result.boxes.conf.numel() > 0 and result.boxes.conf.min() < uncertain_threshold:
        print(f"Active Learning Query: {result.path} needs human labeling.")

Phân biệt các khái niệm liên quan

Điều quan trọng là phải phân biệt giữa học tập chủ động và các mô hình đào tạo tương tự:

  • Học bán giám sát : Mặc dù cả hai phương pháp đều sử dụng dữ liệu chưa được gắn nhãn, học bán giám sát tự động gán nhãn giả cho dữ liệu dựa trên các dự đoán có độ tin cậy cao của mô hình. Ngược lại, học chủ động yêu cầu sự can thiệp rõ ràng của con người đối với các dự đoán có độ tin cậy thấp.
  • Học chuyển giao (Transfer Learning ): Phương pháp này bao gồm việc lấy một mô hình đã được huấn luyện trước đó (ví dụ như mô hình được huấn luyện trên ImageNet ) và điều chỉnh nó cho một nhiệm vụ mới. Học chủ động tập trung vào việc xác định dữ liệu nào cần được gán nhãn, trong khi học chuyển giao tập trung vào việc tái sử dụng các đặc trưng đã học.
  • Học tăng cường (Reinforcement Learning ): Ở đây, tác nhân học hỏi bằng cách tương tác với môi trường và nhận phần thưởng. Học chủ động (Active Learning) khác biệt ở chỗ nó tìm kiếm các nhãn dữ liệu thực tế tĩnh từ một nguồn thông tin đáng tin cậy, thay vì tối ưu hóa một chuỗi hành động để nhận phần thưởng.

Tích hợp với MLOps

Việc triển khai học tập chủ động hiệu quả đòi hỏi một quy trình Vận hành Học máy (MLOps) mạnh mẽ. Bạn cần cơ sở hạ tầng để quản lý phiên bản dữ liệu, kích hoạt các tác vụ huấn luyện lại và cung cấp giao diện chú thích cho người dùng. Các công cụ tích hợp với hệ sinh thái Ultralytics cho phép người dùng chuyển đổi liền mạch giữa suy luận, quản lý dữ liệu và huấn luyện. Ví dụ, việc sử dụng các tập lệnh huấn luyện tùy chỉnh cho phép các nhà phát triển nhanh chóng tích hợp các lô dữ liệu học tập chủ động mới vào hệ thống của họ. YOLO mô hình.

Để tìm hiểu thêm về các chiến lược lấy mẫu, các nhà nghiên cứu thường tham khảo các khảo sát toàn diện trong tài liệu về học tập chủ động . Ngoài ra, việc hiểu các chỉ số đánh giá mô hình là rất quan trọng để xác minh rằng vòng lặp học tập chủ động thực sự đang cải thiện hiệu suất.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay