Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Học chủ động (Active Learning)

Khám phá cách Học tập chủ động tối ưu hóa quá trình huấn luyện AI. Tìm hiểu cách sử dụng Ultralytics YOLO26 giúp xác định dữ liệu có ý nghĩa, giảm chi phí ghi nhãn và tăng độ chính xác.

Học chủ động là một phương pháp chiến lược trong học máy (ML) trong đó thuật toán chủ động lựa chọn các điểm dữ liệu có nhiều thông tin nhất để gắn nhãn, thay vì thụ động chấp nhận một tập dữ liệu đã được gắn nhãn sẵn. Trong học có giám sát truyền thống, các mô hình thường yêu cầu một lượng lớn dữ liệu được chú thích, việc tạo ra chúng có thể tốn kém và mất thời gian. Học chủ động tối ưu hóa quá trình này bằng cách xác định các ví dụ "không chắc chắn" hoặc "khó" - những ví dụ gần ranh giới quyết định hoặc nơi mô hình thiếu tự tin - và yêu cầu người chú thích chỉ gắn nhãn cho những trường hợp cụ thể đó. Vòng lặp lặp đi lặp lại này cho phép các mô hình đạt được độ chính xác cao với số lượng mẫu được gắn nhãn ít hơn đáng kể, làm cho nó rất hiệu quả đối với các dự án có ngân sách hoặc thời gian hạn chế.

Chu trình học tập chủ động hoạt động như thế nào?

Cốt lõi của học tập chủ động là một vòng phản hồi thường được gọi là sự tham gia của con người (human-in-the-loop) . Thay vì chỉ huấn luyện một lần trên một tập dữ liệu tĩnh, mô hình sẽ phát triển thông qua các chu kỳ truy vấn và cập nhật.

  1. Khởi tạo : Quá trình bắt đầu với một tập dữ liệu huấn luyện nhỏ đã được gắn nhãn, được sử dụng để huấn luyện một mô hình ban đầu, chẳng hạn như Ultralytics YOLO26 .
  2. Lựa chọn truy vấn : Mô hình đánh giá một lượng lớn dữ liệu chưa được gắn nhãn. Sử dụng chiến lược truy vấn —thường là lấy mẫu dựa trên độ không chắc chắn—nó chọn các hình ảnh hoặc văn bản mà ở đó dự đoán của nó có độ tin cậy thấp nhất.
  3. Chú thích : Các mẫu dữ liệu ưu tiên cao này được gửi đến một chuyên gia, thường được gọi là "nhà tiên tri" trong các tài liệu về học tập chủ động , để dán nhãn dữ liệu .
  4. Huấn luyện lại : Dữ liệu được gán nhãn mới được thêm vào tập dữ liệu huấn luyện, và mô hình được huấn luyện lại. Mô hình được cập nhật này sau đó sẽ có khả năng tốt hơn trong việc chọn ra nhóm mẫu gây nhầm lẫn tiếp theo.

Các Ứng dụng Thực tế

Học tập chủ động là điều không thể thiếu trong các ngành công nghiệp nơi dữ liệu dồi dào nhưng việc gắn nhãn lại đòi hỏi kiến thức chuyên môn hoặc chi phí cao.

  • Phân tích hình ảnh y tế : Trong các lĩnh vực như X quang, việc dán nhãn đòi hỏi các chuyên gia được chứng nhận, và thời gian của họ vô cùng quý giá. Thay vì yêu cầu bác sĩ chú thích hàng nghìn hình ảnh rõ nét, một hệ thống học tập chủ động có thể lọc ra các trường hợp mơ hồ—chẳng hạn như khối u giai đoạn đầu hoặc các dị tật hiếm gặp—cho phép chuyên gia chỉ tập trung vào những hình ảnh thực sự cải thiện khả năng chẩn đoán của mô hình.
  • Xe tự hành : Xe tự lái tạo ra hàng petabyte dữ liệu video. Việc gắn nhãn cho từng khung hình là điều không thể. Học chủ động giúp các kỹ sư xác định các trường hợp ngoại lệ , chẳng hạn như người đi bộ mặc trang phục hóa trang hoặc lái xe trong điều kiện tuyết rơi dày, mà các mô hình phát hiện đối tượng tiêu chuẩn có thể bỏ sót. Bằng cách ưu tiên những tình huống hiếm gặp này, các công ty cải thiện an toàn mà không lãng phí nguồn lực vào các cảnh quay đường cao tốc lặp đi lặp lại.

Python Ví dụ: Lọc các dự đoán không chắc chắn

Ví dụ sau đây minh họa logic "lấy mẫu không chắc chắn" đơn giản bằng cách sử dụng Ultralytics YOLO26 . Chúng ta tải một mô hình, chạy suy luận trên hình ảnh và đánh dấu những hình ảnh có điểm tin cậy dưới một ngưỡng nhất định để xem xét thủ công.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# List of unlabeled image paths
unlabeled_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]

# Run inference
results = model(unlabeled_images)

# Identify samples with low confidence for active learning
uncertain_threshold = 0.6
for result in results:
    # Check if any detection confidence is below the threshold
    if result.boxes.conf.numel() > 0 and result.boxes.conf.min() < uncertain_threshold:
        print(f"Active Learning Query: {result.path} needs human labeling.")

Phân biệt các khái niệm liên quan

Điều quan trọng là phải phân biệt giữa học tập chủ động và các mô hình đào tạo tương tự:

  • Học bán giám sát : Mặc dù cả hai phương pháp đều sử dụng dữ liệu chưa được gắn nhãn, học bán giám sát tự động gán nhãn giả cho dữ liệu dựa trên các dự đoán có độ tin cậy cao của mô hình. Ngược lại, học chủ động yêu cầu sự can thiệp rõ ràng của con người đối với các dự đoán có độ tin cậy thấp.
  • Học chuyển giao (Transfer Learning ): Phương pháp này bao gồm việc lấy một mô hình đã được huấn luyện trước đó (ví dụ như mô hình được huấn luyện trên ImageNet ) và điều chỉnh nó cho một nhiệm vụ mới. Học chủ động tập trung vào việc xác định dữ liệu nào cần được gán nhãn, trong khi học chuyển giao tập trung vào việc tái sử dụng các đặc trưng đã học.
  • Học tăng cường (Reinforcement Learning ): Ở đây, tác nhân học hỏi bằng cách tương tác với môi trường và nhận phần thưởng. Học chủ động (Active Learning) khác biệt ở chỗ nó tìm kiếm các nhãn dữ liệu thực tế tĩnh từ một nguồn thông tin đáng tin cậy, thay vì tối ưu hóa một chuỗi hành động để nhận phần thưởng.

Tích hợp với MLOps

Việc triển khai học tập chủ động hiệu quả đòi hỏi một quy trình Vận hành Học máy (MLOps) mạnh mẽ. Bạn cần cơ sở hạ tầng để quản lý phiên bản dữ liệu, kích hoạt các tác vụ huấn luyện lại và cung cấp giao diện chú thích cho người dùng. Các công cụ tích hợp với hệ sinh thái Ultralytics cho phép người dùng chuyển đổi liền mạch giữa suy luận, quản lý dữ liệu và huấn luyện. Ví dụ, việc sử dụng các tập lệnh huấn luyện tùy chỉnh cho phép các nhà phát triển nhanh chóng tích hợp các lô dữ liệu học tập chủ động mới vào hệ thống của họ. YOLO mô hình.

Để tìm hiểu thêm về các chiến lược lấy mẫu, các nhà nghiên cứu thường tham khảo các khảo sát toàn diện trong tài liệu về học tập chủ động . Ngoài ra, việc hiểu các chỉ số đánh giá mô hình là rất quan trọng để xác minh rằng vòng lặp học tập chủ động thực sự đang cải thiện hiệu suất.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay