Khám phá cách Học tập chủ động tối ưu hóa quá trình huấn luyện AI. Tìm hiểu cách sử dụng Ultralytics YOLO26 giúp xác định dữ liệu có ý nghĩa, giảm chi phí ghi nhãn và tăng độ chính xác.
Học chủ động là một phương pháp chiến lược trong học máy (ML) trong đó thuật toán chủ động lựa chọn các điểm dữ liệu có nhiều thông tin nhất để gắn nhãn, thay vì thụ động chấp nhận một tập dữ liệu đã được gắn nhãn sẵn. Trong học có giám sát truyền thống, các mô hình thường yêu cầu một lượng lớn dữ liệu được chú thích, việc tạo ra chúng có thể tốn kém và mất thời gian. Học chủ động tối ưu hóa quá trình này bằng cách xác định các ví dụ "không chắc chắn" hoặc "khó" - những ví dụ gần ranh giới quyết định hoặc nơi mô hình thiếu tự tin - và yêu cầu người chú thích chỉ gắn nhãn cho những trường hợp cụ thể đó. Vòng lặp lặp đi lặp lại này cho phép các mô hình đạt được độ chính xác cao với số lượng mẫu được gắn nhãn ít hơn đáng kể, làm cho nó rất hiệu quả đối với các dự án có ngân sách hoặc thời gian hạn chế.
Cốt lõi của học tập chủ động là một vòng phản hồi thường được gọi là sự tham gia của con người (human-in-the-loop) . Thay vì chỉ huấn luyện một lần trên một tập dữ liệu tĩnh, mô hình sẽ phát triển thông qua các chu kỳ truy vấn và cập nhật.
Học tập chủ động là điều không thể thiếu trong các ngành công nghiệp nơi dữ liệu dồi dào nhưng việc gắn nhãn lại đòi hỏi kiến thức chuyên môn hoặc chi phí cao.
Ví dụ sau đây minh họa logic "lấy mẫu không chắc chắn" đơn giản bằng cách sử dụng Ultralytics YOLO26 . Chúng ta tải một mô hình, chạy suy luận trên hình ảnh và đánh dấu những hình ảnh có điểm tin cậy dưới một ngưỡng nhất định để xem xét thủ công.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# List of unlabeled image paths
unlabeled_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]
# Run inference
results = model(unlabeled_images)
# Identify samples with low confidence for active learning
uncertain_threshold = 0.6
for result in results:
# Check if any detection confidence is below the threshold
if result.boxes.conf.numel() > 0 and result.boxes.conf.min() < uncertain_threshold:
print(f"Active Learning Query: {result.path} needs human labeling.")
Điều quan trọng là phải phân biệt giữa học tập chủ động và các mô hình đào tạo tương tự:
Việc triển khai học tập chủ động hiệu quả đòi hỏi một quy trình Vận hành Học máy (MLOps) mạnh mẽ. Bạn cần cơ sở hạ tầng để quản lý phiên bản dữ liệu, kích hoạt các tác vụ huấn luyện lại và cung cấp giao diện chú thích cho người dùng. Các công cụ tích hợp với hệ sinh thái Ultralytics cho phép người dùng chuyển đổi liền mạch giữa suy luận, quản lý dữ liệu và huấn luyện. Ví dụ, việc sử dụng các tập lệnh huấn luyện tùy chỉnh cho phép các nhà phát triển nhanh chóng tích hợp các lô dữ liệu học tập chủ động mới vào hệ thống của họ. YOLO mô hình.
Để tìm hiểu thêm về các chiến lược lấy mẫu, các nhà nghiên cứu thường tham khảo các khảo sát toàn diện trong tài liệu về học tập chủ động . Ngoài ra, việc hiểu các chỉ số đánh giá mô hình là rất quan trọng để xác minh rằng vòng lặp học tập chủ động thực sự đang cải thiện hiệu suất.