Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Học chủ động (Active Learning)

Khám phá học chủ động, một phương pháp học máy hiệu quả về chi phí, giúp tăng độ chính xác với ít nhãn hơn. Tìm hiểu cách nó thay đổi quá trình huấn luyện AI!

Học chủ động là một phương pháp tiếp cận động trong học máy (ML) được thiết kế để tối ưu hóa quá trình đào tạo bằng cách chọn lọc các điểm dữ liệu giàu thông tin nhất để chú thích. Trong học có giám sát tiêu chuẩn, mô hình được cung cấp thụ động một tập dữ liệu lớn, được gắn nhãn sẵn, điều này có thể không hiệu quả và tốn kém nếu dữ liệu bao gồm các ví dụ dư thừa hoặc không mang lại thông tin. Học chủ động thay đổi mô hình này bằng cách cho phép mô hình tương tác truy vấn nguồn thông tin—thường là một chuyên gia hoặc "nhà tiên tri"—để yêu cầu gắn nhãn cho các trường hợp cụ thể, mơ hồ. Chiến lược nhắm mục tiêu này giảm đáng kể lượng dữ liệu đào tạo cần thiết để đạt được độ chính xác cao, khiến nó trở nên lý tưởng cho các dự án có ngân sách hạn chế hoặc bị ràng buộc chặt chẽ về thời gian.

Chu trình học tập tích cực

Quá trình học tập chủ động hoạt động như một chu trình lặp, thường được mô tả là quy trình làm việc có sự tham gia của con người . Chu trình này đảm bảo rằng nỗ lực của con người chỉ tập trung vào dữ liệu đóng góp nhiều nhất vào việc cải thiện mô hình. Quy trình làm việc điển hình bao gồm:

  1. Khởi tạo : Một mô hình, chẳng hạn như Ultralytics YOLO11 , được đào tạo trên một tập dữ liệu hạt giống nhỏ được gắn nhãn ban đầu.
  2. Truy vấn : Mô hình chạy dự đoán trên một lượng lớn dữ liệu chưa được gắn nhãn. Sử dụng chiến lược truy vấn, mô hình xác định các mẫu có độ tin cậy thấp hoặc dự đoán không chắc chắn.
  3. Chú thích : Các mẫu "không chắc chắn" có mức độ ưu tiên cao này được gửi đến người chú thích để dán nhãn.
  4. Cập nhật : Các mẫu mới được gắn nhãn sẽ được thêm vào bộ dữ liệu huấn luyện và quá trình huấn luyện mô hình sẽ được lặp lại để tinh chỉnh thuật toán.

Hiệu quả của phương pháp này phụ thuộc rất nhiều vào chiến lược lấy mẫu. Lấy mẫu bất định là kỹ thuật phổ biến nhất, trong đó thuật toán chọn các trường hợp gần nhất với ranh giới quyết định của nó. Thông tin chi tiết về các chiến lược này có sẵn trong nhiều khảo sát tài liệu về học tập chủ động .

Python Ví dụ: Lấy mẫu không chắc chắn với YOLO11

Đoạn mã sau đây minh họa cách triển khai vòng lặp lấy mẫu bất định cơ bản. Vòng lặp này tải một mô hình, dự đoán trên hình ảnh và xác định những hình ảnh có độ tin cậy thấp, sau đó đánh dấu chúng để xem xét thủ công.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on a list or directory of unlabeled images
results = model.predict(["image1.jpg", "image2.jpg"])

# Identify images where the model is uncertain
uncertain_samples = []
for result in results:
    # Check if detections exist and if the maximum confidence is below a threshold
    if result.boxes.conf.numel() > 0 and result.boxes.conf.max() < 0.6:
        uncertain_samples.append(result.path)
        print(f"Flagging {result.path} for manual labeling.")

print(f"Total uncertain images found: {len(uncertain_samples)}")

Các Ứng dụng Thực tế

Học tập chủ động đặc biệt có giá trị trong các lĩnh vực mà việc dán nhãn dữ liệu tốn kém hoặc đòi hỏi chuyên môn đặc biệt.

  • Phân tích hình ảnh y tế : Trong chăm sóc sức khỏe, việc thu thập dữ liệu được gắn nhãn cho các nhiệm vụ như phát hiện khối u não thường đòi hỏi thời gian của các bác sĩ X-quang có trình độ chuyên môn cao. Thay vì gắn nhãn hàng nghìn lần chụp thông thường, các hệ thống học tập chủ động có thể xác định các bất thường hiếm gặp hoặc mơ hồ để chuyên gia xem xét. Nghiên cứu về phân đoạn hình ảnh y sinh đã chỉ ra rằng phương pháp này có thể giảm đáng kể công sức chú thích mà vẫn duy trì độ chính xác chẩn đoán.
  • Xe tự hành : Xe tự lái thu thập một lượng lớn dữ liệu video. Việc gắn nhãn cho từng khung hình là không thực tế. Học tập chủ động giúp các kỹ sư tìm ra những "trường hợp ngoại lệ" - chẳng hạn như điều kiện thời tiết bất thường hoặc người đi bộ hóa trang - mà mô hình phát hiện vật thể hiện tại đang gặp khó khăn. classify . Bằng cách ưu tiên những tình huống đầy thách thức này, các công ty như NVIDIA cải thiện tính an toàn và độ mạnh mẽ của hệ thống nhận thức của họ.

Phân biệt với các khái niệm liên quan

Mặc dù học tập chủ động liên quan đến việc sử dụng dữ liệu chưa được gắn nhãn, nhưng nó khác biệt so với các mô hình học máy khác:

  • Học bán giám sát : Phương pháp này sử dụng cả dữ liệu có nhãn và không có nhãn trong quá trình huấn luyện, nhưng thường hoạt động thụ động. Phương pháp này thường dựa vào các giả định về phân phối dữ liệu để truyền nhãn, trong khi học chủ động truy vấn thông tin mới một cách rõ ràng.
  • Học tự giám sát : Trong phương pháp này, mô hình tự tạo ra các tín hiệu giám sát từ cấu trúc dữ liệu (ví dụ: dự đoán phần bị thiếu của hình ảnh). Phương pháp này không yêu cầu tương tác của con người để tạo nhãn cho phần chưa được gắn nhãn, một lĩnh vực nghiên cứu quan trọng tại các phòng thí nghiệm như Google AI .
  • Học tăng cường : Phương pháp này liên quan đến việc một tác nhân học cách đưa ra quyết định bằng cách nhận phần thưởng hoặc hình phạt từ môi trường. Không giống như học chủ động, vốn tìm kiếm nhãn tĩnh cho các điểm dữ liệu, học tăng cường tập trung vào việc tối ưu hóa một chuỗi hành động.

Tích hợp vào MLOps

Việc triển khai học tập chủ động đòi hỏi một quy trình Vận hành Máy học (MLOps) mạnh mẽ để quản lý luồng dữ liệu giữa mô hình, tập dữ liệu và giao diện chú thích. Các công cụ hỗ trợ quản lý và kiểm soát phiên bản dữ liệu là rất cần thiết để theo dõi những mẫu nào đã được truy vấn. Mặc dù các thư viện đa năng như scikit-learn mang lại một số tiện ích, quy trình làm việc thị giác máy tính thường yêu cầu tích hợp tùy chỉnh với tập dữ liệu hình ảnh để trực quan hóa và chú thích các hình ảnh đã chọn một cách hiệu quả. Người dùng nâng cao có thể khám phá kho lưu trữ GitHub của Ultralytics để xem cách cấu trúc kết quả dự đoán để đưa vào các vòng lặp quản lý dữ liệu này.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay