Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Ensemble (Tập hợp)

Khám phá cách học tập kết hợp (ensemble learning) cải thiện độ chính xác và giảm hiện tượng quá khớp (overfitting). Tìm hiểu cách kết hợp nhiều mô hình như... Ultralytics YOLO26 cho kết quả xử lý hình ảnh máy tính vượt trội.

Học tập kết hợp là một chiến lược mạnh mẽ trong học máy (ML) trong đó nhiều mô hình độc lập, thường được gọi là "mô hình học yếu", được kết hợp để tạo ra một kết quả dự đoán duy nhất. Nguyên tắc cơ bản là một nhóm các mô hình thường có thể đạt được độ chính xác cao hơn và khả năng khái quát hóa tốt hơn so với bất kỳ mô hình đơn lẻ nào. Bằng cách tổng hợp các dự đoán từ các thuật toán đa dạng, các phương pháp học tập kết hợp giúp giảm thiểu rủi ro quá khớp với dữ liệu huấn luyện , làm mịn các lỗi ngẫu nhiên và cải thiện tính ổn định tổng thể của hệ thống. Cách tiếp cận này tương tự như việc tham khảo ý kiến ​​của một nhóm chuyên gia thay vì chỉ dựa vào ý kiến ​​của một cá nhân để đưa ra quyết định quan trọng.

Cơ chế học tập tổng hợp

Hiệu quả của các phương pháp kết hợp nằm ở khả năng điều chỉnh sự cân bằng giữa độ lệch và phương sai . Các mô hình riêng lẻ có thể bị ảnh hưởng bởi phương sai cao (nhạy cảm với nhiễu) hoặc độ lệch cao (đơn giản hóa quá mức). Việc kết hợp các mô hình giúp giảm thiểu những vấn đề này thông qua các kỹ thuật cụ thể:

  • Phương pháp Bagging (Bootstrap Aggregating) : Kỹ thuật này bao gồm việc huấn luyện nhiều phiên bản của cùng một thuật toán trên các tập con khác nhau của tập dữ liệu. Ví dụ nổi tiếng nhất là thuật toán Rừng ngẫu nhiên (Random Forest ), thuật toán này tổng hợp các quyết định của nhiều cây quyết định để giảm phương sai.
  • Boosting : Khác với bagging, boosting huấn luyện các mô hình theo trình tự. Mỗi mô hình mới tập trung vào việc sửa chữa các lỗi do các mô hình trước đó gây ra. Các framework phổ biến như LightGBMCatBoost sử dụng phương pháp này để tạo ra các hệ thống dự đoán có độ chính xác cao.
  • Ghép nối (Tổng quát hóa xếp chồng) : Phương pháp này bao gồm việc huấn luyện một "mô hình meta" mới để kết hợp các dự đoán của một số mô hình cơ sở không đồng nhất (ví dụ: mạng nơ-ronmáy vectơ hỗ trợ ).

Ghép nhóm trong thị giác máy tính

Trong lĩnh vực thị giác máy tính (CV) , các mô hình kết hợp thường được sử dụng để tối đa hóa hiệu suất trong các cuộc thi và các ứng dụng an toàn quan trọng. Đối với phát hiện đối tượng , điều này thường liên quan đến việc chạy nhiều mô hình — chẳng hạn như các phiên bản khác nhau của YOLO26 — trên cùng một hình ảnh. Sau đó, các hộp giới hạn thu được sẽ được hợp nhất bằng các kỹ thuật như loại bỏ cực đại không cục bộ ( NMS ) hoặc hợp nhất hộp có trọng số (WBF) để tìm ra vị trí đối tượng có khả năng nhất.

Các Ứng dụng Thực tế

Các phương pháp kết hợp được sử dụng rộng rãi trong các ngành công nghiệp mà độ tin cậy dự đoán là tối quan trọng.

  1. Chẩn đoán và hình ảnh y tế : Trong chăm sóc sức khỏe, việc tránh kết quả âm tính giả là rất quan trọng. Một hệ thống kết hợp có thể bao gồm Mạng nơ-ron tích chập (CNN) được huấn luyện trên ảnh X-quang với Bộ chuyển đổi thị giác (ViT) để... detect các bất thường. Sự đồng thuận giữa các mô hình mang lại điểm tin cậy cao hơn, hỗ trợ các bác sĩ X quang trong việc phát hiện khối u hoặc chẩn đoán các bệnh hiếm gặp.
  2. Phát hiện gian lận tài chính : Các tổ chức tài chính sử dụng các mô hình kết hợp để phân tích các mẫu giao dịch. Bằng cách kết hợp các mô hình hồi quy logistic với máy tăng cường gradient , hệ thống có thể... detect Những dấu hiệu gian lận tinh vi mà một mô hình đơn lẻ có thể bỏ sót, đồng thời vẫn giữ tỷ lệ cảnh báo sai ở mức thấp.

Triển khai mô hình kết hợp với Python

Bạn có thể mô phỏng một tập hợp suy luận cơ bản bằng cách tải nhiều mô hình đã được huấn luyện và tạo ra các dự đoán cho cùng một đầu vào. Nền tảng Ultralytics cho phép bạn huấn luyện các biến thể này một cách dễ dàng. Ví dụ sau đây minh họa việc tải hai mô hình YOLO khác nhau Ultralytics (YOLO26n và YOLO26s) để xác minh các phát hiện trên một hình ảnh.

from ultralytics import YOLO

# Load two distinct YOLO26 model variants
# 'n' (nano) is faster, 's' (small) is more accurate
model_nano = YOLO("yolo26n.pt")
model_small = YOLO("yolo26s.pt")

# Define the image source
source = "https://ultralytics.com/images/bus.jpg"

# Run inference with both models
results_n = model_nano(source)
results_s = model_small(source)

# Compare the number of objects detected by each model
print(f"Nano Model Found: {len(results_n[0].boxes)} objects")
print(f"Small Model Found: {len(results_s[0].boxes)} objects")

So sánh giữa phương pháp kết hợp và phương pháp tăng cường dữ liệu

Điều quan trọng là phải phân biệt giữa học tập kết hợp (Ensemble learning) và tăng cường dữ liệu (Data Augmentation ).

  • Phương pháp Ensemble tập trung vào giai đoạn thiết kếdự đoán , kết hợp nhiều mô hình riêng biệt đã được huấn luyện để cải thiện kết quả.
  • Tăng cường dữ liệu tập trung vào giai đoạn dữ liệu huấn luyện , làm tăng tính đa dạng của tập dữ liệu một cách nhân tạo (ví dụ: thông qua xoay hoặc lật ) để huấn luyện một mô hình duy nhất, mạnh mẽ hơn.

Trong khi tăng cường dữ liệu giúp một mô hình học tốt hơn, học tập kết hợp giúp nhiều mô hình xác thực kết quả đầu ra của nhau. Cả hai chiến lược này thường được sử dụng cùng nhau để đạt được kết quả tiên tiến nhất trong các tác vụ như phân đoạn đối tượngước lượng tư thế .

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay