Thuật ngữ

Mô hình tổng hợp

Tăng cường độ chính xác và độ bền của mô hình với Model Ensembles. Khám phá các kỹ thuật như đóng gói, tăng cường, xếp chồng và các ứng dụng thực tế.

Một mô hình tổng hợp là một phương pháp học máy (ML) trong đó nhiều mô hình riêng lẻ được kết hợp một cách chiến lược để tạo ra một đầu ra dự đoán duy nhất, thường là vượt trội. Thay vì dựa vào một mô hình duy nhất, việc tổng hợp tận dụng trí thông minh tập thể của một số mô hình, nhằm mục đích cải thiện hiệu suất tổng thể, tăng cường độ mạnh mẽ và giảm khả năng đưa ra các dự đoán kém do điểm yếu của bất kỳ mô hình nào. Kỹ thuật này là nền tảng của trí tuệ nhân tạo (AI) hiện đại và được áp dụng rộng rãi trong nhiều lĩnh vực khác nhau, bao gồm cả thị giác máy tính (CV) . Tổng hợp mô hình nằm trong danh mục rộng hơn của Phương pháp tổng hợp .

Mô hình hoạt động như thế nào

Ý tưởng cốt lõi đằng sau việc tập hợp mô hình là bằng cách kết hợp các mô hình đa dạng—các mô hình được đào tạo khác nhau hoặc sử dụng các thuật toán khác nhau—các lỗi riêng lẻ của chúng có thể hủy lẫn nhau, dẫn đến dự đoán cuối cùng chính xác và đáng tin cậy hơn. Các chiến lược phổ biến để kết hợp các đầu ra của mô hình bao gồm:

Trung bình/Biểu quyết: Đối với các tác vụ hồi quy, các dự đoán từ các mô hình riêng lẻ được tính trung bình. Đối với các tác vụ phân loại, dự đoán cuối cùng được xác định bằng cách bỏ phiếu đa số (bỏ phiếu cứng) hoặc bằng cách tính trung bình các xác suất dự đoán (bỏ phiếu mềm).
Bagging (Bootstrap Aggregating): Nhiều trường hợp của cùng một mô hình cơ sở (ví dụ như cây quyết định ) được đào tạo độc lập trên các tập hợp con ngẫu nhiên khác nhau của dữ liệu đào tạo . Thuật toán Rừng ngẫu nhiên là một ví dụ điển hình về bagging.
Boosting: Các mô hình được đào tạo tuần tự, với mỗi mô hình mới tập trung vào việc sửa lỗi do các mô hình trước đó gây ra. Ví dụ bao gồm AdaBoost, Gradient Boosting và XGBoost .
Xếp chồng: Dự đoán từ nhiều mô hình cơ sở khác nhau (ví dụ: SVM , mạng nơ-ron và mô hình k-Nearest Neighbors ) được sử dụng làm các tính năng đầu vào cho "siêu mô hình" cuối cùng (thường là mô hình đơn giản hơn như hồi quy logistic ) để tìm hiểu cách kết hợp tốt nhất các dự đoán này.

Trong bối cảnh học sâu , các nhóm có thể liên quan đến việc kết hợp các mô hình với các kiến trúc khác nhau (như CNN và Vision Transformer (ViT) ), các mô hình được đào tạo với các siêu tham số khác nhau hoặc các mô hình được đào tạo trên các tập hợp dữ liệu khác nhau. Các kỹ thuật như lưu các điểm kiểm tra mô hình ở các thời điểm khác nhau và tập hợp chúng (snapshot ensembling) cũng có thể hiệu quả.

Mô hình Ensemble so với Phương pháp Ensemble

Mặc dù có liên quan chặt chẽ, những thuật ngữ này có sắc thái hơi khác nhau.

Phương pháp tổng hợp : Đây là phạm trù rộng về các kỹ thuật hoặc thuật toán (như bagging, increasing, stacking) được sử dụng để tạo và kết hợp nhiều mô hình. Đó là phương pháp luận.
Mô hình tổng hợp: Thông thường, điều này đề cập đến nhóm mô hình cụ thể đã được kết hợp bằng phương pháp tổng hợp. Đó chính là mô hình tổng hợp kết quả.

Về cơ bản, bạn sử dụng phương pháp tổng hợp để tạo ra một mô hình tổng hợp.

Lợi ích và cân nhắc

Việc sử dụng các nhóm mô hình mang lại những lợi thế đáng kể:

Hiệu suất được cải thiện: Các tổ hợp thường đạt được độ chính xác cao hơn và khả năng khái quát tốt hơn bất kỳ mô hình thành phần đơn lẻ nào, thường xuyên giành chiến thắng trong các cuộc thi học máy .
Tăng cường tính mạnh mẽ: Bằng cách tính trung bình các sai lệch hoặc lỗi của từng mô hình, các tập hợp ít nhạy cảm hơn với các giá trị ngoại lai hoặc nhiễu trong dữ liệu và ít có khả năng bị quá khớp .
Giảm lỗi: Kết hợp nhiều mô hình khác nhau giúp giảm thiểu rủi ro khi chỉ dựa vào một mô hình có lỗi.

Tuy nhiên, vẫn có những cân nhắc sau:

Tăng độ phức tạp: Đào tạo, quản lý và triển khai nhiều mô hình vốn phức tạp hơn so với việc xử lý một mô hình duy nhất. Việc triển khai mô hình trở nên phức tạp hơn.
Chi phí tính toán cao hơn: Đào tạo nhiều mô hình đòi hỏi nhiều tài nguyên tính toán hơn ( CPU / GPU ) và thời gian. Suy luận cũng có thể chậm hơn vì các dự đoán từ tất cả các mô hình cơ sở cần được tính toán và kết hợp.
Khả năng diễn giải: Việc hiểu lý do tại sao một nhóm đưa ra một dự đoán cụ thể có thể khó khăn hơn so với việc diễn giải một mô hình đơn giản hơn, mặc dù các kỹ thuật cho AI có thể giải thích (XAI) đang phát triển.

Các nền tảng như Ultralytics HUB có thể giúp quản lý sự phức tạp của việc đào tạo và theo dõi nhiều mô hình, có khả năng đơn giản hóa việc tạo ra các nhóm hiệu quả.

Ứng dụng trong thế giới thực

Các nhóm mô hình được sử dụng rộng rãi trong nhiều lĩnh vực khác nhau:

Phát hiện đối tượng trong thị giác máy tính: Trong các nhiệm vụ như lái xe tự động hoặc giám sát an ninh , các mô hình phát hiện đối tượng khác nhau (ví dụ: các phiên bản khác nhau của Ultralytics YOLO như YOLOv8 và YOLOv10 , hoặc các mô hình như RT-DETR ) có thể được tập hợp lại. Ví dụ, việc kết hợp các mô hình được đào tạo trên các phép tăng cường khác nhau hoặc ở các giai đoạn đào tạo khác nhau ( Tăng cường thời gian thử nghiệm có thể được coi là một hình thức tập hợp lại) có thể cải thiện độ chính xác và độ mạnh mẽ của phát hiện trong các điều kiện đầy thách thức ( Hướng dẫn tập hợp lại mô hình YOLOv5 ).
Chẩn đoán y khoa: Các tập hợp có thể kết hợp các dự đoán từ các mô hình khác nhau phân tích hình ảnh y khoa (như X-quang hoặc MRI) hoặc dữ liệu bệnh nhân. Một mô hình có thể xuất sắc trong việc phát hiện một số bất thường nhất định, trong khi một mô hình khác lại tốt hơn ở các bất thường khác. Việc kết hợp chúng có thể dẫn đến một công cụ chẩn đoán đáng tin cậy hơn, rất quan trọng đối với các ứng dụng như phát hiện khối u .
Dự báo tài chính: Dự đoán giá cổ phiếu hoặc rủi ro tín dụng thường liên quan đến sự không chắc chắn cao. Các mô hình tổng hợp được đào tạo trên các cửa sổ dữ liệu lịch sử khác nhau hoặc sử dụng các chỉ số kinh tế khác nhau có thể cung cấp các dự báo ổn định và chính xác hơn bất kỳ mô hình dự đoán nào. Khám phá thêm về AI trong tài chính .
Kiểm soát chất lượng sản xuất: Kết hợp các mô hình kiểm tra sản phẩm từ nhiều góc độ khác nhau hoặc tập trung vào các loại lỗi khác nhau có thể tạo ra một hệ thống kiểm tra chất lượng toàn diện hơn so với một mô hình thị giác đơn lẻ ( Thị giác máy tính trong sản xuất ).

Lắp ráp mô hình là một kỹ thuật mạnh mẽ giúp mở rộng ranh giới hiệu suất của các hệ thống ML, khiến nó trở thành một công cụ có giá trị trong bộ công cụ của nhà phát triển AI .

Mô hình tổng hợp

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Xe lửa YOLO mô hình đơn giản với Ultralytics TRUNG TÂM

Mô hình hoạt động như thế nào

Mô hình Ensemble so với Phương pháp Ensemble

Lợi ích và cân nhắc

Ứng dụng trong thế giới thực

Đọc thêm blog

Tham gia Ultralytics cộng đồng