Thuật ngữ

Tổng hợp

Tăng độ chính xác dự đoán bằng phương pháp tổng hợp! Tìm hiểu cách kết hợp nhiều mô hình để tăng hiệu suất trong phát hiện đối tượng, NLP, v.v.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Các phương pháp tổng hợp đại diện cho một kỹ thuật mạnh mẽ trong học máy (ML)trí tuệ nhân tạo (AI), trong đó nhiều mô hình riêng lẻ, thường được gọi là người học cơ sở hoặc người học yếu, được kết hợp một cách chiến lược để tạo ra một mô hình dự đoán duy nhất, mạnh hơn. Ý tưởng cốt lõi là bằng cách tổng hợp "ý kiến" của một số mô hình đa dạng, mô hình tổng hợp cuối cùng có thể đạt được hiệu suất tốt hơn, độ mạnh mẽ hơn và khả năng khái quát hóa được cải thiện so với bất kỳ mô hình thành phần đơn lẻ nào. Cách tiếp cận này tận dụng nguyên tắc "trí tuệ của đám đông", giảm thiểu các lỗi và sai lệch của từng mô hình để đạt được kết quả đáng tin cậy hơn, rất quan trọng đối với các nhiệm vụ phức tạp trong các lĩnh vực như thị giác máy tính (CV) .

Các nhóm nhạc hoạt động như thế nào

Các phương pháp tổng hợp hoạt động bằng cách đầu tiên là đào tạo nhiều mô hình cơ sở. Các mô hình này có thể cùng loại (tổng hợp đồng nhất) hoặc các loại khác nhau (tổng hợp không đồng nhất), chẳng hạn như kết hợp cây quyết định , máy vectơ hỗ trợ (SVM)mạng nơ-ron (NN) . Chìa khóa thường là khuyến khích sự đa dạng giữa các mô hình cơ sở, đạt được thông qua các kỹ thuật như đào tạo trên các tập hợp con khác nhau của dữ liệu đào tạo hoặc sử dụng các thuật toán hoặc siêu tham số khác nhau. Sau khi được đào tạo, các dự đoán từ các mô hình riêng lẻ này được kết hợp bằng một chiến lược cụ thể. Các chiến lược phổ biến bao gồm tính trung bình các dự đoán (đối với các tác vụ hồi quy) hoặc sử dụng biểu quyết đa số (đối với các tác vụ phân loại). Các phương pháp phức tạp hơn có thể liên quan đến tính trung bình có trọng số hoặc học một mô hình khác (siêu học) để xác định cách tối ưu để kết hợp các đầu ra của mô hình cơ sở.

Lợi ích của việc sử dụng Ensembles

Việc sử dụng phương pháp tổng hợp mang lại một số lợi thế đáng kể:

  • Cải thiện hiệu suất dự đoán: Các tổ hợp thường mang lại độ chính xác cao hơn và hiệu suất tốt hơn trên các số liệu như điểm F1 so với các mô hình đơn lẻ bằng cách giảm lỗi tổng thể.
  • Tăng cường độ mạnh mẽ: Bằng cách trung bình hóa các dự đoán của nhiều mô hình, các nhóm ít nhạy cảm hơn với các đặc thù hoặc nhiễu trong dữ liệu đào tạo và điểm yếu cụ thể của từng người học. Điều này giúp giảm nguy cơ quá khớp .
  • Tổng quát hóa tốt hơn: Các tập hợp có xu hướng tổng quát hóa tốt hơn đối với dữ liệu thử nghiệm chưa biết vì chúng nắm bắt được nhiều mẫu hơn và ít có khả năng bị ảnh hưởng bởi các khía cạnh cụ thể của tập huấn luyện. Điều này liên quan đến việc quản lý sự đánh đổi giữa độ lệch và phương sai .

Kỹ thuật tổng hợp phổ biến

Một số kỹ thuật đã được áp dụng để tạo ra các nhóm nhạc hiệu quả:

  • Bagging (Bootstrap Aggregating): Bao gồm việc đào tạo nhiều trường hợp của cùng một học viên cơ sở trên các tập hợp con ngẫu nhiên khác nhau của dữ liệu đào tạo (lấy mẫu với sự thay thế). Các dự đoán thường được tổng hợp thông qua bỏ phiếu hoặc tính trung bình. Random Forest là một ví dụ phổ biến về kỹ thuật bagging sử dụng cây quyết định.
  • Boosting: Xây dựng nhóm theo trình tự. Mỗi mô hình mới tập trung vào việc sửa lỗi do các mô hình trước đó gây ra. Ví dụ bao gồm AdaBoostGradient Boosting Machines (GBM) .
  • Xếp chồng (Tổng quát hóa xếp chồng): Kết hợp các dự đoán từ nhiều mô hình cơ sở khác nhau (ví dụ: mô hình YOLO Ultralytics , mô hình RT-DETRSVM ) bằng cách đào tạo siêu mô hình (ví dụ: hồi quy logistic ) để tìm hiểu cách kết hợp tốt nhất các đầu ra của chúng. Tìm hiểu thêm về tổng quát hóa xếp chồng .

Phân biệt với các thuật ngữ liên quan

Điều quan trọng là phải phân biệt các nhóm với các khái niệm ML khác:

  • Mô hình phức hợp đơn lẻ: Trong khi một mô hình lớn đơn lẻ (như CNN sâu hoặc Vision Transformer (ViT) ) có thể rất mạnh mẽ thì một tổ hợp kết hợp nhiều mô hình, thường đơn giản hơn, để đạt được độ mạnh mẽ và độ chính xác cao hơn.
  • Học chuyển giao : Bao gồm việc tái sử dụng một mô hình được đào tạo trước (hoặc một phần của mô hình đó) làm điểm khởi đầu cho một nhiệm vụ mới, thay vì kết hợp đầu ra từ nhiều mô hình được đào tạo độc lập.
  • Học tập đa phương thức : Tập trung vào các mô hình đào tạo có thể xử lý và tích hợp thông tin từ các loại dữ liệu khác nhau (ví dụ: hình ảnh và văn bản), trong khi các nhóm thường kết hợp các mô hình làm việc trên cùng một loại dữ liệu và nhiệm vụ.

Ứng dụng trong thế giới thực

Phương pháp tổng hợp được sử dụng rộng rãi trong nhiều lĩnh vực khác nhau do những lợi ích về hiệu suất của chúng:

  1. Thị giác máy tính cho hệ thống tự động: Trong xe tự hành và hệ thống hỗ trợ lái xe tiên tiến (ADAS), các nhóm mô hình phát hiện vật thể (có thể kết hợp các kiến trúc khác nhau như YOLOv10YOLO11 hoặc các mô hình được đào tạo với các chiến lược tăng cường dữ liệu khác nhau) có thể cung cấp khả năng phát hiện người đi bộ, phương tiện và chướng ngại vật đáng tin cậy hơn bằng cách giảm thiểu các chế độ lỗi của bất kỳ mô hình đơn lẻ nào. Các kỹ thuật như Tăng cường thời gian thử nghiệm (TTA) , tính trung bình các dự đoán trên các phiên bản tăng cường của hình ảnh đầu vào, có thể được coi là một hình thức tổng hợp tại thời điểm suy luận.
  2. Phát hiện gian lận tài chính: Các tổ chức tài chính thường sử dụng các nhóm mô hình đa dạng ( hồi quy logistic , tăng cường gradient, mạng nơ-ron ) để phát hiện các giao dịch gian lận. Kết hợp các mô hình nắm bắt các kiểu mẫu và loại hành vi gian lận khác nhau sẽ tạo ra một hệ thống phát hiện mạnh mẽ và chính xác hơn, rất quan trọng để giảm thiểu tổn thất tài chính. Khám phá thêm về AI trong tài chính .
  3. Phân tích hình ảnh y tế: Các tập hợp CNN được sử dụng trong phân tích hình ảnh y tế cho các nhiệm vụ như phát hiện khối u hoặc phân loại bệnh (ví dụ: sử dụng YOLO11 để phát hiện khối u ). Việc kết hợp các mô hình được đào tạo trên các tập dữ liệu khác nhau hoặc với các kiến trúc khác nhau có thể cải thiện độ chính xác và độ tin cậy của chẩn đoán.
  4. Nền tảng thi đấu: Các nhóm được đánh giá cao về hiệu quả trong các cuộc thi học máy , nơi người tham gia thường kết hợp nhiều mô hình hiệu suất cao để giành được lợi thế cạnh tranh.

Lợi ích và cân nhắc

Mặc dù mạnh mẽ, các nhóm làm tăng tính phức tạp và yêu cầu tính toán cho việc đào tạo mô hìnhtriển khai mô hình . Việc quản lý nhiều mô hình đòi hỏi nhiều tài nguyên hơn và kỹ thuật cẩn thận. Tuy nhiên, những lợi ích đáng kể về hiệu suất thường biện minh cho những chi phí này trong các ứng dụng quan trọng. Các nền tảng như Ultralytics HUB có thể đơn giản hóa việc quản lý và đào tạo nhiều mô hình, có khả năng tạo điều kiện thuận lợi cho việc tạo và triển khai các nhóm hiệu quả được xây dựng bằng các khuôn khổ như PyTorch hoặc TensorFlow . Việc đánh giá sự đánh đổi giữa lợi ích về hiệu suất và sự gia tăng tính phức tạp trong quá trình đánh giá mô hình là điều cần thiết cho các ứng dụng thực tế.

Đọc tất cả