Khám phá cách hợp nhất mô hình kết hợp nhiều mô hình đã được huấn luyện trước thành một. Tìm hiểu cách kết hợp các mô hình. Ultralytics YOLO26 sử dụng trọng số để tăng hiệu suất mà không làm tăng độ trễ.
Ghép mô hình là một kỹ thuật tiên tiến trong học máy (ML) kết hợp các tham số (trọng số) đã học được của nhiều mô hình được huấn luyện trước thành một mô hình thống nhất duy nhất. Không giống như các thiết lập đa mô hình truyền thống, việc ghép mô hình trực tiếp kết hợp trọng số của mô hình trong không gian tham số. Điều này cho phép người dùng kết hợp kiến thức chuyên môn của một số mô hình được tinh chỉnh trên các nhiệm vụ hoặc tập dữ liệu khác nhau mà không phải chịu chi phí bộ nhớ và tính toán khi chạy nhiều mô hình cùng một lúc.
Bằng cách áp dụng trực tiếp các phép toán vào trọng số, việc hợp nhất mô hình duy trì cấu trúc kiến trúc của một mạng duy nhất. Điều này đặc biệt có giá trị khi triển khai các quy trình xử lý hình ảnh máy tính (CV) tiên tiến đến các thiết bị biên, nơi việc giảm độ trễ suy luận và tiết kiệm bộ nhớ là rất quan trọng.
Việc phân biệt giữa việc hợp nhất mô hình với các khái niệm liên quan như tập hợp mô hình và học chuyển giao là rất hữu ích.
Các nhà nghiên cứu đã phát triển một số phương pháp để kết hợp trọng số một cách hiệu quả mà không làm phá hủy khả năng cơ bản của mạng, như đã được trình bày trong các nghiên cứu học thuật gần đây trên arXiv .
Việc kết hợp các mô hình rất hiệu quả trong việc xây dựng các hệ thống tổng quát mà không cần huấn luyện lại từ đầu.
Bạn có thể dễ dàng thực hiện việc hợp nhất mô hình cơ bản bằng PyTorch . Ví dụ sau đây minh họa cách tính trung bình các từ điển trạng thái của hai mô hình có cấu trúc giống hệt nhau.
import torch
# Load the weights (state dicts) from two identical architectures
weights_a = torch.load("yolo26_task1.pt")["model"].state_dict()
weights_b = torch.load("yolo26_task2.pt")["model"].state_dict()
# Perform simple weight averaging
merged_weights = {k: (weights_a[k] + weights_b[k]) / 2.0 for k in weights_a.keys()}
# Save the newly merged model weights
torch.save({"model": merged_weights}, "yolo26_merged.pt")
Đối với các nhóm đang tìm cách đơn giản hóa quy trình làm việc phức tạp của việc chú thích dữ liệu, huấn luyện và triển khai, Nền tảng Ultralytics cung cấp giao diện trực quan để quản lý các dự án AI thị giác từ đầu đến cuối một cách dễ dàng.
Bắt đầu hành trình của bạn với tương lai của học máy