Task Vectors

Tìm hiểu cách task vectors cho phép hợp nhất mô hình và điều hướng hành vi hiệu quả. Khám phá cách thao tác trọng số của Ultralytics YOLO26 cho các tác vụ đa nhiệm zero-shot.

Task vectors đại diện cho các thay đổi cụ thể được thực hiện đối với trọng số của một neural network trong quá trình fine-tuning để đạt được một khả năng mới. Bằng cách trừ các tham số của một foundational base model khỏi các tham số của một model đã được fine-tuned, các nhà nghiên cứu có thể cô lập một vector định hướng trong không gian trọng số, gói gọn hành vi đã học cho task cụ thể đó. Cách tiếp cận này cho phép các nhà phát triển áp dụng các arithmetic operations on model parameters đơn giản để điều khiển, sửa đổi hoặc hợp nhất các hành vi của model mà không cần thêm tài nguyên tính toán để train.

Link to this sectionCách Task Vectors khác biệt với Transfer Learning#

Trong khi khái niệm transfer learning bao gồm việc train model một cách tuần tự trên tập dữ liệu mới để thích nghi với kiến thức hiện có, task vectors hoạt động trực tiếp trên các trọng số cấu trúc của model sau khi train. Thay vì retrain gradients để học một domain mới, weight space interpolation sử dụng task vectors cho phép các kỹ sư kết hợp tuyến tính các khác biệt về trọng số từ nhiều model được train độc lập. Điều này cho phép thực hiện model merging zero-shot, giúp một model duy nhất kế thừa nhiều khả năng cùng lúc mà không cần computational overhead during training như thông thường.

Link to this sectionCác ứng dụng trong thực tế#

Khả năng thao tác đại số với các model deep learning đã dẫn đến nhiều ứng dụng có tác động lớn trong các pipeline AI hiện đại:

Multi-Task Model Merging: Các kỹ sư có thể kết hợp một task vector được tối ưu hóa cho object detection với một vector khác được train cho image segmentation. Khi áp dụng cho base model Ultralytics YOLO26, điều này tạo ra một kiến trúc đa mục đích vượt trội ở cả hai tác vụ đồng thời, đồng thời bảo toàn thế mạnh của mỗi lần fine-tune gốc.
Machine Unlearning and AI Safety: Nếu một model hiển thị các kết quả đầu ra có thiên kiến hoặc nguy hiểm, các nhà nghiên cứu có thể tính toán một task vector đại diện cho hành vi không mong muốn cụ thể đó. Bằng cách trừ vector này khỏi các trọng số của model, họ có thể "xóa" hành vi đó một cách hiệu quả, đóng góp lớn vào việc cải thiện các tiêu chuẩn về AI safety và AI ethics vững chắc.
Domain Adaptation in Computer Vision: Khi điều chỉnh các model cho các môi trường cụ thể—chẳng hạn như chuyển từ real-time inference ban ngày sang ban đêm—task vectors cho phép người dùng thay đổi mức độ thích nghi. Áp dụng một phần của vector (ví dụ: hệ số tỉ lệ 0.5) có thể tạo ra một model cân bằng hoạt động tốt trong cả hai domain.

Link to this sectionLàm việc với Task Vectors trong PyTorch#

Việc tạo và áp dụng một task vector đòi hỏi phải truy cập và thao tác với PyTorch state dictionary. Ví dụ sau đây minh họa cách trích xuất một task vector từ model YOLO26 đã fine-tune và áp dụng nó trở lại base model với một hệ số tỉ lệ cụ thể.

from ultralytics import YOLO

# Load the state dictionaries for the base and fine-tuned models
base_weights = YOLO("yolo26n.pt").model.state_dict()
tuned_weights = YOLO("yolo26n-custom.pt").model.state_dict()

# Calculate the task vector (tuned weights minus base weights)
task_vector = {k: tuned_weights[k] - base_weights[k] for k in base_weights.keys()}

# Apply the task vector to the base model using a 0.5 scaling factor
for k in base_weights.keys():
    base_weights[k] += 0.5 * task_vector[k]

Link to this sectionTương lai của việc thao tác trọng số#

Khi các kiến trúc như large language models và vision transformers khổng lồ ngày càng tăng về số lượng tham số, việc retrain chúng cho mỗi điều chỉnh nhỏ trở nên không khả thi về mặt kinh tế. Task vectors cung cấp một giải pháp thay thế thanh lịch về mặt toán học cho model optimization hậu đào tạo. Bằng cách chia sẻ các task vectors nhẹ thay vì toàn bộ các model nặng hàng gigabyte, cộng đồng AI có thể đẩy nhanh open-source collaboration in AI. Sau khi các custom task vectors của bạn được hoàn thiện, việc sử dụng Ultralytics Platform sẽ đơn giản hóa các quy trình model deployment và giám sát tiếp theo, đảm bảo các trọng số đã tối ưu hóa của bạn được chuyển đổi trực tiếp thành các endpoint sẵn sàng cho sản xuất.

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Task Vectors

Link to this sectionCách Task Vectors khác biệt với Transfer Learning#

Link to this sectionCác ứng dụng trong thực tế#

Link to this sectionLàm việc với Task Vectors trong PyTorch#

Link to this sectionTương lai của việc thao tác trọng số#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!