Task Vectors

Görev vektörlerinin verimli model birleştirmeyi ve davranış yönlendirmeyi nasıl sağladığını öğren. Sıfır örnekli çoklu görev için Ultralytics YOLO26 ağırlıklarını nasıl manipüle edeceğini keşfet.

Görev vektörleri, yeni bir yetenek kazanmak amacıyla ince ayar (fine-tuning) sırasında bir sinir ağının ağırlıklarında yapılan özel değişiklikleri temsil eder. Araştırmacılar, temel bir modelin parametrelerini ince ayar yapılmış bir modelinkilerden çıkararak, ağırlık uzayında o belirli görev için öğrenilmiş davranışı kapsayan yönlü bir vektörü izole edebilirler. Bu yaklaşım, geliştiricilerin ek bir eğitim hesaplama gücüne ihtiyaç duymadan model davranışlarını yönlendirmek, değiştirmek veya birleştirmek için model parametreleri üzerinde basit aritmetik işlemler uygulamasına olanak tanır.

Görev Vektörleri Transfer Öğrenmeden Nasıl Ayrılır?

Transfer öğrenme kavramı, mevcut bilgisini uyarlamak için bir modeli yeni bir veri kümesi üzerinde ardışık olarak eğitmeyi içerirken, görev vektörleri eğitim sonrası doğrudan modelin yapısal ağırlıkları üzerinde çalışır. Yeni bir alan öğrenmek için gradyanları yeniden eğitmek yerine, görev vektörlerini kullanarak ağırlık uzayı interpolasyonu yapmak, uygulayıcıların bağımsız olarak eğitilmiş birden fazla modelin ağırlık farklarını doğrusal olarak birleştirmesine olanak tanır. Bu, sıfır örnekli (zero-shot) model birleştirme işlemini mümkün kılar ve tek bir modelin, eğitim sırasındaki tipik hesaplama yükü olmadan birden fazla yeteneği aynı anda miras almasına izin verir.

Gerçek Dünya Uygulamaları

Derin öğrenme modellerini cebirsel olarak manipüle etme yeteneği, modern yapay zeka hatlarında birçok etkili uygulamaya yol açmıştır:

Çok Görevli Model Birleştirme: Mühendisler, nesne algılama için optimize edilmiş bir görev vektörünü, görüntü bölümleme için eğitilmiş bir diğeriyle birleştirebilir. Bir Ultralytics YOLO26 temel modeline uygulandığında bu, her iki orijinal ince ayarın güçlü yönlerini koruyarak her iki görevde de aynı anda mükemmelleşen çift amaçlı bir mimari oluşturur.
Makine Unutma ve Yapay Zeka Güvenliği: Bir model önyargılı veya tehlikeli çıktılar sergiliyorsa, araştırmacılar bu belirli istenmeyen davranışı temsil eden bir görev vektörü hesaplayabilir. Bu vektörü modelin ağırlıklarından çıkararak, bu davranışı etkili bir şekilde "silebilir" ve böylece gelişmiş yapay zeka güvenliği ve sağlam yapay zeka etiği standartlarına büyük katkıda bulunabilirler.
Bilgisayarlı Görüde Alan Uyarlaması: Modelleri belirli ortamlar için uyarlarken—gündüzden geceye gerçek zamanlı çıkarım geçişi gibi—görev vektörleri, kullanıcıların adaptasyonun büyüklüğünü ölçeklendirmesine olanak tanır. Vektörün bir kısmını (örneğin 0.5 ölçeklendirme faktörü) uygulamak, her iki alanda da iyi performans gösteren dengeli bir model üretebilir.

PyTorch ile Görev Vektörleriyle Çalışmak

Bir görev vektörü oluşturmak ve uygulamak, PyTorch durum sözlüğüne erişmeyi ve onu manipüle etmeyi gerektirir. Aşağıdaki örnek, ince ayar yapılmış bir YOLO26 modelinden nasıl görev vektörü çıkarılacağını ve belirli bir ölçeklendirme faktörüyle temel modele nasıl geri uygulanacağını göstermektedir.

from ultralytics import YOLO

# Load the state dictionaries for the base and fine-tuned models
base_weights = YOLO("yolo26n.pt").model.state_dict()
tuned_weights = YOLO("yolo26n-custom.pt").model.state_dict()

# Calculate the task vector (tuned weights minus base weights)
task_vector = {k: tuned_weights[k] - base_weights[k] for k in base_weights.keys()}

# Apply the task vector to the base model using a 0.5 scaling factor
for k in base_weights.keys():
    base_weights[k] += 0.5 * task_vector[k]

Ağırlık Manipülasyonunun Geleceği

Büyük dil modelleri ve devasa görme transformerları gibi mimariler parametre sayısı bakımından büyüdükçe, her küçük ayarlama için onları yeniden eğitmek ekonomik olarak imkansız hale gelir. Görev vektörleri, eğitim sonrası model optimizasyonu için matematiksel olarak zarif bir alternatif sunar. Yapay zeka topluluğu, çok gigabaytlık modellerin tamamı yerine hafif görev vektörlerini paylaşarak yapay zekada açık kaynak iş birliğini hızlandırabilir. Özel görev vektörlerin iyileştirildiğinde, Ultralytics Platform kullanımı, sonraki model dağıtım ve izleme süreçlerini basitleştirerek optimize edilmiş ağırlıklarının doğrudan üretime hazır uç noktalara dönüşmesini sağlar.

Task Vectors

Görev Vektörleri Transfer Öğrenmeden Nasıl Ayrılır?

Gerçek Dünya Uygulamaları

PyTorch ile Görev Vektörleriyle Çalışmak

Ağırlık Manipülasyonunun Geleceği

Explore solutions

Tarımda Yapay Zeka

Otomotivde yapay zeka

Sağlık hizmetlerinde yapay zeka

Perakendede Yapay Zeka

Robotikte Yapay Zeka

Üretimde yapay zeka

Lojistikte yapay zeka

Tarımda Yapay Zeka

Otomotivde yapay zeka

Sağlık hizmetlerinde yapay zeka

Perakendede Yapay Zeka

Robotikte Yapay Zeka

Üretimde yapay zeka

Lojistikte yapay zeka

Tarımda Yapay Zeka

Otomotivde yapay zeka

Sağlık hizmetlerinde yapay zeka

Perakendede Yapay Zeka

Robotikte Yapay Zeka

Üretimde yapay zeka

Lojistikte yapay zeka

Yapay zekanın geleceğini birlikte inşa edelim!