Task Arithmetic

Görev aritmetiğinin (task arithmetic), model davranışını düzenlemek için ağırlık güncellemelerini nasıl kullandığını keşfet. Ultralytics YOLO26'da tam bir yeniden eğitim yapmadan görevleri birleştirmeyi veya özellikleri unutmayı öğren.

Görev aritmetiği, önceden eğitilmiş sinir ağlarının davranışını belirli ağırlık güncellemelerini ekleyerek veya çıkararak değiştirmeyi içeren gelişmiş bir machine learning tekniğidir. Bir modeli sıfırdan tamamen yeniden eğitmek yerine, uygulayıcılar temel bir model ile ince ayar yapılmış bir model arasındaki öğrenilmiş farkları izole edebilirler. Bu farklar, esasen belirli bir yeteneği veya davranışı kapsayan yönsel güncellemelerdir. Geliştiriciler, bu güncellemelere toplama ve çıkarma gibi temel matematiksel işlemleri uygulayarak deep learning sistemlerini dinamik bir şekilde düzenleyebilirler. Bu paradigma, büyük ölçekli modelleri yeni gereksinimlere uyarlamak için hafif ve hesaplama açısından verimli bir yöntem sunarak son arXiv research on task arithmetic çalışmalarında önemli ölçüde ilgi görmüştür.

Link to this sectionKonsept Nasıl Çalışır#

The foundation of this technique relies on calculating the difference in model weights between a base pre-trained model and a version that has undergone fine-tuning on a specific dataset. This isolated difference becomes a localized representation of the new skill. By directly manipulating PyTorch state dictionaries or utilizing TensorFlow training methodologies, engineers can scale and combine these weight differences. For instance, subtracting a specific weight update can force a model to "forget" a learned behavior, a concept heavily explored in Anthropic research on model safety.

Link to this sectionGerçek Dünya Uygulamaları#

Görev aritmetiği, modern computer vision ve doğal dil işleme süreçlerinde son derece verimli birçok iş akışının kilidini açar:

Multi-Task Capability Merging: Mühendisler bir Ultralytics YOLO26 temel modelini iki ayrı veri kümesi üzerinde bağımsız olarak eğitebilirler; biri özelleştirilmiş object detection için, diğeri ise image classification için. Her iki görev için ağırlık farklarını hesaplayıp bunları temel modele geri ekleyerek, ortaya çıkan ağ, felaket unutma (catastrophic forgetting) sorununa maruz kalmadan her iki görevi de aynı anda gerçekleştirebilir.
Targeted Unlearning for AI Safety: Eğer bir görme modeli yanlışlıkla eğitim verilerinden yanlı özellikler öğrenirse, araştırmacılar bir kopyasına yanlı veriler üzerinde ince ayar yapabilir, belirli ağırlık farklarını çıkarabilir ve bunları orijinal modelden çıkarabilirler. Çeşitli Google DeepMind discoveries çalışmalarında belirtildiği gibi, bu işlem modelin genel artificial intelligence capabilities özelliklerini korurken istenmeyen davranışı etkili bir şekilde siler.

Link to this sectionİlgili Kavramları Ayırt Etme#

IEEE Xplore archives veya ACM digital library kaynaklarında gezinirken, görev aritmetiğini ilgili metodolojilerle karıştırmak kolaydır:

Task Vectors: Bunlar, aritmetik işlem sırasında kullanılan gerçek matematiksel tensörlerdir (hesaplanan ağırlık farkları). Görev aritmetiği, bu vektörlerin eklenmesi veya çıkarılmasıyla ilgili genel çerçevedir.
Model Merging: Bu, birden fazla modeli birleştirmek için kullanılan daha geniş bir terimdir. Aritmetik, modelleri birleştirmenin bir yolu olsa da, birleştirme işlemi karmaşık yönlendirme ağlarını veya topluluk oluşturmayı (ensembling) da içerebilir.
Transfer Learning: Wikipedia transfer learning concepts içeriğine göre, bu yöntem bir görevden elde edilen bilginin bir başkası için başlangıç noktası olarak kullanılmasını içerir ve bu genellikle daha fazla eğitim döngüsü gerektirir. Görev aritmetiği ise davranışları, ek eğitim döngüleri olmaksızın tamamen doğrudan ağırlık hesaplamaları yoluyla değiştirir.

Link to this sectionAritmetik İşlemleri Uygulama#

Bu model optimization strategies yöntemlerini pratikte uygulamak, modelin iç durumunu dikkatli bir şekilde yönetmeyi gerektirir. Aşağıda, recent computer vision papers çalışmalarında sıkça tartışılan bir teknik olan PyTorch kullanarak bir güncelleme hesaplama ve uygulama örneği bulunmaktadır.

import torch

# Load the state dictionaries of the pre-trained base and fine-tuned models
base_weights = torch.load("yolo26_base.pt")
tuned_weights = torch.load("yolo26_tuned.pt")

# Calculate the task vector and add it back to the base model with a scaling factor
scaling_factor = 0.5
for key in base_weights.keys():
    task_vector = tuned_weights[key] - base_weights[key]
    base_weights[key] += scaling_factor * task_vector

Karmaşık data annotation süreçlerini ve birden fazla ince ayar yapılmış model sürümünü yöneten ekipler için, Ultralytics Platform bulut eğitimini ve sorunsuz dağıtımı denetlemek için modernize edilmiş bir ortam sağlar, böylece yinelemeli model iyileştirmelerinin yönetimi çok daha verimli hale gelir.