Batch boyutunun derin öğrenme üzerindeki etkisini keşfedin. Eğitim hızını, bellek kullanımını ve model performansını verimli bir şekilde optimize edin.
Toplu iş büyüklüğü, çok önemli bir hiper parametredir. belirleyen makine öğrenimi alanı önce işlenen eğitim verisi örneklerinin sayısı model dahili parametrelerini günceller. Tüm veri setini bir kerede analiz etmek yerine - ki bu genellikle hesaplama açısından hafıza sınırlamaları nedeniyle imkansız-derinöğrenme çerçeveleri verileri yığın adı verilen daha küçük gruplara böler. Bu bölüm, öğrenmenin istikrarını yönetir süreci, hesaplama hızı ve gerekli bellek miktarı GPU eğitim sırasında. Seçmek Doğru parti büyüklüğü, hesaplama verimliliği ile modelin kalitesi arasında dengeleyici bir rol oynar. yakınsama.
Bir parti büyüklüğünün seçimi, bir partinin nasıl çalışacağını temelden değiştirir. sinir ağı öğrenir. Parti büyüklüğü ayarlandığında daha düşük bir değere ayarlarsa, model model ağırlıklarını daha sık kullanarak gradyan iniş süreci. Bu gürültü şu şekilde olabilir faydalı olur, genellikle optimizasyon algoritmasının kaçmasına yardımcı olur yerel minimumlar ve daha sağlam çözümler bulmaya yardımcı olur. aşırı uyumu önler. Tersine, daha büyük parti boyutları gradyanın daha doğru bir tahminini sağlayarak daha düzgün ve daha kararlı güncellemelere yol açar, ancak önemli ölçüde daha fazla donanım belleği ve bazen modelin "genelleme boşluğu" ile sonuçlanabileceği eğitim verilerinde iyi performans gösterirken, görünmeyen verilerde daha az etkilidir.
Donanım yetenekleri genellikle bu parametrenin üst sınırını belirler. Modern donanım hızlandırıcıları, örneğin ayrıntılı olarak NVIDIA'nın derin öğrenme performans kılavuzu, büyük blokları işlemek için paralel hesaplamaya güveniyor eşzamanlı olarak veri. Bu nedenle, işlemcinin mimarisiyle uyumlu bir yığın boyutu kullanmak - tipik olarak güçler 32, 64 veya 128 gibi ikiye bölünmesi, verimi en üst düzeye çıkarabilir ve her bir eğitim için toplam eğitim süresini azaltabilir. çağ.
Bu parametrenin nasıl ayarlanacağını anlamak, farklı alanlarda etkili yapay zeka çözümleri uygulamak için çok önemlidir. endüstriler.
Kullanırken Ultralytics Python paketi, toplu işin yapılandırılması
boyutu basittir. Bu da batch argümanı, modelin tam olarak kaç görüntüden oluştuğunu belirtmenize olanak tanır
ağırlıkları güncellemeden önce görmelidir. Eğer ayarlanırsa -1kütüphane aynı zamanda bir
AutoBatch özelliği otomatik olarak belirlemek için
donanımınızın destekleyebileceği maksimum parti boyutu.
from ultralytics import YOLO
# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset with a specific batch size
# A batch size of 32 balances speed and memory usage for most standard GPUs
results = model.train(data="coco8.yaml", epochs=50, batch=32)
Uygulayıcılar için "Parti Büyüklüğü" kavramını, aşağıda yer alan benzer terminolojiden ayırt etmek önemlidir derin öğrenme çerçeveleri.
