Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Batch Boyutu

Batch boyutunun derin öğrenme üzerindeki etkisini keşfedin. Eğitim hızını, bellek kullanımını ve model performansını verimli bir şekilde optimize edin.

Toplu iş büyüklüğü, çok önemli bir hiper parametredir. belirleyen makine öğrenimi alanı önce işlenen eğitim verisi örneklerinin sayısı model dahili parametrelerini günceller. Tüm veri setini bir kerede analiz etmek yerine - ki bu genellikle hesaplama açısından hafıza sınırlamaları nedeniyle imkansız-derinöğrenme çerçeveleri verileri yığın adı verilen daha küçük gruplara böler. Bu bölüm, öğrenmenin istikrarını yönetir süreci, hesaplama hızı ve gerekli bellek miktarı GPU eğitim sırasında. Seçmek Doğru parti büyüklüğü, hesaplama verimliliği ile modelin kalitesi arasında dengeleyici bir rol oynar. yakınsama.

Eğitim Dinamikleri Üzerindeki Etkisi

Bir parti büyüklüğünün seçimi, bir partinin nasıl çalışacağını temelden değiştirir. sinir ağı öğrenir. Parti büyüklüğü ayarlandığında daha düşük bir değere ayarlarsa, model model ağırlıklarını daha sık kullanarak gradyan iniş süreci. Bu gürültü şu şekilde olabilir faydalı olur, genellikle optimizasyon algoritmasının kaçmasına yardımcı olur yerel minimumlar ve daha sağlam çözümler bulmaya yardımcı olur. aşırı uyumu önler. Tersine, daha büyük parti boyutları gradyanın daha doğru bir tahminini sağlayarak daha düzgün ve daha kararlı güncellemelere yol açar, ancak önemli ölçüde daha fazla donanım belleği ve bazen modelin "genelleme boşluğu" ile sonuçlanabileceği eğitim verilerinde iyi performans gösterirken, görünmeyen verilerde daha az etkilidir.

Donanım yetenekleri genellikle bu parametrenin üst sınırını belirler. Modern donanım hızlandırıcıları, örneğin ayrıntılı olarak NVIDIA'nın derin öğrenme performans kılavuzu, büyük blokları işlemek için paralel hesaplamaya güveniyor eşzamanlı olarak veri. Bu nedenle, işlemcinin mimarisiyle uyumlu bir yığın boyutu kullanmak - tipik olarak güçler 32, 64 veya 128 gibi ikiye bölünmesi, verimi en üst düzeye çıkarabilir ve her bir eğitim için toplam eğitim süresini azaltabilir. çağ.

Gerçek Dünya Uygulamaları

Bu parametrenin nasıl ayarlanacağını anlamak, farklı alanlarda etkili yapay zeka çözümleri uygulamak için çok önemlidir. endüstriler.

  1. Yüksek Çözünürlüklü Tıbbi Görüntüleme: İçinde Sağlık hizmetlerinde yapay zeka, modeller genellikle aşağıdakilerle görevlendirilir Tümör gibi anomalileri belirlemek için ayrıntılı BT taramalarını veya MRI'ları analiz etmek. Bu görüntülerin dosya boyutu çok büyüktür. Birçoğunu aynı anda işlemeye çalışmak, en güçlü bilgisayarların bile video belleğini (VRAM) aşacaktır. Donanım. Sonuç olarak, uygulayıcılar aşağıdakileri kolaylaştırmak için çok küçük bir parti boyutu (örn. 1 veya 2) kullanmaktadır çökmeden tibbi̇ görüntü anali̇zi̇ Sistem, ham eğitim hızından ziyade yüksek doğruluklu verileri işleme yeteneğine öncelik verir.
  2. Gerçek Zamanlı Üretim Denetimi: Tersine, içinde akıllı üretim ortamlarında hız Kritik. Bir konveyör bant üzerindeki otomatik görsel denetim sistemi, binlerce devre görüntüsü yakalayabilir saat başına pano. Çıkarım aşamasında (üretimdeki kusurların tespit edilmesi), sistemler şunları kullanabilir toplu çıkarım gelen görüntüleri gruplandırır ve paralel olarak işler. Bu, sistem verimini en üst düzeye çıkarır. bilgisayar görüş sistemi, ayak uydurmasını sağlamak hızlı üretim hattı ile.

Ultralytics ile Toplu İş Boyutunu Yapılandırma

Kullanırken Ultralytics Python paketi, toplu işin yapılandırılması boyutu basittir. Bu da batch argümanı, modelin tam olarak kaç görüntüden oluştuğunu belirtmenize olanak tanır ağırlıkları güncellemeden önce görmelidir. Eğer ayarlanırsa -1kütüphane aynı zamanda bir AutoBatch özelliği otomatik olarak belirlemek için donanımınızın destekleyebileceği maksimum parti boyutu.

from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset with a specific batch size
# A batch size of 32 balances speed and memory usage for most standard GPUs
results = model.train(data="coco8.yaml", epochs=50, batch=32)

İlgili Kavramları Ayırt Etme

Uygulayıcılar için "Parti Büyüklüğü" kavramını, aşağıda yer alan benzer terminolojiden ayırt etmek önemlidir derin öğrenme çerçeveleri.

  • Toplu İş Boyutu ve Epok: Bir epok, tüm yığın boyunca bir tam geçişi temsil eder. eğitim veri kümesi. Toplu iş boyutu, aşağıdakilerin nasıl yapılacağını belirler Veriler o tek dönem içinde birçok parçaya bölünür. Örneğin, 1.000 örneğiniz varsa ve bir yığın boyutu 100 olduğunda, bir epoğun tamamlanması 10 iterasyon alacaktır.
  • Toplu İş Boyutu ve Toplu İş Normalizasyonu: Aynı ismi paylaşsalar da, Toplu Normalizasyon belirli bir katmandır Kararlılığı artırmak için katman girdilerini normalleştirmek için kullanılan teknik. Toplu normalleştirmenin etkinliği parti büyüklüğüne bağlıdır (doğru istatistikleri hesaplamak için yeterince büyük bir parti gerektirir), yapısal bir sadece bir eğitim ortamı değil, ağ mimarisinin bir bileşenidir.
  • Eğitim ve Çıkarım Gruplama: Eğitim sırasında amaç ağırlıkları öğrenmektir. Sırasında çıkarımında, gruplama tamamen hız için bir optimizasyondur. gibi gecikmeye duyarlı uygulamalar için otonom araçlar için parti büyüklüğü 1'dir. genellikle anında yanıt almak için kullanılır, oysa veri analitiği görevleri için büyük yığınlar kullanılabilir tarihi video görüntülerini gece boyunca işleyin.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın