Sürekli gruplandırmanın GPU nasıl optimize ettiğini ve gecikmeyi nasıl azalttığını öğrenin. Üretim ML görevlerinde verimliliği en üst düzeye çıkarmak için Ultralytics nasıl kullanacağınızı keşfedin.
Sürekli toplama, donanım kullanımını ve verimi en üst düzeye çıkarmak için makine öğreniminde (ML) kullanılan gelişmiş bir zamanlama ve çıkarım optimizasyon tekniğidir. Geleneksel statik toplama yönteminde, çıkarım motoru önceden belirlenmiş sayıda isteğin birikmesini bekler ve ardından bunları aynı anda işler. Bu durum, sistemin kaynakları serbest bırakmak için toplamadaki en uzun süren isteğin bitmesini beklemesi gerektiğinden genellikle verimsizliğe yol açar. Dinamik veya yineleme düzeyinde toplama olarak da bilinen sürekli toplama, aktif bir istek tamamlanır tamamlanmaz yeni istekleri hesaplama toplama işlemine ekleyerek bu sorunu çözer, böylece GPU'larda bekleme süresini önemli ölçüde azaltır ve genel verimliliği artırır. .
Model dağıtımı sırasında verilerin nasıl işlendiğini daha iyi anlamak için, sürekli toplama işlemini sözlükteki diğer ilgili terimlerden ayırmak yararlıdır:
Sürekli gruplama, yüksek hacimli öngörülemeyen talepleri işleyen üretim sistemleri için çok önemlidir. İşte uygulamasının iki somut örneği:
Yüksek trafikli model dağıtım uygulamalarını yönetirken, akış çıkarımlarını yinelemeli olarak simüle etmek, belleğin engellenmek yerine aşamalı olarak boşaltılmasını sağlayarak dinamik toplu işleme avantajlarını simüle edebilir. Aşağıdaki Python , sürekli bir görüntü akışını verimli bir şekilde işlemek için model tahmin API'si ile jeneratör desenini nasıl kullanacağınızı gösterir .
from ultralytics import YOLO
# Load the latest Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Using stream=True acts as a generator, iteratively processing inputs
# to keep memory usage low and throughput high
results = model.predict(source=["img1.jpg", "img2.jpg", "img3.jpg"], stream=True)
# Process each result as soon as it completes
for result in results:
print(f"Detected {len(result.boxes)} objects in this frame.")
Sistem düzeyinde kaynak planlamasını yönetmek, ham hız ile işletme maliyeti arasında bir denge gerektirir. Büyük ölçekli bilgisayar görme (CV) ve dil modelleri uygulayan ekipler, bu dinamik grupları yönetmek için giderek daha fazla gelişmiş hizmet çerçevelerine güvenmektedir. Altyapılarını kolaylaştırmak isteyen kurumsal ekipler için Ultralytics , modelleri son derece optimize edilmiş üretim ortamlarına eğitmek, izlemek ve aktarmak için sağlam araçlar sunar.