Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

Bilgisayar görüşünde budama ve niceleme: Hızlı bir kılavuz

Abirami Vina

5 dakikalık okuma

11 Temmuz 2025

Budama ve nicemlemenin neden bilgisayar görüş modellerini optimize etmek ve uç cihazlarda daha hızlı performans sağlamak için gerekli olduğunu keşfedin.

Gelişen teknolojiyle birlikte uç cihazlar giderek yaygınlaşıyor. Kalp atış hızınızı track eden akıllı saatlerden sokakları izleyen hava dronlarına kadar, uç sistemler verileri cihazın kendi içinde gerçek zamanlı olarak işleyebiliyor. 

Bu yöntem, özellikle plaka tanıma veya hareket takibi gibi kişisel verileri içeren uygulamalar için, verileri buluta göndermekten genellikle daha hızlı ve daha güvenlidir. Bunlar, makinelerin görsel bilgileri yorumlamasını ve anlamasını sağlayan yapay zekanın (AI) bir dalı olan bilgisayarlı görüye örnektir.

Şekil 1. Plaka tanımaya bir örnek. (Kaynak)

Ancak, önemli bir husus, bu tür uygulamaların ağır hesaplamaları kaldırabilen, minimum kaynak kullanan ve bağımsız olarak çalışabilen Görüntü İşleme Yapay Zeka modelleri gerektirmesidir. Çoğu bilgisayarlı görü modeli yüksek performanslı sistemler için geliştirilmiştir, bu da onları doğrudan uç cihazlarda (edge devices) kullanıma daha az uygun hale getirir. 

Bu açığı kapatmak için geliştiriciler genellikle modeli daha küçük donanımlarda verimli bir şekilde çalışacak şekilde uyarlayan hedeflenmiş optimizasyonlar uygular. Bu ayarlamalar, bellek ve işlem gücünün sınırlı olduğu gerçek dünya uç dağıtımları için kritik öneme sahiptir. 

İlginç bir şekilde, bilgisayarla görme modelleri Ultralytics YOLO11 zaten kenar verimliliği göz önünde bulundurularak tasarlanmıştır, bu da onları gerçek zamanlı görevler için harika kılar. Bununla birlikte, budama ve niceleme gibi model optimizasyon teknikleri kullanılarak performansları daha da artırılabilir, böylece kısıtlı cihazlarda daha hızlı çıkarım ve daha düşük kaynak kullanımı sağlanabilir.

Bu makalede, budamanın ve nicelemenin ne olduğuna, nasıl çalıştıklarına ve YOLO modellerinin gerçek dünyadaki uç dağıtımlarda performans göstermesine nasıl yardımcı olabileceklerine daha yakından bakacağız. Hadi başlayalım!

Budama ve niceleme: Model optimizasyonunda temel teknikler

Görsel Yapay Zeka modellerini uç cihazlarda dağıtıma hazırlarken, temel hedeflerden biri performanstan ödün vermeden modeli hafif ve güvenilir hale getirmektir. Bu genellikle, sınırlı bellek, güç veya işlem kapasitesine sahip donanımda verimli bir şekilde çalışabilmesi için modelin boyutunu ve hesaplama taleplerini azaltmayı içerir. Bunu yapmanın iki yaygın yolu budama ve nicelemedir.

Budama, sinir ağlarını daha küçük ve daha verimli hale getirmeye yardımcı olan bir yapay zeka model optimizasyon tekniğidir. Çoğu durumda, bir modelin belirli bağlantılar veya düğümler gibi bazı bölümleri, nihai tahminlerine pek katkıda bulunmaz. Budama, bu daha az önemli parçaları belirleyip kaldırarak çalışır, bu da modelin boyutunu küçültür ve performansını hızlandırır.

Öte yandan, niceleme, bir modelin kullandığı sayıların hassasiyetini azaltan bir optimizasyon tekniğidir. Model, yüksek hassasiyetli 32 bit kayan noktalı sayılara güvenmek yerine, 8 bit tamsayılar gibi daha küçük, daha verimli biçimlere geçer. Bu değişiklik, bellek kullanımını azaltmaya ve modelin tahminler yaptığı süreç olan çıkarımı hızlandırmaya yardımcı olur.

Şekil 2. Budama ve nicelemeye bir bakış. (Kaynak)

Budama ve niceleme nasıl çalışır

Budama (pruning) ve nicemlemenin (quantization) ne olduğunu daha iyi anladığımıza göre, her ikisinin de nasıl çalıştığını inceleyelim. 

Budama, duyarlılık analizi olarak bilinen bir işlem kullanılarak yapılır. Sinir ağı modellerinin, örneğin belirli ağırlıkların, nöronların veya kanalların, nihai çıktı tahminine en az katkıda bulunan kısımlarını belirler. Bu parçalar doğruluk üzerinde minimum etkiyle kaldırılabilir. Budamadan sonra, modelin performansı ince ayar yapmak için genellikle yeniden eğitilir. Bu döngü, boyutu ve doğruluğu arasında doğru dengeyi bulmak için tekrarlanabilir.

Bu sırada, model nicelemesi modelin verileri nasıl işlediğine odaklanır. Modelin işlemesi gereken değer aralığını öğrenmek için örnek veriler üzerinde çalıştığı kalibrasyonla başlar. Bu değerler daha sonra 32 bit kayan noktadan 8 bit tamsayılar gibi daha düşük hassasiyetli biçimlere dönüştürülür.

Şekil 3. Kuantalama, model boyutunu ve karmaşıklığını azaltmaya yardımcı olur. (Kaynak)

Gerçek dünyadaki yapay zeka projelerinde budama ve niceleme kullanımını kolaylaştıran çeşitli araçlar mevcuttur. PyTorch ve TensorFlow gibi çoğu yapay zeka çerçevesi, bu optimizasyon teknikleri için yerleşik destek içerir ve geliştiricilerin bunları doğrudan model dağıtım sürecine entegre etmelerine olanak tanır. 

Bir model optimize edildikten sonra, ONNX Runtime gibi araçlar, sunucular, masaüstü bilgisayarlar ve uç cihazlar gibi çeşitli donanım platformlarında verimli bir şekilde çalıştırılmasına yardımcı olabilir. Ayrıca Ultralytics , YOLO modellerinin nicelleştirmeye uygun formatlarda dışa aktarılmasına olanak tanıyan entegrasyonlar sunarak model boyutunu küçültmeyi ve performansı artırmayı kolaylaştırır.

Ultralytics YOLO model optimizasyonuna genel bir bakış

YOLO11 gibi Ultralytics YOLO11 modelleri, hızlı, tek adımda nesne algılama özellikleriyle tanınır ve bu da onları gerçek zamanlı Vision AI görevleri için ideal hale getirir. Zaten uç dağıtım için yeterince hafif ve verimli olacak şekilde tasarlanmışlardır. Ancak, konvolüsyonel katmanlar olarak adlandırılan görsel özelliklerin işlenmesinden sorumlu katmanlar, çıkarım sırasında hala önemli miktarda bilgi işlem gücü gerektirebilir.

Şunu merak edebilirsiniz: YOLO11 zaten edge kullanımı için optimize edilmişse, neden daha fazla optimizasyona ihtiyaç duyuyor? Basitçe söylemek gerekirse, tüm uç cihazlar aynı değildir. Bazıları, standart bir LED ampulden daha az güç tüketen küçük gömülü işlemciler gibi çok az donanımla çalışır. 

Bu durumlarda, YOLO11 gibi basitleştirilmiş bir model bile sorunsuz ve güvenilir bir performans sağlamak için ek optimizasyona ihtiyaç duyar. Budama ve niceleme gibi teknikler, doğruluğu önemli ölçüde etkilemeden modelin boyutunu azaltmaya ve çıkarımı hızlandırmaya yardımcı olarak bu tür kısıtlı ortamlar için idealdir.

Bu optimizasyon tekniklerinin uygulanmasını kolaylaştırmak için Ultralytics , YOLO modellerini ONNX, TensorRT, OpenVINO, CoreML ve PaddlePaddle gibi birden fazla formata aktarmak için kullanılabilecek çeşitli entegrasyonları destekler. Her format, belirli donanım türleri ve dağıtım ortamlarıyla iyi çalışacak şekilde tasarlanmıştır. 

Örneğin ONNX , çok çeşitli araç ve platformlarla uyumluluğu nedeniyle niceleme iş akışlarında sıklıkla kullanılır. Öte yandan TensorRT, NVIDIA cihazları için son derece optimize edilmiştir ve INT8 kullanarak düşük hassasiyetli çıkarımı destekler, bu da onu uç GPU'larda yüksek hızlı dağıtım için ideal hale getirir.

Ultralytics YOLO model optimizasyonunun etkili kullanım örnekleri

Bilgisayarlı görü çeşitli gerçek dünya uygulamalarına doğru genişlemeye devam ederken, optimize edilmiş YOLO modelleri nesne algılama, örnek segmentasyonu ve nesne takibi gibi görevlerin daha küçük ve daha hızlı donanımlarda çalıştırılmasını mümkün kılmaktadır. Daha sonra, budama ve nicelemenin bu bilgisayarla görme görevlerini daha verimli ve pratik hale getirdiği birkaç kullanım örneğini tartışalım.

YOLO11 tarafından yönlendirilen akıllı gözetim

Birçok endüstriyel alanın yanı sıra kamusal alanlar da güvenli ve emniyetli kalmak için gerçek zamanlı izlemeye ihtiyaç duyar. Transit istasyonları, üretim sahaları ve büyük açık hava tesisleri gibi yerler, insanları veya araçları hızlı ve doğru bir şekilde detect edebilen Vision AI sistemlerine ihtiyaç duyar. Genellikle, bu yerler sınırlı bağlantı ve donanım kısıtlamaları ile çalışır, bu da büyük modellerin dağıtımını zorlaştırır.

Bu gibi durumlarda, YOLO11 gibi optimize edilmiş bir Vision AI modeli harika bir çözümdür. Kompakt boyutu ve hızlı performansı, gömülü kameralar veya akıllı sensörler gibi düşük güçlü uç cihazlarda çalışmak için mükemmeldir. Bu modeller görsel verileri doğrudan cihaz üzerinde işleyerek güvenlik ihlallerinin, yetkisiz erişimin veya anormal faaliyetlerin sürekli bulut erişimine ihtiyaç duymadan gerçek zamanlı olarak tespit edilmesini sağlar.

Şekil 4. YOLO11 , metro istasyonları gibi halka açık yerleri izlemek için kullanılabilir.

YOLO11 ile inşaat sahalarında güvenliği artırma

Şantiyeler, ağır makineler, hareketli işçiler ve sürekli aktivite ile dolu, hızlı tempolu ve öngörülemeyen ortamlardır. Koşullar, değişen programlar, ekipman hareketi ve hatta ani hava değişiklikleri nedeniyle hızla değişebilir. Böylesine dinamik bir ortamda, işçi güvenliği sürekli bir zorluk gibi gelebilir.

Gerçek zamanlı izleme çok önemli bir rol oynamaktadır, ancak geleneksel sistemler genellikle bulut erişimine veya sahada pratik olmayabilecek pahalı donanımlara dayanmaktadır. İşte bu noktada YOLO11 gibi modeller etkili olabilir. YOLO11 , internet bağlantısına ihtiyaç duymadan doğrudan sahada çalışan küçük, verimli uç cihazlarda çalışacak şekilde optimize edilebilir.

Örneğin, birkaç dönüme yayılan bir otoyol genişletmesi gibi büyük bir inşaat sahasını düşünün. Bu tür bir ortamda, her aracı veya ekipman parçasını manuel olarak takip etmek zor ve zaman alıcı olabilir. Bir kamera ve optimize edilmiş bir YOLO11 modeliyle donatılmış bir drone, araçları otomatik olarak algılayıp takip ederek, trafik akışını izleyerek ve yetkisiz erişim veya güvenli olmayan sürüş davranışı gibi güvenlik sorunlarını belirleyerek yardımcı olabilir.

Şekil 5. Bir inşaat sahasından alınan drone görüntülerinin analizi.

Bilgisayarlı görmede budama ve nicelemenin artıları ve eksileri

İşte budama ve niceleme gibi bilgisayar görüşü modeli optimizasyon yöntemlerinin sunduğu bazı temel avantajlar:

  • Uygun maliyetli dağıtım: Daha küçük ve daha verimli modeller, pahalı, üst düzey donanımlara olan ihtiyacı azaltabilir ve yapay zekayı farklı kullanım alanlarında daha erişilebilir ve ölçeklenebilir hale getirebilir.

  • Daha düşük gecikme süresi: Model mimarisini basitleştirerek ve hesaplama yükünü azaltarak, bu teknikler gerçek zamanlı uygulamalarda daha hızlı yanıt süreleri elde etmeye yardımcı olabilir.

  • Enerji verimliliği: Hesaplama yükünü azaltmak aynı zamanda güç tüketimini de düşürür, bu da özellikle pille çalışan veya mobil sistemler için faydalıdır.

Budama ve niceleme birçok avantaj sunarken, geliştiricilerin modelleri optimize ederken dikkate alması gereken belirli ödünleşimlerle birlikte gelir. İşte akılda tutulması gereken bazı sınırlamalar:

  • Doğruluk ödünleşimler: Budama çok agresif olursa veya çok düşük bit niceleme kullanılırsa, modelin mAP gibi metriklerle ölçülen doğruluğu düşebilir.

  • Donanım kısıtlamaları: Tüm cihazlar, INT8 gibi düşük hassasiyetli formatları eşit derecede iyi desteklemez. Bu, optimize edilmiş bir modelin nerede ve nasıl dağıtılabileceğini kısıtlayabilir.

  • Uygulama karmaşıklığı: İyi sonuçlar elde etmek genellikle dikkatli, modele özgü ayarlama gerektirir. Geliştiricilerin, verimliliği artırırken performansı korumak için modeli yeniden eğitmeleri ve kapsamlı testler yapmaları gerekebilir.

Önemli çıkarımlar

Budama ve niceleme, YOLO modellerinin uç cihazlarda daha iyi performans göstermesine yardımcı olan faydalı tekniklerdir. Modelin boyutunu küçültür, hesaplama ihtiyaçlarını azaltır ve tahminleri hızlandırırlar, üstelik bunların hepsi doğrulukta gözle görülür bir kayıp olmadan gerçekleşir.

Bu optimizasyon yöntemleri ayrıca, geliştiricilere modelleri tamamen yeniden oluşturmaya gerek kalmadan farklı donanım türleri için ayarlama esnekliği sağlar. Birkaç ince ayar ve testle, Vision AI'yı gerçek dünya durumlarında uygulamak daha kolay hale gelir.

Büyüyen topluluğumuza katılın! AI hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfedin. Bilgisayarlı görü projelerinize başlamaya hazır mısınız? Lisanslama seçeneklerimize göz atın. Çözüm sayfalarımızı ziyaret ederek tarımda AI ve sağlık hizmetlerinde Vision AI'yı keşfedin! 

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın