Bilgisayarla görmede budama ve niceleme: Hızlı bir rehber

Abirami Vina

5 dakika okuma

11 Temmuz 2025

Bilgisayarla görme modellerini optimize etmek ve uç cihazlarda daha hızlı performans sağlamak için budama ve niceleme işlemlerinin neden gerekli olduğunu keşfedin.

Gelişen teknolojiyle birlikte uç cihazlar giderek yaygınlaşıyor. Kalp atış hızınızı takip eden akıllı saatlerden sokakları izleyen hava dronlarına kadar, uç sistemler verileri cihazın kendi içinde gerçek zamanlı olarak işleyebiliyor. 

Bu yöntem, özellikle plaka tespiti veya hareket takibi gibi kişisel verileri içeren uygulamalar için genellikle buluta veri göndermekten daha hızlı ve daha güvenlidir. Bunlar, makinelerin görsel bilgileri yorumlamasını ve anlamasını sağlayan bir yapay zeka (AI) dalı olan bilgisayarla görmenin örnekleridir.

Şekil 1. Plaka tespitine bir örnek.(Kaynak)

Bununla birlikte, bu tür uygulamaların ağır hesaplama işlemlerini gerçekleştirebilen, minimum kaynak kullanabilen ve bağımsız olarak çalışabilen Görme Yapay Zeka modellerine ihtiyaç duyması önemli bir husustur. Çoğu bilgisayarla görme modeli yüksek performanslı sistemler için geliştirilmiştir, bu da onları uç cihazlara doğrudan dağıtım için daha az uygun hale getirir. 

Geliştiriciler bu açığı kapatmak için genellikle modeli daha küçük donanımlarda verimli çalışacak şekilde uyarlayan hedefli optimizasyonlar uygular. Bu ayarlamalar, bellek ve işlem gücünün sınırlı olduğu gerçek dünya uç dağıtımları için kritik öneme sahiptir. 

İlginç bir şekilde, Ultralytics YOLO11 gibi bilgisayarla görme modelleri zaten kenar verimliliği göz önünde bulundurularak tasarlanmıştır, bu da onları gerçek zamanlı görevler için harika kılar. Bununla birlikte, budama ve niceleme gibi model optimizasyon teknikleri kullanılarak performansları daha da artırılabilir, böylece kısıtlı cihazlarda daha hızlı çıkarım ve daha düşük kaynak kullanımı sağlanabilir.

Bu makalede, budamanın ve nicelemenin ne olduğuna, nasıl çalıştıklarına ve YOLO modellerinin gerçek dünyadaki uç dağıtımlarda performans göstermesine nasıl yardımcı olabileceklerine daha yakından bakacağız. Hadi başlayalım!

Budama ve niceleme: Model optimizasyonunda temel teknikler

Uç cihazlarda dağıtım için Vision AI modellerini hazırlarken, temel hedeflerden biri performanstan ödün vermeden modeli hafif ve güvenilir hale getirmektir. Bu genellikle modelin boyutunu ve hesaplama taleplerini azaltmayı içerir, böylece sınırlı bellek, güç veya işlem kapasitesine sahip donanımlarda verimli bir şekilde çalışabilir. Bunu yapmanın iki yaygın yolu budama ve nicelleştirmedir.

Budama, sinir ağlarını daha küçük ve daha verimli hale getirmeye yardımcı olan bir yapay zeka model optimizasyon tekniğidir. Çoğu durumda, bir modelin belirli bağlantılar veya düğümler gibi bölümleri, nihai tahminlerine fazla katkıda bulunmaz. Budama, bu daha az önemli parçaları belirleyip kaldırarak çalışır, bu da modelin boyutunu azaltır ve performansını hızlandırır.

Öte yandan niceleme, bir modelin kullandığı sayıların hassasiyetini azaltan bir optimizasyon tekniğidir. Model, yüksek hassasiyetli 32 bit kayan noktalı sayılara güvenmek yerine 8 bit tamsayılar gibi daha küçük, daha verimli formatlara geçer. Bu değişiklik bellek kullanımını azaltmaya yardımcı olur ve modelin tahminler yaptığı süreç olan çıkarımı hızlandırır.

Şekil 2. Budama ve niceleme işlemlerine bir bakış.(Kaynak)

Budama ve niceleme nasıl çalışır?

Budama ve nicelemenin ne olduğunu daha iyi anladığımıza göre, şimdi her ikisinin de nasıl çalıştığını inceleyelim. 

Budama, duyarlılık analizi olarak bilinen bir süreç kullanılarak yapılır. Belirli ağırlıklar, nöronlar veya kanallar gibi sinir ağı modellerinin hangi bölümlerinin nihai çıktı tahminine en az katkıda bulunduğunu belirler. Bu parçalar doğruluk üzerinde minimum etkiyle çıkarılabilir. Budamadan sonra, model genellikle performansına ince ayar yapmak için yeniden eğitilir. Bu döngü, boyut ve doğruluk arasında doğru dengeyi bulmak için tekrarlanabilir.

Bu arada, model nicelleştirme modelin verileri nasıl işlediğine odaklanır. Modelin işlemesi gereken değer aralığını öğrenmek için örnek veriler üzerinde çalıştığı kalibrasyon ile başlar. Bu değerler daha sonra 32 bit kayan noktadan 8 bit tam sayılar gibi daha düşük hassasiyetli formatlara dönüştürülür.

Şekil 3. Niceleme, model boyutunu ve karmaşıklığını azaltmaya yardımcı olur.(Kaynak)

Gerçek dünyadaki yapay zeka projelerinde budama ve niceleme kullanımını kolaylaştıran çeşitli araçlar mevcuttur. PyTorch ve TensorFlow gibi çoğu yapay zeka çerçevesi, bu optimizasyon teknikleri için yerleşik destek içerir ve geliştiricilerin bunları doğrudan model dağıtım sürecine entegre etmelerine olanak tanır. 

Bir model optimize edildikten sonra, ONNX Runtime gibi araçlar, sunucular, masaüstü bilgisayarlar ve uç cihazlar gibi çeşitli donanım platformlarında verimli bir şekilde çalıştırılmasına yardımcı olabilir. Ayrıca Ultralytics, YOLO modellerinin nicelleştirmeye uygun formatlarda dışa aktarılmasına olanak tanıyan entegrasyonlar sunarak model boyutunu küçültmeyi ve performansı artırmayı kolaylaştırır.

Ultralytics YOLO model optimizasyonuna genel bir bakış

YOLO11 gibi Ultralytics YOLO modelleri, hızlı, tek adımda nesne algılama özellikleriyle tanınır ve bu da onları gerçek zamanlı Vision AI görevleri için ideal hale getirir. Zaten uç dağıtım için yeterince hafif ve verimli olacak şekilde tasarlanmışlardır. Ancak, konvolüsyonel katmanlar olarak adlandırılan görsel özelliklerin işlenmesinden sorumlu katmanlar, çıkarım sırasında hala önemli miktarda bilgi işlem gücü gerektirebilir.

Şunu merak edebilirsiniz: YOLO11 zaten edge kullanımı için optimize edilmişse, neden daha fazla optimizasyona ihtiyaç duyuyor? Basitçe söylemek gerekirse, tüm uç cihazlar aynı değildir. Bazıları, standart bir LED ampulden daha az güç tüketen küçük gömülü işlemciler gibi çok az donanımla çalışır. 

Bu durumlarda, YOLO11 gibi basitleştirilmiş bir model bile sorunsuz ve güvenilir bir performans sağlamak için ek optimizasyona ihtiyaç duyar. Budama ve niceleme gibi teknikler, doğruluğu önemli ölçüde etkilemeden modelin boyutunu azaltmaya ve çıkarımı hızlandırmaya yardımcı olarak bu tür kısıtlı ortamlar için idealdir.

Bu optimizasyon tekniklerinin uygulanmasını kolaylaştırmak için Ultralytics, YOLO modellerini ONNX, TensorRT, OpenVINO, CoreML ve PaddlePaddle gibi birden fazla formata aktarmak için kullanılabilecek çeşitli entegrasyonları destekler. Her format, belirli donanım türleri ve dağıtım ortamlarıyla iyi çalışacak şekilde tasarlanmıştır. 

Örneğin ONNX, çok çeşitli araç ve platformlarla uyumluluğu nedeniyle niceleme iş akışlarında sıklıkla kullanılır. Öte yandan TensorRT, NVIDIA cihazları için son derece optimize edilmiştir ve INT8 kullanarak düşük hassasiyetli çıkarımı destekler, bu da onu uç GPU'larda yüksek hızlı dağıtım için ideal hale getirir.

Ultralytics YOLO model optimizasyonunun etkili kullanım örnekleri

Bilgisayarlı görü çeşitli gerçek dünya uygulamalarına doğru genişlemeye devam ederken, optimize edilmiş YOLO modelleri nesne algılama, örnek segmentasyonu ve nesne takibi gibi görevlerin daha küçük ve daha hızlı donanımlarda çalıştırılmasını mümkün kılmaktadır. Şimdi, budama ve nicelemenin bu bilgisayarla görme görevlerini daha verimli ve pratik hale getirdiği birkaç kullanım durumunu tartışalım.

YOLO11 tarafından yönlendirilen akıllı gözetim

Birçok endüstriyel alanın yanı sıra kamusal alanlar da güvenli ve emniyetli kalmak için gerçek zamanlı izlemeye ihtiyaç duyar. Transit istasyonları, üretim sahaları ve büyük açık hava tesisleri gibi yerler, insanları veya araçları hızlı ve doğru bir şekilde tespit edebilen Vision AI sistemlerine ihtiyaç duyar. Genellikle, bu yerler sınırlı bağlantı ve donanım kısıtlamaları ile çalışır, bu da büyük modellerin dağıtımını zorlaştırır.

Bu gibi durumlarda, YOLO11 gibi optimize edilmiş bir Vision AI modeli harika bir çözümdür. Kompakt boyutu ve hızlı performansı, gömülü kameralar veya akıllı sensörler gibi düşük güçlü uç cihazlarda çalışmak için mükemmeldir. Bu modeller görsel verileri doğrudan cihaz üzerinde işleyerek güvenlik ihlallerinin, yetkisiz erişimin veya anormal faaliyetlerin sürekli bulut erişimine ihtiyaç duymadan gerçek zamanlı olarak tespit edilmesini sağlar.

Şekil 4. YOLO11, metro istasyonları gibi halka açık yerleri izlemek için kullanılabilir.

YOLO11 ile inşaat sahalarında güvenliği artırma

Şantiyeler, ağır makineler, hareketli işçiler ve sürekli faaliyetle dolu, hızlı tempolu ve öngörülemez ortamlardır. Değişen programlar, ekipman hareketleri ve hatta hava koşullarındaki ani değişiklikler nedeniyle koşullar hızla değişebilir. Böylesine dinamik bir ortamda, işçi güvenliği sürekli bir zorluk gibi hissedilebilir.

Gerçek zamanlı izleme çok önemli bir rol oynamaktadır, ancak geleneksel sistemler genellikle bulut erişimine veya sahada pratik olmayabilecek pahalı donanımlara dayanmaktadır. İşte bu noktada YOLO11 gibi modeller etkili olabilir. YOLO11, internet bağlantısına ihtiyaç duymadan doğrudan sahada çalışan küçük, verimli uç cihazlarda çalışacak şekilde optimize edilebilir.

Örneğin, birkaç dönüme yayılan bir otoyol genişletmesi gibi büyük bir inşaat sahasını düşünün. Bu tür bir ortamda, her aracı veya ekipman parçasını manuel olarak takip etmek zor ve zaman alıcı olabilir. Bir kamera ve optimize edilmiş bir YOLO11 modeliyle donatılmış bir drone, araçları otomatik olarak algılayıp takip ederek, trafik akışını izleyerek ve yetkisiz erişim veya güvenli olmayan sürüş davranışı gibi güvenlik sorunlarını belirleyerek yardımcı olabilir.

Şekil 5. Bir inşaat alanından drone görüntülerinin analizi.(Kaynak)

Bilgisayarla görmede budama ve niceleme işlemlerinin artıları ve eksileri

Budama ve niceleme gibi bilgisayarla görme modeli optimizasyon yöntemlerinin sunduğu bazı temel avantajlar şunlardır:

  • Uygun maliyetli dağıtım: Daha küçük ve daha verimli modeller pahalı, üst düzey donanım ihtiyacını azaltarak yapay zekayı farklı kullanım durumlarında daha erişilebilir ve ölçeklenebilir hale getirebilir.

  • Daha düşük gecikme süresi: Model mimarisini basitleştirerek ve hesaplama yükünü azaltarak, bu teknikler gerçek zamanlı uygulamalarda daha hızlı yanıt süreleri elde edilmesine yardımcı olabilir.

  • Enerji verimliliği: Hesaplama yükünün azaltılması güç tüketimini de azaltır, bu da özellikle pille çalışan veya mobil sistemler için yararlıdır.

Budama ve niceleme birçok avantaj sunarken, geliştiricilerin modelleri optimize ederken göz önünde bulundurmaları gereken bazı ödünleşimler de vardır. İşte akılda tutulması gereken bazı sınırlamalar:

  • Doğruluk ödünleşimler: Budama çok agresif olursa veya çok düşük bit niceleme kullanılırsa, modelin mAP gibi metriklerle ölçülen doğruluğu düşebilir.

  • Donanım kısıtlamaları: Tüm cihazlar INT8 gibi düşük hassasiyetli formatları eşit derecede desteklemez. Bu durum, optimize edilmiş bir modelin nerede ve nasıl kullanılabileceğini kısıtlayabilir.

  • Uygulama karmaşıklığı: İyi sonuçlar elde etmek genellikle dikkatli, modele özgü ayarlama gerektirir. Geliştiricilerin verimliliği artırırken performansı korumak için modeli yeniden eğitmeleri ve kapsamlı testler yapmaları gerekebilir.

Önemli çıkarımlar

Budama ve niceleme, YOLO modellerinin uç cihazlarda daha iyi performans göstermesine yardımcı olan faydalı tekniklerdir. Modelin boyutunu küçültür, hesaplama ihtiyaçlarını azaltır ve tahminleri hızlandırırlar, üstelik bunların hepsi doğrulukta gözle görülür bir kayıp olmadan gerçekleşir.

Bu optimizasyon yöntemleri, geliştiricilere modelleri tamamen yeniden oluşturmaya gerek kalmadan farklı donanım türleri için ayarlama esnekliği de sağlar. Biraz ayarlama ve test ile Vision AI'yı gerçek dünyadaki durumlara uygulamak daha kolay hale gelir.

Büyüyen topluluğumuza katılın! Yapay zeka hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfedin. Bilgisayarla görme projelerinize başlamaya hazır mısınız? Lisanslama seçeneklerimize göz atın. Çözüm sayfalarımızı ziyaret ederek tarımda yapay zekayı ve sağlık hizmetlerinde yapay zekayı keşfedin! 

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Panoya kopyalanan bağlantı