Kaynak kısıtlı ortamlarda yüksek doğruluk ve verimlilik sağlayarak, Kuantizasyon Bilinçli Eğitim (QAT) ile uç cihazlar için yapay zeka modellerini optimize edin.
Niceleme Farkındalıklı Eğitim (QAT), bir sinir ağını (NN) daha düşük sayısal hassasiyetle dağıtıma hazırlayan gelişmiş bir model optimizasyon tekniğidir. 32-bit kayan nokta sayıları (FP32) kullanan standart eğitimin aksine, QAT eğitim veya ince ayar işlemi sırasında 8-bit tamsayı (INT8) hesaplamalarının etkilerini simüle eder. Modelin çıkarım sırasında karşılaşacağı niceleme hatalarının "farkında" olmasını sağlayarak, QAT modelin ağırlıklarını doğruluktaki potansiyel kaybı en aza indirecek şekilde ayarlamasına olanak tanır. Bu, kaynak kısıtlı donanımda dağıtım için ideal hale getiren, kompakt, verimli bir modelle sonuçlanır.
QAT süreci tipik olarak önceden eğitilmiş bir FP32 modeliyle başlar. Modelin mimarisine, kayan nokta değerlerini daha düşük hassasiyetli tamsayılara dönüştürme ve geri dönüştürme etkisini taklit eden "sahte" niceleme düğümleri eklenir. Model daha sonra bir eğitim veri kümesi üzerinde yeniden eğitilir. Bu yeniden eğitim aşamasında, model standart geri yayılım yoluyla nicelemeyle ilişkili bilgi kaybına uyum sağlamayı öğrenir. Bu, modelin azaltılmış hassasiyete daha az duyarlı, daha sağlam bir ağırlık kümesi bulmasını sağlar. PyTorch ve TensorFlow gibi önde gelen derin öğrenme çerçeveleri, QAT iş akışlarını uygulamak için güçlü araçlar ve API'ler sunar.
QAT genellikle başka bir yaygın model niceleme yöntemi olan Eğitim Sonrası Niceleme (PTQ) ile karşılaştırılır. Temel fark, nicelemenin ne zaman uygulandığında yatar.
Kuantalama Farkındalıklı Eğitim, verimliliğin önemli olduğu, kaynaklarla kısıtlı ortamlarda gelişmiş AI modellerini dağıtmak için hayati öneme sahiptir.
QAT, model dağıtımı optimizasyonu için çeşitli tekniklerden biridir ve genellikle maksimum verimlilik için diğerleriyle birlikte kullanılır.
Ultralytics, modellerin ONNX, TensorRT ve TFLite gibi çeşitli formatlara aktarılmasını destekler. Bu formatlar, Intel ve NVIDIA gibi şirketlerin çeşitli donanımlarında verimli dağıtım sağlayan QAT iş akışlarıyla uyumludur. QAT ile optimize edilmiş modellerinizi Ultralytics HUB gibi platformları kullanarak yönetebilir ve dağıtabilirsiniz. Doğruluk gereksinimlerinin karşılandığından emin olmak için QAT'den sonra ilgili metrikleri kullanarak model performansını değerlendirmek önemlidir.