Bilgi Damıtımının daha hızlı çıkarım, gelişmiş doğruluk ve uç cihaz dağıtım verimliliği için AI modellerini nasıl sıkıştırdığını keşfedin.
Bilgi Damıtma sofistike bir yöntemdir model optimizasyon stratejisi kompakt bir makine öğrenimi "öğrenci" modeli daha büyük, daha karmaşık bir modelin performansını ve davranışını yeniden üretmek üzere eğitilir "öğretmen" modeli. Öncelikli hedef, genelleme yeteneklerini ve "bilgiyi" aktarmaktır. ağır öğretmen ağından daha hafif öğrenci ağına. Bu süreç, yüksek doğruluk oranına sahip gibi kaynak kısıtlı donanımlar üzerindeki modeller zarar görmeden uç bilişim cihazları Genellikle daha küçük mimarilere eşlik eden doğrulukta önemli düşüşler. Bilgileri sıkıştırarak, geliştiriciler daha hızlı çıkarım gecikmesi ve daha düşük Güçlü tahmin gücünü korurken bellek kullanımı.
Süreç "yumuşak etiket" kavramına dayanmaktadır. Standart olarak denetimli öğrenme, modeller aşağıdakiler üzerinde eğitilir Eğitim verilerinden "zor etiketler" (örn, bir görüntü %100 "kedi" ve %0 "köpek "tir). Ancak, önceden eğitilmiş bir öğretmen modeli şunları üretir tüm sınıflar arasında yumuşak etiketler olarak bilinen olasılık dağılımları. Örneğin, öğretmen bir görüntüyü tahmin edebilir 90 kedi, %9 köpek ve %1 arabadır. Bu yumuşak etiketler, kediler ve köpekler arasındaki ilişkiler hakkında zengin bilgiler içerir. sınıfları- belirli bir kedinin bir şekilde köpeğe benzediğini gösterir.
Damıtma sırasında öğrenci modeli, tahminleri ile öğretmenin tahminleri arasındaki farkı en aza indirecek şekilde eğitilir. yumuşak etiketler, genellikle belirli bir Kullback-Leibler sapması gibi kayıp fonksiyonları. Bu öğrencinin "karanlık bilgiyi" veya öğretmenin sahip olduğu verilerin nüanslı yapısını öğrenmesini sağlar zaten keşfedilmiştir. Temel bir anlayış için, araştırmacılar genellikle aşağıdakilere başvurur Geoffrey Hinton'ın konuyla ilgili ufuk açıcı makalesi.
Kütüphaneler genellikle karmaşık kayıp hesaplamalarını dahili olarak ele alırken, eğitim için bir öğrenci modelinin başlatılması
ilk pratik adımdır. Hafif bir öğrenci modelini şu şekilde yükleyebilirsiniz
YOLO11 kullanarak ultralytics Paket:
from ultralytics import YOLO
# Load a lightweight student model (YOLO11n)
# 'n' stands for nano, the smallest and fastest version
student_model = YOLO("yolo11n.pt")
# Train the student model on a dataset
# In a distillation workflow, this training would be guided by a teacher model's outputs
results = student_model.train(data="coco8.yaml", epochs=5, imgsz=640)
Bilgi Damıtma, verimliliğin doğruluk kadar kritik olduğu sektörlerde çok önemlidir.
Bilgi Damıtmayı, model verimliliğini artırmak için kullanılan diğer tekniklerden ayırmak önemlidir, çünkü farklı prensiplere göre çalışırlar.
Bu teknikleri birleştirerek - örneğin, bir öğretmeni bir öğrenciye damıtarak, ardından niceleme uygulayarak - geliştiriciler gömülü sistemlerde performansı en üst düzeye çıkarabilir.

.webp)