Knowledge Distillation'ın daha hızlı çıkarım, gelişmiş doğruluk ve uç cihaz dağıtım verimliliği için yapay zeka modellerini nasıl sıkıştırdığını keşfedin.
Bilgi Damıtma, makine öğreniminde (ML) daha büyük, daha karmaşık bir "öğretmen" modelinin performansını yeniden üretmek için kompakt bir "öğrenci" modelinin eğitildiği bir model optimizasyonu ve sıkıştırma tekniğidir. Temel fikir, "bilgiyi" güçlü ancak hantal öğretmen modelinden daha küçük, daha verimli öğrenci modeline aktarmaktır. Bu, uç cihazlar veya cep telefonları gibi kaynak kısıtlı ortamlarda performansta önemli bir düşüş olmadan son derece hassas modellerin kullanılmasına olanak tanır. Bu süreç, devasa, son teknoloji araştırma modelleri ile pratik, gerçek dünya model dağıtımı arasındaki boşluğu doldurmaktadır.
Tipik olarak büyük bir sinir ağı veya model topluluğu olan öğretmen modeli, ilk olarak yüksek doğruluk elde etmek için büyük bir veri kümesi üzerinde eğitilir. Damıtma işlemi sırasında, öğrenci modeli öğretmenin çıktılarını taklit etmeye çalışarak öğrenir. Öğrenci, yalnızca eğitim verilerindeki temel gerçek etiketlerden öğrenmek yerine, öğretmenin her tahmin için genellikle "yumuşak etiketler" olarak adlandırılan tam olasılık dağılımları üzerinde de eğitilir. Bu yumuşak etiketler, öğretmen modelinin nasıl "düşündüğünü" ve genelleme yaptığını ortaya koyduğu için "sert etiketlerden" (doğru cevaplar) daha zengin bilgiler sağlar. Örneğin, bir öğretmen modeli bir kedi görüntüsünün %90 güvenle "kedi" olduğunu tahmin edebilir, ancak aynı zamanda "köpek" (%5) ve "tilki" (%2) için küçük olasılıklar atayabilir. Bu incelikli bilgi, öğrenci modelinin daha etkili bir şekilde öğrenmesine yardımcı olur ve genellikle yalnızca sabit etiketler üzerinde eğitilmiş olmasına kıyasla daha iyi genelleme sağlar. Bu teknik, verimli modeller oluşturmak için derin öğrenme araç setinin önemli bir parçasıdır.
Bilgi Damıtma, güçlü yapay zekayı erişilebilir kılmak için çeşitli alanlarda yaygın olarak kullanılmaktadır.
Bilgi Damıtma, diğer model optimizasyon teknikleriyle ilgilidir ancak bunlardan farklıdır. Farklılıkları anlamak, Ultralytics HUB gibi platformlar aracılığıyla yönetilebilen ve dağıtılabilen projeniz için doğru yaklaşımı seçmenin anahtarıdır.