Uzun Kısa Süreli Bellek (LSTM) ağlarının sıralı verileri işlemede, RNN sınırlamalarının üstesinden gelmede ve NLP ve tahmin gibi yapay zeka görevlerini güçlendirmede nasıl üstün olduğunu keşfedin.
Uzun Kısa Süreli Bellek (LSTM), geleneksel RNN 'lerin uzun menzilli bağımlılıkları öğrenmedeki sınırlamalarının üstesinden gelmek için tasarlanmış özel bir Tekrarlayan Sinir Ağı (RNN ) mimarisi türüdür. Sepp Hochreiter ve Jürgen Schmidhuber tarafından 1997 yılında tanıtılan LSTM'ler, dizinin önceki kısımlarındaki bağlamın sonraki kısımları anlamak için çok önemli olduğu metin, konuşma ve zaman serileri gibi veri dizilerini işlemede özellikle etkilidir. Bu özellik, onları çeşitli Derin Öğrenme (DL) uygulamalarında bir köşe taşı teknolojisi haline getirmektedir.
Geleneksel RNN'ler, bir dizideki erken adımlardan gelen bilgilerin ağ boyunca yayıldıkça kaybolduğu ve uzun aralıklarla bağımlılıkları öğrenmeyi zorlaştırdığı kaybolan gradyan problemiyle mücadele eder. LSTM'ler bu sorunu bellek hücreleri ve kapıları içeren benzersiz bir yapı kullanarak çözer.
Çekirdek bileşen, bir taşıma bandı gibi hareket eden ve bilginin ağ boyunca nispeten değişmeden akmasını sağlayan bellek hücresidir. LSTM'ler bellek hücresinde depolanan bilgileri düzenlemek için üç ana "kapı" kullanır:
Sigmoid ve tanh gibi aktivasyon fonksiyonları kullanılarak uygulanan bu kapılar, her zaman adımında hangi bilgilerin saklanması veya atılmasının önemli olduğunu öğrenerek ağın uzun diziler boyunca ilgili bağlamı korumasını sağlar.
LSTM'ler, dizi modelleme gerektiren çok sayıda alanda başarıyla uygulanmıştır:
Güçlü olmakla birlikte, LSTM'ler daha geniş bir dizi modelleri ailesinin bir parçasıdır:
LSTM'ler, aşağıdaki gibi popüler derin öğrenme çerçeveleri kullanılarak kolayca uygulanabilir PyTorch ( PyTorch LSTM belgelerine bakınız) ve TensorFlow ( TensorFlow LSTM belgelerine bakın). Ultralytics öncelikle Bilgisayarla Görme (CV) modellerine odaklanırken Ultralytics YOLONesne algılama ve örnek segmentasyonu gibi görevler için, özellikle araştırmalar video anlama veya resim altyazısı gibi görevler için NLP ve CV arasında köprü kurmayı araştırdıkça, dizi modellerini anlamak değerlidir. Ultralytics belgelerinde çeşitli makine öğrenimi modellerini ve kavramlarını daha fazla keşfedebilirsiniz. Çeşitli modellerin eğitimini ve dağıtımını yönetmek, Ultralytics HUB gibi platformlar kullanılarak kolaylaştırılabilir. Hochreiter ve Schmidhuber 'in temel LSTM makalesi orijinal teknik ayrıntıları sağlar. DeepLearning.AI gibi kaynaklar, LSTM'ler de dahil olmak üzere dizi modellerini kapsayan kurslar sunar.