Sözlük

Bağlam Penceresi

Bağlam pencerelerinin NLP, zaman serisi analizi ve görüntü yapay zekasında yapay zeka/ML modellerini nasıl geliştirdiğini, tahminleri ve doğruluğu nasıl artırdığını keşfedin.

Bağlam penceresi, makine öğreniminde (ML) bir modelin sıralı verileri işlerken tek seferde dikkate alabileceği sabit bilgi miktarını ifade eden temel bir kavramdır. Bunu modelin kısa süreli hafızası olarak düşünün. Veriler ister metin, ister bir dizi hisse senedi fiyatı veya bir videodaki kareler olsun, bağlam penceresi modelin mevcut girdiyi anlamak ve doğru bir tahmin yapmak için yakın geçmişin ne kadarını "görebileceğini" tanımlar. Bu mekanizma, Doğal Dil İşleme (NLP) ve zaman serisi analizi gibi bağlamın yorumlamanın anahtarı olduğu görevler için çok önemlidir.

Bağlam Penceresi Nasıl Çalışır?

Tekrarlayan Sinir Ağları (RNN' ler) ve özellikle Transformatörler gibi verileri sıralı olarak işleyen modeller bir bağlam penceresine dayanır. Bir model bir veri parçasını sırayla analiz ettiğinde, sadece o tek veri noktasına tek başına bakmaz. Bunun yerine, veri noktasına önceki belirli sayıda veri noktasıyla birlikte bakar; bu nokta grubu bağlam penceresidir. Örneğin, bir dil modelinde, bir cümledeki bir sonraki kelimeyi tahmin etmek için model son birkaç kelimeye bakacaktır. Dikkate aldığı kelime sayısı, bağlam penceresi boyutuna göre belirlenir. Bu, modelin sıralı bilgileri anlamlandırmak için gerekli olan bağımlılıkları ve kalıpları yakalamasına yardımcı olur. Dil modellerinin nasıl çalıştığına dair genel bir bakış LLM'lere giriş bölümünde bulunabilir.

Gerçek Dünyadaki AI/ML Uygulamalarında Bağlam Penceresi Örnekleri

Bağlam penceresi kavramı birçok yapay zeka uygulamasının ayrılmaz bir parçasıdır:

  • Sohbet Robotları ve Sanal Asistanlar: Modern sohbet robotları, konuşma geçmişini korumak için bağlam pencerelerini kullanır. Bu, takip eden soruları anlamalarına, önceki noktalara geri dönmelerine ve tekrarlayan veya alakasız yanıtlardan kaçınarak daha doğal, tutarlı etkileşimler sağlamalarına olanak tanır. Google'ın Gemini 'si gibi modeller, sofistike diyaloglar için büyük bağlam pencerelerinden yararlanıyor.
  • Finansal Tahmin için Zaman Serisi Analizi: Finansal modeller, gelecekteki piyasa hareketlerini tahmin etmek için tanımlanmış bir bağlam penceresi içinde geçmiş hisse senedi fiyatları, ekonomik göstergeler veya işlem hacimleri dizilerini analiz eder. Pencere boyutu, geçmiş verilerin tahmini ne kadar etkilediğini belirler. Finans alanındaki yapay zeka genellikle dikkatlice ayarlanmış bağlam pencerelerine dayanır.
  • Tahmine Dayalı Metin Algoritmaları: Akıllı telefonunuzda yazarken klavye, bağlam penceresi içindeki önceki kelimelere göre bir sonraki kelimeyi önererek yazma hızını ve doğruluğunu artırır. Bu özellik, küçük, verimli bir bağlam penceresinin doğrudan bir uygulamasıdır.

Temel Hususlar ve İlgili Kavramlar

Doğru bağlam penceresi boyutunu seçmek bir ödünleşim içerir. Daha büyük pencereler daha fazla bağlam yakalayabilir ve özellikle uzun menzilli bağımlılık anlayışı gerektiren görevler için model doğruluğunu potansiyel olarak artırabilir. Bununla birlikte, daha fazla bellek ve hesaplama gücü gerektirir, potansiyel olarak eğitim ve çıkarımı yavaşlatır. Carnegie Mellon Üniversitesi'nin araştırmasında detaylandırıldığı üzere, Transformer-XL gibi teknikler daha uzun bağlamları daha verimli bir şekilde ele almak için geliştirilmektedir.

Bağlam Penceresini ilgili terimlerden ayırt etmekte fayda vardır:

  • Alıcı Alan: Kavramsal olarak benzer olsa da (bir çıktıyı etkileyen girdi bölgesi), alıcı alanlar tipik olarak Evrişimsel Sinir Ağları (CNN'ler) tarafından işlenen görüntüler gibi girdilerdeki uzamsal kapsamı ifade eder. Bağlam Penceresi genellikle sıralı veriler (metin, zaman serileri, video kareleri) için geçerlidir.
  • Dizi Uzunluğu: Birçok modelde, özellikle de Transformatörlerde, bağlam penceresi boyutu doğrudan modelin bir kerede işleyebileceği maksimum dizi uzunluğunu tanımlar. Daha uzun dizilerin kesilmesi veya özel mimariler kullanılarak işlenmesi gerekebilir. Bu, Diziden Diziye modeller için oldukça önemlidir.

PyTorch ( resmi PyTorch sitesi aracılığıyla) ve TensorFlow ( TensorFlow resmi sitesinde ayrıntılı olarak açıklanmıştır) gibi çerçeveler, bağlam pencerelerinin önemli bir parametre olduğu modeller oluşturmak için araçlar sağlar. Verimli model dağıtımı genellikle Ultralytics HUB gibi platformlar aracılığıyla yönetilebilen bağlam işlemenin optimize edilmesini gerektirir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı