YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Sequence-to-Sequence Modelleri

Diziden diziye modellerin, çeviri, sohbet robotları ve konuşma tanıma gibi yapay zeka görevlerine güç vererek girdiyi çıktı dizilerine nasıl dönüştürdüğünü keşfedin.

Sıralıdan Sıralıya (Seq2Seq) modelleri, bir girdi dizisini bir çıktı dizisine dönüştürmek üzere tasarlanmış bir derin öğrenme modeli sınıfıdır ve girdi ve çıktının uzunlukları farklılık gösterebilir. Bu esneklik, onları Doğal Dil İşleme (DDİ) ve ötesindeki çok çeşitli görevler için son derece güçlü kılar. Temel fikir, Google ve Yoshua Bengio'nun laboratuvarındaki araştırmacılar tarafından yayınlanan makalelerde tanıtıldı ve makine çevirisi gibi alanlarda devrim yarattı.

Seq2Seq Modelleri Nasıl Çalışır

Seq2Seq modelleri, bir kodlayıcı-çözücü mimarisi üzerine inşa edilmiştir. Bu yapı, modelin değişken uzunluktaki dizileri etkili bir şekilde işlemesini sağlar.

  • Kodlayıcı (Encoder): Bu bileşen, İngilizce bir cümle gibi tüm girdi dizisini işler. Diziyi her seferinde bir öğe (örneğin, kelime kelime) okur ve bilgileri bağlam vektörü veya "düşünce vektörü" adı verilen sabit uzunluklu sayısal bir gösterime sıkıştırır. Geleneksel olarak, kodlayıcı bir Tekrarlayan Sinir Ağı (RNN) veya sıralı bilgileri yakalamada usta olan Uzun Kısa Süreli Bellek (LSTM) gibi daha gelişmiş bir varyanttır.

  • Çözücü (Decoder): Bu bileşen, kodlayıcıdan gelen bağlam vektörünü başlangıç girdisi olarak alır. Görevi, çıktı dizisini her seferinde bir öğe olacak şekilde oluşturmaktır. Örneğin, bir çeviri görevinde, çevrilmiş cümleyi kelime kelime oluşturacaktır. Her adımdaki çıktı, bir sonraki adımda çözücüye geri beslenerek tutarlı bir dizinin oluşturulmasını sağlar. Bu işlem, özel bir dizi sonu belirteci üretilene kadar devam eder. Seq2Seq performansını önemli ölçüde artıran önemli bir yenilik, çözücünün çıktıyı oluştururken orijinal girdi dizisinin farklı bölümlerine geri bakmasına olanak tanıyan dikkat mekanizmasıdır (attention mechanism).

Seq2Seq Modellerinin Uygulamaları

Değişken uzunluklu girdileri değişken uzunluklu çıktılara eşleme yeteneği, Seq2Seq modellerini oldukça çok yönlü hale getirir.

  • Makine Çevirisi: Bu, mükemmel bir uygulamadır. Bir model, bir dildeki bir cümleyi (örneğin, "Nasılsınız?") alıp başka bir dile (örneğin, "Wie geht es Ihnen?") çevirebilir. Google Çeviri gibi hizmetler bu ilkeleri yoğun bir şekilde kullanmıştır.
  • Metin Özetleme: Bir Seq2Seq modeli, uzun bir makaleyi veya belgeyi (giriş dizisi) okuyabilir ve özlü bir özet (çıktı dizisi) oluşturabilir. Bu, büyük metin hacimlerini sindirilebilir içgörülere yoğunlaştırmak için kullanışlıdır.
  • Sohbet Robotları (Chatbots) ve Konuşma Yapay Zekası (Conversational AI): Modeller, bir kullanıcının sorgusuna veya ifadesine (girdi dizisi) ilgili ve bağlamsal bir yanıt (çıktı dizisi) oluşturmak için eğitilebilir.
  • Görüntü Alt Yazısı (Image Captioning): Bu bilgisayar görüşünü içerse de, prensip benzerdir. Bir CNN, bir görüntüyü işlemek ve bir bağlam vektörü oluşturmak için kodlayıcı görevi görür; daha sonra bir kod çözücü, açıklayıcı bir metin dizisi oluşturmak için bunu kullanır. Bu, bir çok modlu model örneğidir.

Seq2Seq ve Diğer Mimariler

RNN'lere dayalı Seq2Seq modelleri çığır açmış olsa da, alan gelişmeye devam etti:

  • Standart RNN'ler: Genellikle dizileri aynı uzunluktaki dizilerle eşler veya tüm dizileri sınıflandırır ve değişken çıktı uzunlukları için kodlayıcı-çözücü yapısının esnekliğinden yoksundur.
  • Transformer'lar: Artık daha önce RNN tabanlı Seq2Seq modelleri tarafından işlenen birçok NLP görevine hakimdirler. Daha iyi paralelleştirmeye olanak tanıyan ve uzun menzilli bağımlılıkları daha etkili bir şekilde yakalayan yineleme yerine öz-dikkat ve konumsal kodlamalar kullanırlar. Bununla birlikte, temel kodlayıcı-çözücü kavramı, birçok Transformer tabanlı model için merkezi olmaya devam etmektedir. Ultralytics tarafından desteklenen Baidu'nun RT-DETR'si gibi modeller, nesne algılama için Transformer bileşenlerini içerir.
  • CNN'ler (Evrişimsel Sinir Ağları): Genellikle görüntüler gibi ızgara benzeri veriler için kullanılır (örneğin, Ultralytics YOLO modellerinde nesne tespiti ve segmentasyon için), ancak bazen sıralı görevler için de uyarlanır.

Seq2Seq genellikle RNN tabanlı kodlayıcı-çözücü yapısını ifade etse de, bir ara gösterim kullanarak girdi dizilerini çıktı dizilerine eşleme genel prensibi birçok modern mimarinin merkezinde yer almaya devam etmektedir. PyTorch ve TensorFlow gibi araçlar, hem geleneksel hem de modern dizi modellerini uygulamak için yapı taşları sağlar. Eğitim sürecini yönetmek, tüm model dağıtım hattını basitleştiren Ultralytics HUB gibi platformlar kullanılarak kolaylaştırılabilir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı