YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Ultralytics Sözlüğüne dön

Transformer-XL

Transformer-XL ve onun segment düzeyindeki tekrarlamasını keşfet. Bu mimarinin yapay zeka modellerindeki uzun menzilli bağımlılıklar için sabit bağlam sorununu nasıl çözdüğünü öğren.

Transformer-XL (Transformer-Extra Long), standart Transformer modellerindeki kritik bir sınırlamayı, yani sıralı verilerdeki uzun vadeli bağımlılıkları ele alma yeteneğini çözmek için tasarlanmış özel bir sinir ağı mimarisidir. Google AI araştırmacıları tarafından tanıtılan bu mimari, dil modellerinin BERT veya orijinal Transformer gibi geleneksel yaklaşımları kısıtlayan sabit uzunluktaki bağlam pencerelerinin çok ötesine bakmasını sağlar. Segment düzeyinde bir yineleme mekanizması ve özgün bir konumsal kodlama şeması sunan Transformer-XL, metin bağlamını kaybetmeden son derece uzun metin dizilerini işleyebilir; bu da onu modern Büyük Dil Modelleri (LLM'ler) ve üretken yapay zeka uygulamaları için temel bir kavram haline getirir.

Link to this sectionBağlam Sınırlamalarının Aşılması#

Transformer-XL'in arkasındaki temel motivasyon "sabit bağlam problemi"dir. Standart Transformer modelleri veriyi sabit boyutlu segmentler (örneğin 512 token) halinde işler. Bilgi genellikle bu segmentler arasında akmaz, bu da modelin önceki segmentte ne olduğunu unutması anlamına gelir. Bu durum, uzun belgelerdeki tutarlılığı bozar.

Transformer-XL bunu iki temel yenilikle çözer:

  1. Segment Düzeyinde Yineleme: Her segmenti bağımsız olarak işleyen klasik bir Transformer'ın aksine, Transformer-XL önceki segmentten gelen gizli durumları bellekte saklar (cache). Mevcut segmenti işlerken model, bu önbelleğe alınmış durumlara odaklanabilir. Bu, segmentleri etkili bir şekilde birbirine bağlar ve bilginin çok daha uzak mesafelere yayılmasına olanak tanır; bu durum bir Yinelemeli Sinir Ağına (RNN) benzer ancak dikkat (attention) mekanizmalarının paralelleştirme avantajlarına sahiptir.

  2. Göreceli Konumsal Kodlama: Yineleme mekanizması önceki segmentlerden gelen durumları yeniden kullandığı için, (her konuma benzersiz bir kimlik atayan) standart mutlak konumsal kodlamalar kafa karıştırıcı hale gelirdi. Transformer-XL, modelin tokenler arasındaki mesafeyi (örneğin, "A kelimesi, B kelimesinden 5 adım öncedir") belgedeki mutlak konumlarından ziyade anlamasına yardımcı olan göreceli kodlama kullanır.

Bu mimari, dil modelleme görevlerinde RNN'ler ve standart Transformer'lar gibi öncülerine kıyasla şaşkınlık (perplexity) puanlarını önemli ölçüde iyileştirir.

Link to this sectionStandart Transformer'lardan Farkı#

Transformer-XL'i standart Vision Transformer (ViT) veya metin Transformer'larından ayırmak faydalıdır. Standart bir Transformer her segmentten sonra durumunu sıfırlayarak "bağlam parçalanmasına" neden olurken, Transformer-XL geçmiş aktivasyonların bir hafızasını tutar. Bu, sabit bağlamlı modellerden yüzlerce kat daha uzun bağımlılıkları modellemesine olanak tanır. Bu durum, cevabın sorgudan paragraflar uzakta olabildiği derin doğal dil anlama (NLU) gerektiren görevler için özellikle kritiktir.

Link to this sectionGerçek Dünya Uygulamaları#

Uzun vadeli bağlamı koruma yeteneği, Transformer-XL'i birkaç yüksek etkili alanda değerli kılar:

  • Uzun Metin Üretimi: Roman yazma veya uzun raporlar oluşturma gibi metin üretimi uygulamalarında tematik tutarlılığı korumak zordur. Transformer-XL, yapay zekanın metnin başında tanıtılan karakter isimlerini, olay örgüsü noktalarını veya teknik tanımları hatırlamasını sağlayarak çıktının baştan sona tutarlı kalmasını sağlar.
  • DNA Dizisi Analizi: Mimari sadece insan diliyle sınırlı değildir. Biyoinformatikte araştırmacılar, uzun DNA ipliklerini analiz etmek için Transformer-XL varyasyonlarını kullanırlar. Uzak gen dizileri arasındaki ilişkileri anlamak, sağlıkta yapay zekanın tıbbi görüntülemeyi analiz etmeye yardımcı olması gibi, genetik belirteçlerin tanımlanmasına ve protein yapılarının tahmin edilmesine yardımcı olur.
  • Chatbot'lar ve Sanal Asistanlar: Modern chatbot'lar, kullanıcı tercihlerini ve bir konuşmanın başlarında bahsedilen ayrıntıları hatırlamak zorundadır. Transformer-XL mekanikleri, bağlam penceresini genişletmeye yardımcı olarak, bir asistanın sadece dakikalar önce tartışılan konuyu unuttuğu sinir bozucu deneyimi önler.

Link to this sectionBellek ve Verimlilik#

Transformer-XL uzun dizilerde üstün performans sunsa da, belirli bellek hususlarını beraberinde getirir. Gizli durumların önbelleğe alınması ek GPU belleği gerektirir ve bu da doğru yönetilmezse çıkarım gecikmesini etkileyebilir. Ancak, uzun bağlamlarda doğruluğun en önemli olduğu uygulamalar için bu takas genellikle gerekçelendirilebilir.

Modern object detection models like YOLO26 focus on speed and efficiency for visual data. In contrast, architectures like Transformer-XL prioritize memory retention for sequential data. Interestingly, the field is evolving toward multimodal AI, where efficient vision backbones (like those in YOLO26) might be paired with long-context language decoders to analyze lengthy videos and answer complex questions about events happening over time.

Link to this sectionÖrnek: Çıkarımda Bağlam Yönetimi#

Transformer-XL'in iç mekanizmaları karmaşık olsa da, gelişmiş modelleri kullanmak genellikle bağlam sınırlarına uymak için girişlerin yönetilmesini gerektirir. torch kullanan aşağıdaki Python örneği, Transformer-XL gibi mimarilerde bulunan yinelemeli davranışı simüle ederek bağlamı adımlar boyunca korumak için modele "bellek" (gizli durumlar) aktarma kavramını göstermektedir.

import torch
import torch.nn as nn

# Define a simple RNN to demonstrate passing hidden states (memory)
# This mimics the core concept of recurrence used in Transformer-XL
rnn = nn.RNN(input_size=10, hidden_size=20, num_layers=2, batch_first=True)

# Initial input: Batch size 1, sequence length 5, feature size 10
input_seq1 = torch.randn(1, 5, 10)

# Run first segment, receiving output and the hidden state (memory)
output1, memory = rnn(input_seq1)

# Run second segment, PASSING the memory from the previous step
# This connects the two segments, allowing context to flow
input_seq2 = torch.randn(1, 5, 10)
output2, new_memory = rnn(input_seq2, memory)

print(f"Output shape with context: {output2.shape}")

En son teknoloji modelleri verimli bir şekilde eğitmek ve dağıtmak isteyen ekipler için Ultralytics Platform, ister görme modelleriyle çalışıyor olun ister karmaşık sıralı mimarileri entegre ediyor olun, veri kümelerini yönetmek ve model eğitimi sürecini kolaylaştırmak için araçlar sağlar.

Explore solutions

Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla