YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Ultralytics Sözlüğüne dön

Longformer

Uzun veri dizilerini verimli bir şekilde işlemek için Longformer mimarisini keşfet. NLP ve Bilgisayarlı Görü için seyrek dikkatin (sparse attention) bellek sınırlarını nasıl aştığını öğren.

Longformer, geleneksel modellerin sınırlamalarını aşarak uzun veri dizilerini verimli bir şekilde işlemek için tasarlanmış, özel bir Derin Öğrenme mimarisi türüdür. Bellek kısıtlamaları nedeniyle genellikle 512'den fazla token içeren dizilerle çalışmakta zorlanan standart Transformer modellerinin kısıtlamalarını ele almak için geliştirilmiştir. Longformer, değiştirilmiş bir dikkat mekanizması kullanır. Hesaplama karmaşıklığını kareselden doğrusala indirgeyerek bu mimari, yapay zeka sistemlerinin tüm belgeleri, uzun transkriptleri veya karmaşık genetik dizileri girdiyi kesmeden tek bir geçişte analiz etmesini sağlar.

Link to this sectionDikkat Darboğazı Sorunu#

Longformer'ın önemini anlamak için BERT ve ilk dönem GPT-3 modelleri gibi öncüllerin sınırlamalarına bakmak gerekir. Standart Transformer'lar, her bir token'ın (kelime veya kelime parçası) dizideki diğer tüm token'lara dikkat ettiği bir "öz-dikkat" (self-attention) işlemi kullanır. Bu, karesel bir hesaplama maliyeti yaratır; dizi uzunluğunu ikiye katlamak, GPU üzerinde gereken belleği dört katına çıkarır. Sonuç olarak, çoğu standart model girdi boyutuna katı bir sınır koyar ve veri bilimcilerini belgeleri daha küçük, bağlantısız parçalara bölmeye zorlar; bu da bağlam kaybına yol açar.

Longformer, Seyrek Dikkat (Sparse Attention) özelliğini sunarak bu sorunu çözer. Tam bir her-token-her-token'a bağlantısı yerine, pencereli yerel dikkat ve küresel dikkatin bir kombinasyonunu kullanır:

  • Kayan Pencere Dikkati: Her token yalnızca yakın komşularına dikkat eder. Bu, bir Evrişimli Sinir Ağının (CNN) görüntüleri işlemesine benzer şekilde yerel bağlamı ve sözdizimsel yapıyı yakalar.
  • Seyreltilmiş Kayan Pencere: Hesaplamayı artırmadan algı alanını genişletmek için pencere boşluklar içerebilir, bu da modelin metin içinde "daha uzağı" görmesine olanak tanır.
  • Küresel Dikkat: Önceden seçilmiş belirli token'lar (örneğin [CLS] sınıflandırma token'ı gibi) dizideki diğer tüm token'lara dikkat eder ve tüm token'lar da onlara dikkat eder. Bu, modelin metin özetleme gibi görevler için tüm girdinin üst düzey bir anlayışını korumasını sağlar.

Link to this sectionGerçek Dünya Uygulamaları#

Binlerce token'ı aynı anda işleyebilme yeteneği, Doğal Dil İşleme (NLP) ve ötesi için yeni olasılıkların kapısını açar.

Link to this sectionHukuki ve Tıbbi Belge Analizi#

Hukuk ve sağlık gibi sektörlerde belgeler nadiren kısadır. Bir yasal sözleşme veya bir hastanın tıbbi geçmişi düzinelerce sayfadan oluşabilir. Geleneksel Büyük Dil Modelleri (LLM), bu belgelerin parçalanmasını gerektirir, bu da sayfa 1'deki bir madde ile sayfa 30'daki bir tanım arasındaki kritik bağımlılıkların gözden kaçmasına neden olabilir. Longformer, tüm belge üzerinde tek seferde Varlık İsmi Tanıma (NER) ve sınıflandırma yapılmasına olanak tanıyarak, küresel bağlamın belirli terimlerin yorumlanmasını etkilemesini sağlar.

Link to this sectionUzun Metinli Soru-Cevap (QA)#

Standart Soru-Cevap sistemleri, bir sorunun cevabı uzun bir makaleye dağılmış bilgilerin sentezlenmesini gerektirdiğinde genellikle zorlanır. Tüm metni bellekte tutarak, Longformer tabanlı modeller farklı paragraflarda bulunan gerçekleri birbirine bağlayarak çok adımlı akıl yürütme gerçekleştirebilir ve kapsamlı bir cevap üretebilir. Bu, otomatik teknik destek sistemleri ve akademik araştırma araçları için kritiktir.

Link to this sectionTemel Terimleri Ayırt Etme#

  • Longformer vs. Transformer: Standart Transformer, tam $N^2$ dikkati kullanır, bu da onu kesin kılar ancak uzun girdiler için hesaplama açısından pahalı hale getirir. Longformer, ihmal edilebilir miktarda teorik kapasiteyi devasa verimlilik kazanımlarıyla takas ederek seyrek $N$ dikkatini kullanır ve 4.096 token veya daha fazla girdiye olanak tanır.
  • Longformer vs. Transformer-XL: Her ikisi de uzun dizileri işlese de, Transformer-XL önceki segmentleri hatırlamak için bir yineleme mekanizmasına (önceki durumları önbelleğe alma) dayanır. Longformer uzun diziyi doğal olarak tek seferde işler, bu da Ultralytics Platform gibi platformlarda paralel eğitimi basitleştirir.
  • Longformer vs. BigBird: Bunlar, aynı zamanlarda geliştirilmiş çok benzer mimarilerdir. Her ikisi de doğrusal ölçeklendirme elde etmek için seyrek dikkat mekanizmaları kullanır. BigBird, kayan pencerelere ek olarak belirli bir rastgele dikkat bileşeni de ekler.

Link to this sectionUygulama Kavramları#

Longformer özel bir işlevden ziyade bir mimari olsa da, uzun bağlamlı modeller için verileri nasıl hazırlayacağınızı anlamak çok önemlidir. PyTorch gibi modern çerçevelerde bu, genellikle standart sınırları aşan gömme işlemleri yönetimini içerir.

Aşağıdaki örnek, YOLO26 gibi standart algılama modellerinde kullanılan tipik boyutla karşılaştırarak uzun bağlamlı bir senaryo için sahte bir girdi tensörü oluşturmayı göstermektedir.

import torch

# Standard BERT-like models typically cap at 512 tokens
standard_input = torch.randint(0, 30000, (1, 512))

# Longformer architectures can handle significantly larger inputs (e.g., 4096)
# This allows the model to "see" the entire sequence at once.
long_context_input = torch.randint(0, 30000, (1, 4096))

print(f"Standard Input Shape: {standard_input.shape}")
print(f"Long Context Input Shape: {long_context_input.shape}")

# In computer vision, a similar concept applies when processing high-res images
# without downsampling, preserving fine-grained details.

Link to this sectionBilgisayarlı Görü ile İlişkisi#

Başlangıçta metin için tasarlanmış olmasına rağmen, Longformer'ın arkasındaki ilkeler Bilgisayarlı Görü alanını etkilemiştir. Dikkati yerel bir çevreyle sınırlama kavramı, görsel görevlerdeki yerelleştirilmiş işlemlere benzerdir. Görsel Transformer'lar (ViT), piksel (veya yama) sayısı çok fazla olabileceği için yüksek çözünürlüklü görüntülerde benzer ölçekleme sorunlarıyla karşılaşırlar. Longformer'ın seyrek dikkatinden türetilen teknikler, görüntü sınıflandırma ve nesne algılama verimliliğini artırmak için kullanılır ve YOLO26 gibi modellerin ayrıntılı görsel verileri işlerken yüksek hızlarını korumalarına yardımcı olur.

Mimari detaylar hakkında daha fazla okuma yapmak için, AllenAI tarafından hazırlanan orijinal Longformer makalesi derinlemesine kıyaslamalar ve teorik gerekçeler sunar. Ayrıca, bu tür büyük modellerin verimli eğitimi genellikle karma hassasiyet ve gelişmiş optimizasyon algoritmaları gibi tekniklerden yararlanır.

Explore solutions

Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.
Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.
Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.
Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.
Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.
Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.
Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.
Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.
Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.
Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.
Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.
Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.
Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla