Dikkat mekanizmalarının çeviri, nesne tespiti ve daha fazlası gibi NLP ve bilgisayarlı görü görevlerini geliştirerek yapay zekada nasıl devrim yarattığını keşfedin!
Dikkat mekanizması, yapay zeka (AI) alanında temel bir tekniktir. yapay zeka (AI) insanın alakasız bilgileri görmezden gelip belirli ayrıntılara odaklanma yeteneğini taklit eden temel bir tekniktir. Derin öğrenme (DL) bağlamında derin öğrenme (DL)bağlamında, bu mekanizma sinir ağına (NN) giriş verilerinin farklı bölümlerine dinamik olarak farklı önem düzeyleri veya "ağırlıklar" atamasına olanak tanır. Model, bir görüntünün veya cümlenin tamamını eşit önemle işlemek yerine, bağlamı anlamak için cümledeki belirli bir kelime veya karmaşık bir görsel sahnedeki belirgin bir nesne gibi en önemli özelliklere dikkat etmeyi öğrenir. Bu çığır açan gelişme, Transformer'ın arkasındaki itici güçtür. Transformer mimarisi doğal dil işleme (NLP) gelişmiş bilgisayar görme (CV).
Başlangıçta bellek sınırlamalarını çözmek için tasarlanmış Tekrarlayan Sinir Ağları (RNN'ler), dikkat mekanizmaları kaybolan gradyan sorununu veri dizisinin uzak kısımları arasında doğrudan bağlantılar oluşturarak çözer. Bu süreç genellikle üç bileşeni içeren bir geri alma benzetmesi kullanılarak açıklanır: Sorgular, Anahtarlar ve Değerler.
Sorguyu çeşitli Anahtarlarla karşılaştırarak, model bir dikkat puanı hesaplar. Bu puan, Değerin ne kadarının alınacağını ve çıktıyı oluşturmak için kullanılacağını belirler. Bu, modellerin uzun menzilli bağımlılıkları etkin bir şekilde ele almalarını ve birbirlerinden uzaklıklarına bakılmaksızın veri noktaları arasındaki ilişkileri anlamalarını sağlar.
Dikkat mekanizmaları, modern teknolojide en göze çarpan gelişmelerin bazılarını mümkün kılmıştır.
Dikkat ile Konvolüsyonel Sinir Ağları (CNN)detect önemlidir. CNN'ler detect ve dokuları detect için sabit bir pencere (çekirdek) kullanarak verileri yerel olarak işlerken, dikkat verileri küresel olarak işler ve girdinin her parçasını diğer parçalarla ilişkilendirir.
Ultralytics YOLO26 Ultralytics gibi en son teknolojiye sahip modeller gerçek zamanlı çıkarım için optimize edilmiş olsa da, gelişmiş CNN yapıları kullanan RT-DETR (Gerçek Zamanlı Algılama Dönüştürücü) gibi hibrit mimariler, yüksek doğruluk elde etmek için açıkça dikkat kullanır. Her iki model türü de Ultralytics kullanılarak kolayca eğitilebilir ve devreye alınabilir.
Aşağıdaki Python , kullanarak nasıl çıkarım yapılacağını göstermektedir. RT-DETR, temel olarak dikkat mekanizmalarına dayanan bir model mimarisi
.
nesne algılama.
from ultralytics import RTDETR
# Load a pre-trained RT-DETR model which uses attention mechanisms
# This model captures global context effectively compared to pure CNNs
model = RTDETR("rtdetr-l.pt")
# Perform inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")
# Print the number of detections found via transformer attention
print(f"Detected {len(results[0].boxes)} objects using attention-based detection.")
