Receptive Field
Alıcı alanın (receptive field) bir sinir ağının ne gördüğünü nasıl tanımladığını keşfet. Ultralytics YOLO26'nın her boyuttaki nesneyi etkili bir şekilde tespit etmek için uzamsal bağlamı nasıl optimize ettiğini öğren.
Bilgisayarlı görü (CV) ve derin öğrenme alanında algı alanı, bir sinir ağındaki (NN) belirli bir nöronun giriş görüntüsünün "gördüğü" veya analiz ettiği spesifik bölgesini ifade eder. Kavramsal olarak, bir insan gözünün veya kamera lensinin görüş alanına benzer şekilde işler. Bir modelin herhangi bir katmanda ne kadar uzamsal bağlam algılayabileceğini belirler. Veri bir Evrişimli Sinir Ağında (CNN) ilerledikçe, algı alanı genellikle genişler ve sistemin kenarlar veya köşeler gibi küçük, yerel ayrıntıları tanımlamaktan tüm nesneler veya sahneler gibi karmaşık, küresel yapıları anlamaya geçmesini sağlar.
Link to this sectionAlgı Alanlarının Mekaniği#
Algı alanının boyutu ve derinliği, ağın mimarisi tarafından belirlenir. İlk katmanlarda nöronlar genellikle küçük bir algı alanına sahiptir ve ince dokuları yakalamak için küçük bir piksel kümesine odaklanırlar. Ağ derinleştikçe, havuzlama katmanları (pooling layers) ve adımlı evrişimler (strided convolutions) gibi işlemler özellik haritalarını etkin bir şekilde alt örnekler (downsample). Bu süreç, sonraki nöronların orijinal girdinin çok daha büyük bir bölümünden bilgi toplamasına olanak tanır.
Son teknoloji Ultralytics YOLO26 dahil olmak üzere modern mimariler, bu alanları titizlikle dengelemek için tasarlanmıştır. Algı alanı çok darsa, model büyük nesneleri tanıyamayabilir çünkü tüm şekli algılayamaz. Tersine, eğer alan çözünürlüğü korumadan aşırı genişse, model küçük nesneleri kaçırabilir. Bunu çözmek için mühendisler, algı alanını uzamsal çözünürlüğü düşürmeden genişletmek için seyreltilmiş evrişimler (dilated convolutions) (atrous evrişimler olarak da bilinir) kullanırlar; bu, anlamsal bölümleme (semantic segmentation) gibi yüksek hassasiyetli görevler için hayati bir tekniktir.
Link to this sectionGerçek Dünya Uygulamaları#
Algı alanını optimize etmek, çeşitli AI çözümlerinin başarısı için kritiktir.
- Otonom Sürüş: Otomotiv için AI alanında, algılama sistemleri aynı anda hem küçük ayrıntıları hem de büyük engelleri takip etmelidir. Bir aracın uzak trafik ışıklarını tanımlamak için küçük bir algı alanına, aynı anda yakın bir kamyonun yörüngesini veya yol şeridinin eğriliğini anlamak için geniş bir algı alanına ihtiyacı vardır. Bu çok ölçekli algılama, daha iyi AI güvenliği ve karar verme süreci sağlar.
- Tıbbi Teşhis: Sağlık hizmetlerinde AI uygularken, radyologlar taramalardaki anormallikleri tespit etmek için modellere güvenirler. Beyin tümörlerini tanımlamak için ağın, beynin genel simetrisini ve yapısını anlamak için büyük bir algı alanına ihtiyacı vardır. Ancak, mamografide mikro kalsifikasyonları tespit etmek için model, ince doku değişikliklerine duyarlı küçük algı alanlarına sahip erken katmanlara güvenir.
Link to this sectionİlgili Kavramları Ayırt Etme#
Ağ tasarımını tam olarak anlamak için, algı alanını benzer terimlerden ayırt etmek faydalıdır:
- Algı Alanı ve Çekirdek (Kernel): Çekirdek (veya filtre) boyutu, tek bir evrişim (convolution) işlemi için kayan pencerenin (örneğin 3x3) boyutlarını tanımlar. Algı alanı ise, bir nöronu etkileyen toplam birikmiş giriş alanını temsil eden ortaya çıkan bir özelliktir. Birden fazla 3x3 çekirdek yığını, 3x3'ten çok daha büyük bir algı alanı ile sonuçlanacaktır.
- Algı Alanı ve Özellik Haritası (Feature Map): Özellik haritası, bir katman tarafından üretilen ve öğrenilmiş temsilleri içeren çıkış hacmidir. Algı alanı, bu özellik haritası üzerindeki tek bir nokta ile orijinal giriş görüntüsü arasındaki ilişkiyi tanımlar.
- Algı Alanı ve Bağlam Penceresi (Context Window): Her iki terim de algılanan verinin kapsamını ifade etse de, "bağlam penceresi" genellikle Doğal Dil İşleme (NLP) veya video analizinde zamansal veya sıralı bir aralığı (örneğin token limiti) belirtmek için kullanılır. Algı alanı ise kesin olarak ızgara benzeri verilerdeki (görüntüler) uzamsal alanı ifade eder.
Link to this sectionKod İçinde Pratik Kullanım#
Daha yeni YOLO26 gibi son teknoloji modeller, her boyuttaki nesne için etkili algı alanlarını korumak üzere Özellik Piramidi Ağlarını (FPN) kullanır. Aşağıdaki örnek, bir modelin nasıl yükleneceğini ve bu dahili mimari optimizasyonlardan otomatik olarak yararlanarak nasıl nesne tespiti (object detection) yapılacağını gösterir. Kendi modellerini optimize edilmiş mimarilerle eğitmek isteyen kullanıcılar, sorunsuz veri seti yönetimi ve bulut tabanlı eğitim için Ultralytics Platform'dan faydalanabilirler.
from ultralytics import YOLO
# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")
# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results, detecting both large (bus) and small (person) objects
results[0].show()





