Sözlük

Nesne Algılama Mimarileri

Görüntü anlamanın yapay zeka omurgası olan nesne algılama mimarilerinin gücünü keşfedin. Türleri, araçları ve gerçek dünya uygulamalarını bugün öğrenin!

Nesne algılama mimarileri, nesne algılama gerçekleştiren derin öğrenme modelleri için temel planlardır. Bu bilgisayarla görme (CV) görevi, genellikle etraflarına bir sınırlayıcı kutu çizerek ve bir sınıf etiketi atayarak bir görüntü veya video içindeki nesnelerin varlığını ve konumunu belirlemeyi içerir. Mimari, görsel bilgileri nasıl işlediği ve tahminleri nasıl yaptığı da dahil olmak üzere modelin yapısını tanımlar. Mimari seçimi, bir modelin hızını, doğruluğunu ve hesaplama gereksinimlerini doğrudan etkilediği için kritik öneme sahiptir.

Nesne Algılama Mimarileri Nasıl Çalışır?

Çoğu modern nesne algılama mimarisi, sırayla çalışan üç ana bileşenden oluşur:

  • Omurga: Bu, genellikle ImageNet gibi büyük bir görüntü sınıflandırma veri kümesi üzerinde önceden eğitilmiş bir konvolüsyonel sinir ağıdır (CNN). Birincil rolü, giriş görüntüsünü hiyerarşik görsel bilgileri yakalayan bir dizi özellik haritasına dönüştürerek bir özellik çıkarıcı olarak hareket etmektir. Popüler omurga ağları arasında ResNet ve birçok YOLO modelinde kullanılan CSPDarknet yer alır. IBM'in ayrıntılı genel bakışı gibi kaynaklardan CNN'lerin temelleri hakkında daha fazla bilgi edinebilirsiniz.
  • Boyun: Bu isteğe bağlı bileşen omurga ile baş arasında yer alır. Omurga tarafından üretilen özellik haritalarını bir araya getirmeye ve rafine etmeye yarar, çeşitli boyutlardaki nesnelerin tespitini iyileştirmek için genellikle farklı ölçeklerdeki özellikleri birleştirir. Örnekler arasında Özellik Piramit Ağları (FPN'ler) yer alır.
  • Algılama Baş lığı: Başlık, tahminleri yapmaktan sorumlu son bileşendir. Boyundan (veya doğrudan omurgadan) işlenmiş özellik haritalarını alır ve tespit edilen her nesne için sınıf olasılıklarını ve sınırlayıcı kutu koordinatlarını çıkarır.

Mimari Türleri

Nesne algılama mimarileri, tahmin yaklaşımlarına göre genel olarak kategorize edilir ve bu da hız ile doğruluk arasında bir değiş tokuşa yol açar. Bu ödünleşimleri iş başında görmek için ayrıntılı model karşılaştırmalarını inceleyebilirsiniz.

  • İki Aşamalı Nesne Algılayıcıları: R-CNN ailesi gibi bu modeller önce bir dizi aday nesne bölgesini (bölge önerileri) tanımlar ve ardından her bölgeyi sınıflandırır. Bu iki aşamalı süreç yüksek doğruluğa ulaşabilir ancak genellikle daha yavaştır.
  • Tek Aşamalı Nesne Algılayıcılar: Ultralytics YOLO (You Only Look Once) ailesi gibi mimariler nesne tespitini tek bir regresyon problemi olarak ele alır. Sınırlayıcı kutuları ve sınıf olasılıklarını doğrudan tüm görüntüden tek geçişte tahmin ederek gerçek zamanlı çıkarım sağlarlar.
  • Çapasız Dedektörler: Tek aşamalı dedektörler içinde daha yeni bir evrim olan Ultralytics YOLO11 gibi çapasız mimariler, önceden tanımlanmış çapa kutularına olan ihtiyacı ortadan kaldırır. Bu, eğitim sürecini basitleştirir ve genellikle daha hızlı, daha verimli modellere yol açar.

Gerçek Dünya Uygulamaları

Nesne algılama mimarileri, farklı sektörlerdeki çok sayıda yapay zeka uygulamasına güç veriyor:

Araçlar ve Teknolojiler

Bu mimarilere dayalı modellerin geliştirilmesi ve dağıtılması genellikle özel araçlar ve çerçeveler gerektirir:

  • Derin Öğrenme Çerçeveleri: PyTorch (resmi PyTorch web sitesini ziyaret edin) ve TensorFlow ( TensorFlow web sitesine bakın) gibi kütüphaneler temel yapı taşlarını sağlar.
  • Bilgisayarla Görme Kütüphaneleri: OpenCV (resmi site: OpenCV.org) görüntü işleme ve manipülasyon için geniş bir fonksiyon yelpazesi sunar.
  • Modeller ve Platformlar: Ultralytics, son teknoloji Ultralytics YOLO modelleri ve Ultralytics HUB platformu sağlayarak özel modellerin eğitilmesi, veri kümelerinin yönetilmesi ( COCO gibi) ve çözümlerin dağıtılması sürecini basitleştirir.
  • Açık Kaynak: Birçok nesne algılama mimarisi ve aracı, açık kaynak lisansları altında geliştirilmekte ve yapay zeka topluluğu içinde işbirliğini ve yeniliği teşvik etmektedir. GitHub gibi kaynaklar bu alanda çok sayıda projeye ev sahipliği yapmaktadır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı