Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Çapa Kutuları

Çapa kutularının, otonom sürüş ve perakende sektöründeki uygulamalarla birlikte çapa tabanlı nesne algılama, sınıflandırma, regresyon ve NMS için öncelleri nasıl sağladığını öğrenin.

Çapa kutuları, birçok mimaride temel bir kavram olarak hizmet vermektedir. önceden tanımlanmış olarak hareket eden nesne algılama modelleri Nesnelerin yerini ve boyutunu tahmin etmek için referanslar. Bir görüntüyü rastgele nesneler için taramak yerine boyutlarını sıfırdan oluştururken, model belirli yükseklik ve genişliklerle tanımlanan bu sabit şekilleri başlangıç noktası olarak kullanır, veya önceller. Bu yaklaşım, mutlak koordinatların belirlenmesi gibi zorlu bir görevi dönüştürerek öğrenme sürecini basitleştirir. Tahmin, ağın bunları ayarlamayı veya "dengelemeyi" öğrendiği daha yönetilebilir bir regresyon problemine dönüşür zemin gerçeği nesnelerine uyması için şablonlar. Bu gibi popüler mimarilerin başarısında çok önemli bir rol oynamıştır. Daha hızlı R-CNN ailesi ve erken tek aşamalı dedektörler.

Ankraj Kutuları Nasıl Çalışır?

Çapa kutuları mekanizması, giriş görüntüsünün yoğun bir merkez ızgarasıyla döşenmesini içerir. Her bir ızgara hücresinde, farklı en boy oranlarına sahip çoklu bağlantı kutuları ve Uzun yayalar veya geniş araçlar gibi farklı şekillerdeki nesneleri barındırmak için ölçekler oluşturulur. sırasında model eğitim aşamasında, sistem bu çapaları adı verilen bir metrik kullanarak gerçek nesneler Birlik Üzerinde Kavşak (IoU). Ankrajlar Hedef nesne ile önemli ölçüde örtüşen örnekler pozitif örnekler olarak etiketlenir.

Dedektörün backbone görüntüden özellikler çıkarır, algılama kafasının iki işlemi gerçekleştirmek için kullandığı Her bir pozitif çapa için paralel görevler:

  • Sınıflandırma: Model, çapanın belirli bir nesneyi içerme olasılığını tahmin eder sınıfına bir güven puanı atar.
  • Kutu Regresyonu: Ağ, ankrajı yeniden şekillendirmek için gereken kesin koordinat ofsetlerini hesaplar sıkıca çevreleyen son bir sınırlayıcı kutu içine nesne.

Aynı nesne için çakışan tahminleri ele almak için, aşağıdaki gibi bilinen bir son işlem adımı Maksimum Olmayan Bastırma (NMS) filtreleri gereksiz kutuları çıkararak yalnızca en yüksek güvene sahip olanı korur. Gibi çerçeveler PyTorch ve TensorFlow için gerekli hesaplama araçlarını sağlamak bu karmaşık işlemleri verimli bir şekilde uygulayabilir.

Çapalar ve İlgili Kavramlar

Çapa kutularını anlamak, bunları kendi içlerindeki benzer terimlerden ayırt etmeyi gerektirir bilgisayar görüşü (CV).

  • Çapa Kutuları ve Sınırlama Kutuları: Çapa kutusu, sınırlayıcı kutu olarak kullanılan teorik, sabit bir şablondur. işleme sırasında hipotez. Bir sınırlayıcı kutu Algılanan nesnenin koordinatlarını içeren nihai, rafine çıktı.
  • Ankraj Tabanlı ve Ankrajsız: Geleneksel çapa tabanlı dedektörler, örneğin YOLOv5bu manuel ön ayarlara güvenir. Buna karşılık, modern çapasız dedektörler, örneğin Ultralytics YOLO11, nesne merkezlerini veya kilit noktalarını tahmin etme Doğrudan. Bu değişim, çapa ile ilgili hiperparametre ayarlama ihtiyacını ortadan kaldırarak model tasarımını basitleştirir gibi veri kümelerinde genelleştirmeyi genellikle iyileştiren boyutlar COCO.

Gerçek Dünya Uygulamaları

Çapa kutularının yapılandırılmış doğası, onları özellikle nesne şekillerinin olduğu ortamlarda etkili kılar tutarlı ve öngörülebilir.

  1. Otonom Sürüş: İçin geliştirilen sistemler Otonom araçlar, aşağıdakileri algılamaya dayanır arabalar, kamyonlar ve trafik işaretleri gibi standart nesneler. Bu nesneler nispeten sabit en boy oranlarına sahip olduğundan, çapa kutuları bunları verimli bir şekilde yakalamak için ayarlanabilir. Gibi şirketler Waymo karmaşık ortamlarda güvenliği sağlamak için sofistike algılama hatları kullanıyor trafik senaryoları.
  2. Perakende Envanter Yönetimi: İçinde perakende analitiği, görüntü sistemleri rafları izleyerek stok seviyelerini detect eder. Paketlenmiş ürünler tipik olarak tek tip şekillere sahiptir, bu da çapa tabanlı modellerin doğru sayım yapmasına olanak tanır ve stokta olmayan ürünleri belirler. Bu otomasyon şunları destekler Yapay zeka destekli envanter yönetimi, el işçiliğini azaltır.

Kod Örneği

YOLO11 gibi modern modeller çapasız olsa da, YOLOv5 gibi önceki yinelemelerde çapa kutuları kullanılmaktadır. Bu ultralytics paketi bu karmaşıklığı soyutlayarak kullanıcıların manuel olarak çıkarım yapmadan çapaları yapılandırma. Aşağıdaki örnekte, nesneleri detect etmek için önceden eğitilmiş bir modelin yüklenmesi gösterilmektedir:

from ultralytics import YOLO

# Load a pretrained YOLOv5 model (anchor-based architecture)
model = YOLO("yolov5su.pt")

# Run inference on a static image from the web
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected bounding boxes
results[0].show()

Bu sistemlerin matematiksel temelleriyle ilgilenenler için aşağıdaki gibi eğitim platformları Coursera ve DeepLearning.AI derinlemesine kurslar sunuyor konvolüsyonel sinir ağları ve nesne algılama üzerine.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın