Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Nesne Algılama

Nesne algılamanın gücünü keşfedin; YOLO gibi son teknoloji modellerle görüntülerdeki veya videolardaki nesneleri tanımlayın ve bulun. Gerçek dünya uygulamalarını keşfedin!

Nesne algılama, nesne algılama içinde çok önemli bir yetenektir. yazılıma olanak sağlayan bilgisayarla görme (CV) sistemler yalnızca bir görüntünün neyi temsil ettiğini tanımakla kalmaz, aynı zamanda içindeki öğelerin belirli örneklerini de bulur. Bir yandan standart sınıflandırma tüm görsel girdiye tek bir etiket atarken, nesne algılama daha ayrıntılı bir her birinin etrafında bir sınırlayıcı kutu tahmin ederek anlama tanımlanmış varlık, belirli bir sınıf etiketi ve bir güven puanı. Bu teknoloji duyusal olarak i̇leri̇ düzey i̇çi̇n temel yapay zeka (AI), aşağıdakilere izin verir makinelerin fiziksel dünyanın karmaşıklığını algılaması, yorumlaması ve etkileşime girmesi. Otomatik kaliteden fabrikalarda kontrolden gelişmiş gözetime kadar, yapılandırılmamış piksel verilerini eyleme geçirilebilir içgörülere dönüştürür.

Nesne Algılama Mekaniği

Modern dedektörler öncelikle derin öğrenme (DL) mimarileri, özellikle Konvolüsyonel Sinir Ağları (CNN'ler), özelliklerin uzamsal hiyerarşilerini öğrenmek için. Tipik bir mimari aşağıdakilerden oluşur backboneçıkaran ResNet veya CSPNet gibi giriş görüntüsünden temel görsel özellikler. Bu özellikler daha sonra bir için koordinat çıktısı veren algılama kafası sınırlayıcı kutular ve sınıf üyeliği olasılığı.

Yüksek performans elde etmek için modeller, aşağıdaki gibi büyük etiketli koleksiyonlar üzerinde eğitilir Kıyaslama için bir standart sağlayan COCO veri seti. Çıkarım sırasında, algoritmaları genellikle aynı nesne için birden fazla örtüşen kutu oluşturur. Gibi teknikler Maksimum Olmayan Bastırma (NMS) şunlardır bu fazlalıkları filtrelemek için uygulanır ve yalnızca en yüksek güvene ve en iyi Birlik Üzerinden Kesişim (IoU) ile zemin gerçeği.

Modeller genel olarak iki tipe ayrılır:

  • İki aşamalı nesne dedektörleri: Faster R-CNN gibi sistemler önce ilgi bölgeleri önerir ve ardından bunları classify . Tarihsel olarak doğru olsa da, hesaplama açısından pahalı olabilirler.
  • Tek aşamalı nesne dedektörleri: Aşağıdakiler dahil modern mimariler Ultralytics YOLO11, sınırlayıcı kutuları ve sınıf olasılıklarını tek bir geçişte tahmin eder. Bu yaklaşım aşağıdakiler için optimize edilmiştir gerçek zamanlı çıkarım, ideal bir hız ve doğruluk dengesi. İleriye baktığımızda, Ultralytics şu anda şunları geliştirmektedir Uçtan uca algılamayı daha da iyileştirmeyi amaçlayan YOLO26 verimlilik.

İlgili CV Görevlerinden Ayrılır

Nesne algılamayı benzer nesnelerden ayırmak çok önemlidir bilgisayarla görme görevleri.

  • Görüntü Sınıflandırma: Bir görüntüde ne olduğunu belirler (örneğin, "köpek") ancak nerede olduğunu veya kaç tane olduğunu belirlemez.
  • Örnek Segmentasyonu: Algılama gibi, nesnelerin yerini belirler, ancak bir kutu yerine, nesnenin ana hatlarını çizen piksel mükemmelliğinde bir maske üretir. tam şekli.
  • Nesne Takibi: Bu genişletir algılama, algılanan nesnelere benzersiz bir kimlik atama ve nesnelerin yörüngesini takip etme video kareleri.

Gerçek Dünya Uygulamaları

Nesne algılama, çeşitli sektörlerdeki birçok dönüştürücü teknolojinin arkasındaki motordur.

  • Otonom Sistemler: Otomotiv endüstrisinde, otonom araçlar algılama modellerinden yararlanır yayaları, trafik işaretlerini ve diğer araçları milisaniyeler içinde tanımlayabiliyor. Bu alandaki liderler Waymo ve Tesla Autopilot, aşağıdakilere güveniyor Karmaşık ortamlarda güvenli bir şekilde gezinmek için bu yetenekler.
  • Tıbbi Teşhis: İçinde sağlıkta yapay zeka, tespit modelleri yardımcı oluyor Tümörler veya kırıklar gibi röntgen veya BT taramalarında ilgi çeken bölgeleri vurgulayarak radyologlar. Organizasyonlar Ulusal Sağlık Enstitüleri (NIH) gibi kuruluşlar aktif olarak tıbbi görüntü analizi aşağıdakileri azaltabilir teşhis hataları.
  • Perakende Analitiği: Mağazalar kaldıraç Ödeme süreçlerini otomatikleştirmek için perakendede yapay zeka ve envanteri izlemek. Amazon Go benzeri sistemler şunları kullanır Müşterilerin raflardan hangi ürünleri aldığını track etmek için algılama.

Uygulama Örneği

Aşağıdaki kod parçacığında, önceden eğitilmiş bir YOLO11 modeli kullanılarak nesne algılamanın nasıl gerçekleştirileceği gösterilmektedir ultralytics paketi. Bu basit iş akışı bir model yükler ve bir görüntü üzerinde çıkarım yaparak otobüsler ve insanlar gibi nesneler.

from ultralytics import YOLO

# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")

# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results with bounding boxes and labels
results[0].show()

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın