Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

ImageNet

Yapay zeka araştırmalarını, modellerini ve uygulamalarını güçlendiren, 14 milyondan fazla görüntüyle bilgisayarla görme alanındaki gelişmeleri destekleyen çığır açan veri seti ImageNet'i keşfedin.

ImageNet , görsel nesne tanıma yazılımı araştırmalarında kullanılmak üzere tasarlanmış devasa, yaygın olarak atıfta bulunulan bir görsel veritabanıdır. Hangi nesnelerin resmedildiğini belirtmek için elle açıklanan 14 milyondan fazla görüntü içerir ve Nesnelerin sınırlayıcı kutularla yerleştirildiği bir milyon görüntü. Buna göre düzenlenmiştir WordNet hiyerarşisi, ImageNet görüntüleri belirli kavramlarla eşleştirir veya "synsets", onu eğitim ve değerlendirme için temel bir kaynak haline getirir bilgisayarla görme (CV) modelleri. Muazzam ölçeği ve çeşitlilik, araştırmacıların küçük ölçekli deneylerin ötesine geçmesini sağlayarak, modern bilim çağını etkili bir şekilde başlatmıştır. derin öğrenme (DL).

Görsel Tanımanın Evrimi

ImageNet'ten önce araştırmacılar, derin veri setlerini eğitmek için çok küçük veri setleriyle mücadele ediyorlardı. karşılaşmadan sinir ağları (NN) aşırı uyum. Araştırmacılar tarafından oluşturulan Stanford Vision and Learning Lab, ImageNet bu veri kıtlığı sorununu çözdü. Küresel çapta ün kazanması ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), bir 2010'dan 2017'ye kadar süren yıllık yarışma.

Bu yarışma ünlü mimariler için bir test alanı haline geldi. 2012 yılında AlexNet mimarisi yarışmayı önemli bir farkla kazandı kullanarak Evrişimsel Sinir Ağı (CNN), derin öğrenmenin uygulanabilirliğini kanıtlıyor Grafik İşleme Birimleri (GPU'lar). Sonraki yıllarda daha derin ve daha karmaşık modeller ortaya çıkmıştır. VGG ve ResNet, hangi hata oranlarını daha da düşürdü ve belirli sınıflandırma görevlerinde insan düzeyindeki performansı aştı.

Transfer Öğrenimi ve Ön Eğitim

ImageNet bir veri kümesi olsa da, günümüzde en pratik faydası transfer öğrenme. Derin sinir ağı eğitimi sıfırdan büyük miktarda eğitim verileri ve hesaplama gücü. Bunun yerine, geliştiriciler genellikle ImageNet üzerinde "önceden eğitilmiş" modelleri kullanırlar.

ImageNet , köpek cinslerinden ev eşyalarına kadar 20.000'den fazla kategoriyi kapsadığından, üzerinde eğitilen bir model zengin, üst düzey özellik temsillerini öğrenir. Bu öğrenilen özellikler güçlü bir backbone yeni modeller için. Tarafından Bu önceden eğitilmiş ağırlıklara ince ayar yaparak, geliştiriciler kendi özel veri kümelerinde yüksek doğruluk elde etmek önemli ölçüde daha az görüntü ile.

Gerçek Dünya Uygulamaları

ImageNet 'in etkisi, ImageNet kullanan hemen hemen her sektöre yayılmıştır. yapay zeka (AI).

  1. Tıbbi Teşhis: İçinde tıbbi görüntü analizi, etiketli veriler genellikle az bulunur ve elde edilmesi pahalıdır. Araştırmacılar genel şekilleri tanımlamak için ImageNet üzerinde önceden eğitilmiş modeller kullanmaktadır. dokuları, daha sonra X-ışınlarındaki tümörleri veya kırıkları detect etmek için ince ayar yapın. Bu yaklaşım, tümörlerin ve kırıkların sağlık araçlarında hayat kurtaran yapay zeka.
  2. Akıllı Perakende Sistemleri: Otomatik ödeme sistemleri binlerce ürünü tanımlamaya dayanır. Daha ziyade Mühendisler milyonlarca mısır gevreği kutusu görüntüsü toplamak yerine ImageNet sınıflandırıcılardan yararlanarak temel ürün şekilleri ve markalama. Bu sayede hızlı verimli için model dağıtımı Perakende envanter yönetiminde yapay zeka.

ImageNet Önceden Eğitilmiş Modelleri Kullanma

Geliştiriciler, Ultralytics kütüphanesini kullanarak ImageNet üzerinde önceden eğitilmiş modellere kolayca erişebilirler. Aşağıdaki örnek nasıl yükleneceğini gösterir YOLO11 sınıflandırma modeli, varsayılan olarak ImageNet ağırlıkları ile birlikte gelir ve bir görüntünün sınıfını tahmin etmek için kullanır.

from ultralytics import YOLO

# Load a YOLO11 classification model pre-trained on ImageNet
model = YOLO("yolo11n-cls.pt")

# Run inference on an image (e.g., a picture of a goldfish or bus)
# The model will output the top ImageNet classes and probabilities
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")

ImageNet vs. COCO

ImageNet 'i şu örneklerden ayırmak önemlidir COCO (Common Objects in Context) veri kümesi.

  • ImageNet öncelikle aşağıdakiler için bir ölçüttür görüntü sınıflandırması, burada amaç bir görüntünün tamamına tek bir etiket (örneğin, "tekir kedi") atayabilir. Ek açıklamalar şunlara odaklanır görüntüde ne olduğunu.
  • COCO için standart ölçüttür. nesne algılama ve örnek segmentasyonu. Daha az içerir toplam görüntüler ancak karmaşık ek açıklamalar sunar sınırlayıcı kutular ve piksel bazlı maskeler için çoklu görüntü başına nesne, nesnelerin bulunduğu yere odaklanma.

ImageNet modellere "nasıl göreceklerini" öğretmek için kullanılırken, COCO gibi veri kümeleri modellere nasıl konumlandıracaklarını öğretmek için kullanılır ve karmaşık sahnelerdeki nesneleri ayırabilir. Genellikle, bir modelin kodlayıcısı ImageNet üzerinde eğitilmeden önce ImageNet üzerinde önceden eğitilir. Tespit görevleri için COCO .

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın