Sözlük

ImageNet

Yapay zeka araştırmalarını, modellerini ve uygulamalarını güçlendiren, 14 milyondan fazla görüntüyle bilgisayarla görme alanındaki gelişmeleri destekleyen çığır açan veri seti ImageNet'i keşfedin.

ImageNet, hangi nesneleri resmettiklerini belirtmek için elle açıklanan 14 milyondan fazla görüntüden oluşan devasa, halka açık bir veri kümesidir. WordNet hiyerarşisine göre düzenlenmiş olan bu veri kümesi 20.000'den fazla kategori içermekte olup "balon" veya "çilek" gibi tipik bir kategori birkaç yüz görüntüden oluşmaktadır. Bu geniş ve çeşitli koleksiyon, bilgisayarla görme (CV) ve derin öğrenme (DL) alanlarının ilerlemesinde etkili olmuş, eğitim ve kıyaslama modelleri için bir standart olarak hizmet vermiştir.

Stanford Üniversitesi 'ndeki araştırmacılar tarafından ImageNet'in oluşturulması yapay zeka (AI) için çok önemli bir andı. ImageNet'ten önce veri kümeleri genellikle karmaşık sinir ağlarını (NN) etkili bir şekilde eğitmek için çok küçüktü ve bu da aşırı uyum gibi sorunlara yol açıyordu. ImageNet, derin modelleri eğitmek için gereken ölçeği sağlayarak modern YZ devriminin önünü açtı. Orijinal ImageNet araştırma makalesini okuyarak daha fazla bilgi edinebilirsiniz.

Imagenet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC)

ImageNet'in etkisi, 2010'dan 2017'ye kadar her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC) ile daha da artmıştır. Bu yarışma, bilgisayarla görme algoritmalarının performansını değerlendirmek için çok önemli bir ölçüt haline geldi. 2012 yılında AlexNet adlı bir konvolüsyonel sinir ağı (CNN), önceki tüm modellerden önemli ölçüde daha iyi performans göstererek çığır açan bir zafer elde etti. Bu başarı, derin öğrenmenin ve GPU hesaplamasının gücünü ortaya koyarak bu alanda bir yenilik dalgası başlattı. ILSVRC, birçok modern mimarinin geliştirilmesinde önemli bir itici güç olmuştur ve Papers with Code gibi sitelerde günümüz modellerinin çeşitli kıyaslamalarda nasıl performans gösterdiğini görebilirsiniz.

Imagenet'in Gerçek Dünya Uygulamaları

ImageNet'in birincil kullanımı, modellerin ön eğitimi için bir kaynaktır. Bir model bu geniş veri kümesi üzerinde eğitilerek zengin bir görsel özellikler kümesini tanımayı öğrenir. Bu bilgi daha sonra yeni, daha spesifik görevlere aktarılabilir. Bu teknik transfer öğrenme olarak bilinir.

  1. Tıbbi Görüntüleme Analizi: Ultralytics YOLO modeli gibi ImageNet üzerinde önceden eğitilmiş bir model, tümörler gibi belirli durumları tespit etmek için tıbbi taramalardan oluşan çok daha küçük, özel bir veri kümesi üzerinde ince ayar yapılabilir. ImageNet üzerindeki ilk eğitim, etiketli verilerin az olduğu tıbbi görüntü analizi görevlerinde yüksek doğruluk elde etmek için çok önemli olan güçlü bir genel görsel anlayış temeli sağlar. Bu, sağlık hizmetlerinde yapay zeka için önemli bir uygulamadır.
  2. Perakende Ürün Tanıma: Perakende sektöründe modeller, otomatik envanter yönetimi için bir raftaki binlerce farklı ürünü tanımlayacak şekilde uyarlanabilir. Sıfırdan eğitim yerine, ImageNet üzerinde önceden eğitilmiş bir model, bir mağazanın belirli ürünlerine hızlı bir şekilde uyarlanabilir. Bu, büyük miktarlarda özel eğitim verisi ihtiyacını azaltır ve model dağıtımını hızlandırır. Perakendede birçok güçlü yapay zeka çözümü bu yaklaşımdan yararlanır.

Imagenet ve İlgili Kavramlar

ImageNet'i diğer ilgili terimlerden ve veri kümelerinden ayırmak önemlidir:

  • ImageNet ve CV Görevleri: ImageNet'in kendisi bir veri kümesidir-etiketligörüntülerden oluşan bir koleksiyon. Bir görev değildir. Bunun yerine, bir görüntüye tek bir etiketin atandığı görüntü sınıflandırma gibi görevleri yerine getiren modelleri eğitmek ve karşılaştırmak için kullanılır. Bu, nesneleri sınırlayıcı kutularla bulmayı içeren nesne tespitinden veya bir görüntüdeki her pikseli sınıflandıran görüntü segmentasyonundan farklıdır.
  • ImageNet vs. COCO: ImageNet sınıflandırma için altın standart olsa da, diğer bilgisayarla görme veri kümeleri diğer görevler için daha uygundur. Örneğin COCO (Common Objects in Context) veri kümesi, nesne algılama ve örnek segmentasyonu için tercih edilen ölçüttür. Bunun nedeni, COCO'nun her görüntüdeki birden fazla nesne için sınırlayıcı kutular ve piksel başına segmentasyon maskeleri gibi daha ayrıntılı ek açıklamalar sağlamasıdır. Buna karşılık, ImageNet görüntülerinin çoğunda yalnızca görüntü düzeyinde tek bir etiket vardır.

YOLO11 gibi modeller, tespit görevleri için COCO üzerinde eğitilmeden önce genellikle sınıflandırma omurgası için ImageNet üzerinde önceden eğitilir. Bu çok aşamalı eğitim süreci, her iki veri kümesinin güçlü yönlerinden yararlanır. Model karşılaştırma sayfalarımızda farklı modellerin bu ölçütlerde nasıl karşılaştırıldığını görebilirsiniz. Oldukça etkili olmakla birlikte, ImageNet'in yapay zeka etiği açısından dikkate alınması gereken bilinen veri seti önyargıları da dahil olmak üzere sınırlamaları olduğunu belirtmek gerekir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı