Yapay zeka araştırmalarını, modellerini ve uygulamalarını güçlendiren, 14 milyondan fazla görüntüyle bilgisayarla görme alanındaki gelişmeleri destekleyen çığır açan veri seti ImageNet'i keşfedin.
ImageNet, hangi nesneleri resmettiklerini belirtmek için elle açıklanan 14 milyondan fazla görüntüden oluşan devasa, halka açık bir veri kümesidir. WordNet hiyerarşisine göre düzenlenmiş olan bu veri kümesi 20.000'den fazla kategori içermekte olup "balon" veya "çilek" gibi tipik bir kategori birkaç yüz görüntüden oluşmaktadır. Bu geniş ve çeşitli koleksiyon, bilgisayarla görme (CV) ve derin öğrenme (DL) alanlarının ilerlemesinde etkili olmuş, eğitim ve kıyaslama modelleri için bir standart olarak hizmet vermiştir.
Stanford Üniversitesi 'ndeki araştırmacılar tarafından ImageNet'in oluşturulması yapay zeka (AI) için çok önemli bir andı. ImageNet'ten önce veri kümeleri genellikle karmaşık sinir ağlarını (NN) etkili bir şekilde eğitmek için çok küçüktü ve bu da aşırı uyum gibi sorunlara yol açıyordu. ImageNet, derin modelleri eğitmek için gereken ölçeği sağlayarak modern YZ devriminin önünü açtı. Orijinal ImageNet araştırma makalesini okuyarak daha fazla bilgi edinebilirsiniz.
ImageNet'in etkisi, 2010'dan 2017'ye kadar her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC) ile daha da artmıştır. Bu yarışma, bilgisayarla görme algoritmalarının performansını değerlendirmek için çok önemli bir ölçüt haline geldi. 2012 yılında AlexNet adlı bir konvolüsyonel sinir ağı (CNN), önceki tüm modellerden önemli ölçüde daha iyi performans göstererek çığır açan bir zafer elde etti. Bu başarı, derin öğrenmenin ve GPU hesaplamasının gücünü ortaya koyarak bu alanda bir yenilik dalgası başlattı. ILSVRC, birçok modern mimarinin geliştirilmesinde önemli bir itici güç olmuştur ve Papers with Code gibi sitelerde günümüz modellerinin çeşitli kıyaslamalarda nasıl performans gösterdiğini görebilirsiniz.
ImageNet'in birincil kullanımı, modellerin ön eğitimi için bir kaynaktır. Bir model bu geniş veri kümesi üzerinde eğitilerek zengin bir görsel özellikler kümesini tanımayı öğrenir. Bu bilgi daha sonra yeni, daha spesifik görevlere aktarılabilir. Bu teknik transfer öğrenme olarak bilinir.
ImageNet'i diğer ilgili terimlerden ve veri kümelerinden ayırmak önemlidir:
YOLO11 gibi modeller, tespit görevleri için COCO üzerinde eğitilmeden önce genellikle sınıflandırma omurgası için ImageNet üzerinde önceden eğitilir. Bu çok aşamalı eğitim süreci, her iki veri kümesinin güçlü yönlerinden yararlanır. Model karşılaştırma sayfalarımızda farklı modellerin bu ölçütlerde nasıl karşılaştırıldığını görebilirsiniz. Oldukça etkili olmakla birlikte, ImageNet'in yapay zeka etiği açısından dikkate alınması gereken bilinen veri seti önyargıları da dahil olmak üzere sınırlamaları olduğunu belirtmek gerekir.