Yapay zeka araştırmalarını, modellerini ve uygulamalarını güçlendiren 14M+'dan fazla görüntüyle bilgisayarlı görü gelişmelerini destekleyen çığır açan veri kümesi ImageNet'i keşfedin.
ImageNet, hangi nesneleri resmettiğini belirtmek için elle etiketlenmiş 14 milyondan fazla görüntüden oluşan, kamuya açık devasa bir veri kümesidir. WordNet hiyerarşisine göre düzenlenmiş olup, "balon" veya "çilek" gibi tipik bir kategori birkaç yüz görüntüden oluşmak üzere 20.000'den fazla kategori içerir. Bu geniş ve çeşitli koleksiyon, bilgisayar görüşü (CV) ve derin öğrenme (DL) alanlarını ilerletmede etkili olmuş ve modelleri eğitmek ve kıyaslamak için bir standart görevi görmüştür.
Stanford Üniversitesi'ndeki araştırmacılar tarafından ImageNet'in oluşturulması, yapay zeka (AI) için çok önemli bir andı. ImageNet'ten önce, veri kümeleri genellikle karmaşık sinir ağlarını (NN) etkili bir şekilde eğitmek için çok küçüktü ve bu da aşırı uyum gibi sorunlara yol açıyordu. ImageNet, derin modelleri eğitmek için gereken ölçeği sağlayarak modern AI devriminin önünü açtı. Orijinal ImageNet araştırma makalesini okuyarak daha fazla bilgi edinebilirsiniz.
ImageNet'in etkisi, 2010'dan 2017'ye kadar düzenlenen yıllık bir yarışma olan ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC) ile arttı. Bu yarışma, bilgisayar görüşü algoritmalarının performansını değerlendirmek için çok önemli bir ölçüt haline geldi. 2012'de AlexNet adlı bir evrişimsel sinir ağı (CNN), önceki tüm modellerden önemli ölçüde daha iyi performans göstererek çığır açan bir zafer elde etti. Bu başarı, derin öğrenme ve GPU hesaplamasının gücünü göstererek alanda bir inovasyon dalgası başlattı. ILSVRC, birçok modern mimarinin geliştirilmesinde önemli bir etken olmuştur ve günümüz modellerinin çeşitli kıyaslamalarda nasıl performans gösterdiğini Papers with Code gibi sitelerde görebilirsiniz.
ImageNet'in birincil kullanım amacı, modelleri önceden eğitmek için bir kaynak olmasıdır. Bir model bu geniş veri kümesi üzerinde eğitilerek zengin bir görsel özellik kümesini tanımayı öğrenir. Bu bilgi daha sonra yeni ve daha özel görevlere aktarılabilir. Bu teknik, transfer öğrenimi olarak bilinir.
ImageNet'i diğer ilgili terimlerden ve veri kümelerinden ayırmak önemlidir:
YOLO11 gibi modeller, algılama görevleri için COCO üzerinde eğitilmeden önce genellikle sınıflandırma omurgaları için ImageNet üzerinde önceden eğitilir. Bu çok aşamalı eğitim süreci, her iki veri kümesinin de güçlü yönlerinden yararlanır. Model karşılaştırma sayfalarımızda farklı modellerin bu kıyaslamalarda nasıl karşılaştırıldığını görebilirsiniz. Oldukça etkili olmakla birlikte, ImageNet'in bir yapay zeka etiği perspektifinden dikkate alınması önemli olan bilinen veri kümesi önyargıları dahil olmak üzere sınırlamaları olduğunu belirtmekte fayda var.