YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

ImageNet

Yapay zeka araştırmalarını, modellerini ve uygulamalarını güçlendiren 14M+'dan fazla görüntüyle bilgisayarlı görü gelişmelerini destekleyen çığır açan veri kümesi ImageNet'i keşfedin.

ImageNet, hangi nesneleri resmettiğini belirtmek için elle etiketlenmiş 14 milyondan fazla görüntüden oluşan, kamuya açık devasa bir veri kümesidir. WordNet hiyerarşisine göre düzenlenmiş olup, "balon" veya "çilek" gibi tipik bir kategori birkaç yüz görüntüden oluşmak üzere 20.000'den fazla kategori içerir. Bu geniş ve çeşitli koleksiyon, bilgisayar görüşü (CV) ve derin öğrenme (DL) alanlarını ilerletmede etkili olmuş ve modelleri eğitmek ve kıyaslamak için bir standart görevi görmüştür.

Stanford Üniversitesi'ndeki araştırmacılar tarafından ImageNet'in oluşturulması, yapay zeka (AI) için çok önemli bir andı. ImageNet'ten önce, veri kümeleri genellikle karmaşık sinir ağlarını (NN) etkili bir şekilde eğitmek için çok küçüktü ve bu da aşırı uyum gibi sorunlara yol açıyordu. ImageNet, derin modelleri eğitmek için gereken ölçeği sağlayarak modern AI devriminin önünü açtı. Orijinal ImageNet araştırma makalesini okuyarak daha fazla bilgi edinebilirsiniz.

Imagenet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC)

ImageNet'in etkisi, 2010'dan 2017'ye kadar düzenlenen yıllık bir yarışma olan ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC) ile arttı. Bu yarışma, bilgisayar görüşü algoritmalarının performansını değerlendirmek için çok önemli bir ölçüt haline geldi. 2012'de AlexNet adlı bir evrişimsel sinir ağı (CNN), önceki tüm modellerden önemli ölçüde daha iyi performans göstererek çığır açan bir zafer elde etti. Bu başarı, derin öğrenme ve GPU hesaplamasının gücünü göstererek alanda bir inovasyon dalgası başlattı. ILSVRC, birçok modern mimarinin geliştirilmesinde önemli bir etken olmuştur ve günümüz modellerinin çeşitli kıyaslamalarda nasıl performans gösterdiğini Papers with Code gibi sitelerde görebilirsiniz.

Imagenet'in Gerçek Dünya Uygulamaları

ImageNet'in birincil kullanım amacı, modelleri önceden eğitmek için bir kaynak olmasıdır. Bir model bu geniş veri kümesi üzerinde eğitilerek zengin bir görsel özellik kümesini tanımayı öğrenir. Bu bilgi daha sonra yeni ve daha özel görevlere aktarılabilir. Bu teknik, transfer öğrenimi olarak bilinir.

  1. Tıbbi Görüntüleme Analizi: Bir Ultralytics YOLO modeli gibi ImageNet üzerinde önceden eğitilmiş bir model, tümörler gibi belirli durumları tespit etmek için çok daha küçük, özel bir tıbbi tarama veri kümesi üzerinde ince ayar yapılabilir. ImageNet üzerindeki ilk eğitim, etiketli verilerin kıt olduğu tıbbi görüntü analizi görevlerinde yüksek doğruluk elde etmek için çok önemli olan genel görsel anlayışın güçlü bir temelini sağlar. Bu, sağlık hizmetlerinde yapay zeka için önemli bir uygulamadır.
  2. Perakende Ürün Tanıma: Perakendede, modeller otomatik envanter yönetimi için bir raftaki binlerce farklı ürünü tanımlamak üzere uyarlanabilir. Sıfırdan eğitmek yerine, ImageNet üzerinde önceden eğitilmiş bir model, bir mağazanın belirli ürünlerine hızla uyarlanabilir. Bu, büyük miktarda özel eğitim verisine olan ihtiyacı azaltır ve model dağıtımını hızlandırır. Birçok güçlü perakende yapay zeka çözümü bu yaklaşımdan yararlanır.

Imagenet ve İlgili Kavramlar

ImageNet'i diğer ilgili terimlerden ve veri kümelerinden ayırmak önemlidir:

  • ImageNet - CV Görevleri Karşılaştırması: ImageNet'in kendisi bir veri kümesidir—etiketlenmiş görüntülerden oluşan bir koleksiyon. Bir görev değildir. Bunun yerine, bir görüntüye tek bir etiket atanan görüntü sınıflandırması gibi görevleri gerçekleştiren modelleri eğitmek ve kıyaslamak için kullanılır. Bu, nesneleri sınırlayıcı kutularla konumlandırmayı içeren nesne tespiti veya bir görüntüdeki her pikseli sınıflandıran görüntü segmentasyonundan farklıdır.
  • ImageNet - COCO Karşılaştırması: ImageNet sınıflandırma için altın standart olsa da, diğer bilgisayarlı görü veri kümeleri diğer görevler için daha uygundur. Örneğin, COCO (Bağlamdaki Ortak Nesneler) veri kümesi, nesne tespiti ve örnek segmentasyonu için tercih edilen kıyaslama aracıdır. Bunun nedeni, COCO'nun her görüntüdeki birden çok nesne için sınırlayıcı kutular ve piksel başına segmentasyon maskeleri gibi daha ayrıntılı açıklamalar sağlamasıdır. Buna karşılık, çoğu ImageNet görüntüsü yalnızca tek bir görüntü düzeyi etiketine sahiptir.

YOLO11 gibi modeller, algılama görevleri için COCO üzerinde eğitilmeden önce genellikle sınıflandırma omurgaları için ImageNet üzerinde önceden eğitilir. Bu çok aşamalı eğitim süreci, her iki veri kümesinin de güçlü yönlerinden yararlanır. Model karşılaştırma sayfalarımızda farklı modellerin bu kıyaslamalarda nasıl karşılaştırıldığını görebilirsiniz. Oldukça etkili olmakla birlikte, ImageNet'in bir yapay zeka etiği perspektifinden dikkate alınması önemli olan bilinen veri kümesi önyargıları dahil olmak üzere sınırlamaları olduğunu belirtmekte fayda var.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı