Yapay zeka araştırmalarını, modellerini ve uygulamalarını güçlendiren, 14 milyondan fazla görüntüyle bilgisayarla görme alanındaki gelişmeleri destekleyen çığır açan veri seti ImageNet'i keşfedin.
ImageNet , görsel nesne tanıma yazılımı araştırmalarında kullanılmak üzere tasarlanmış devasa, yaygın olarak atıfta bulunulan bir görsel veritabanıdır. Hangi nesnelerin resmedildiğini belirtmek için elle açıklanan 14 milyondan fazla görüntü içerir ve Nesnelerin sınırlayıcı kutularla yerleştirildiği bir milyon görüntü. Buna göre düzenlenmiştir WordNet hiyerarşisi, ImageNet görüntüleri belirli kavramlarla eşleştirir veya "synsets", onu eğitim ve değerlendirme için temel bir kaynak haline getirir bilgisayarla görme (CV) modelleri. Muazzam ölçeği ve çeşitlilik, araştırmacıların küçük ölçekli deneylerin ötesine geçmesini sağlayarak, modern bilim çağını etkili bir şekilde başlatmıştır. derin öğrenme (DL).
ImageNet'ten önce araştırmacılar, derin veri setlerini eğitmek için çok küçük veri setleriyle mücadele ediyorlardı. karşılaşmadan sinir ağları (NN) aşırı uyum. Araştırmacılar tarafından oluşturulan Stanford Vision and Learning Lab, ImageNet bu veri kıtlığı sorununu çözdü. Küresel çapta ün kazanması ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), bir 2010'dan 2017'ye kadar süren yıllık yarışma.
Bu yarışma ünlü mimariler için bir test alanı haline geldi. 2012 yılında AlexNet mimarisi yarışmayı önemli bir farkla kazandı kullanarak Evrişimsel Sinir Ağı (CNN), derin öğrenmenin uygulanabilirliğini kanıtlıyor Grafik İşleme Birimleri (GPU'lar). Sonraki yıllarda daha derin ve daha karmaşık modeller ortaya çıkmıştır. VGG ve ResNet, hangi hata oranlarını daha da düşürdü ve belirli sınıflandırma görevlerinde insan düzeyindeki performansı aştı.
ImageNet bir veri kümesi olsa da, günümüzde en pratik faydası transfer öğrenme. Derin sinir ağı eğitimi sıfırdan büyük miktarda eğitim verileri ve hesaplama gücü. Bunun yerine, geliştiriciler genellikle ImageNet üzerinde "önceden eğitilmiş" modelleri kullanırlar.
ImageNet , köpek cinslerinden ev eşyalarına kadar 20.000'den fazla kategoriyi kapsadığından, üzerinde eğitilen bir model zengin, üst düzey özellik temsillerini öğrenir. Bu öğrenilen özellikler güçlü bir backbone yeni modeller için. Tarafından Bu önceden eğitilmiş ağırlıklara ince ayar yaparak, geliştiriciler kendi özel veri kümelerinde yüksek doğruluk elde etmek önemli ölçüde daha az görüntü ile.
ImageNet 'in etkisi, ImageNet kullanan hemen hemen her sektöre yayılmıştır. yapay zeka (AI).
Geliştiriciler, Ultralytics kütüphanesini kullanarak ImageNet üzerinde önceden eğitilmiş modellere kolayca erişebilirler. Aşağıdaki örnek nasıl yükleneceğini gösterir YOLO11 sınıflandırma modeli, varsayılan olarak ImageNet ağırlıkları ile birlikte gelir ve bir görüntünün sınıfını tahmin etmek için kullanır.
from ultralytics import YOLO
# Load a YOLO11 classification model pre-trained on ImageNet
model = YOLO("yolo11n-cls.pt")
# Run inference on an image (e.g., a picture of a goldfish or bus)
# The model will output the top ImageNet classes and probabilities
results = model("https://ultralytics.com/images/bus.jpg")
# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")
ImageNet 'i şu örneklerden ayırmak önemlidir COCO (Common Objects in Context) veri kümesi.
ImageNet modellere "nasıl göreceklerini" öğretmek için kullanılırken, COCO gibi veri kümeleri modellere nasıl konumlandıracaklarını öğretmek için kullanılır ve karmaşık sahnelerdeki nesneleri ayırabilir. Genellikle, bir modelin kodlayıcısı ImageNet üzerinde eğitilmeden önce ImageNet üzerinde önceden eğitilir. Tespit görevleri için COCO .
