Ultralytics YOLO ile görüntü sınıflandırmayı keşfedin: en son araçları kullanarak sağlık, tarım, perakende ve daha fazlası için özel modeller eğitin.
Görüntü sınıflandırma, önceden tanımlanmış bir kategori kümesinden tüm bir görüntüye tek ve belirli bir etiket atamayı içeren bilgisayarla görmede (CV) temel bir görevdir. Birincil amaç, bir görüntünün ana konusunu belirlemek ve buna göre kategorize etmektir. Örneğin, bir sınıflandırma modeli bir görüntüyü analiz eder ve "kedi", "köpek" veya "araba" gibi bir etiket çıktısı verir. Bu görev, çok daha karmaşık CV uygulamalarının temelini oluşturur ve makine öğreniminin (ML) temel bir bileşenidir. Süreç, büyük etiketli veri kümelerinden ayırt edici özellikleri öğrenmek için algoritmalara, özellikle de Evrişimsel Sinir Ağlarına (CNN'ler) dayanır.
Görüntü sınıflandırma modelleri, doğru sınıfla manuel olarak etiketlenmiş çok sayıda görüntünün beslendiği denetimli öğrenme kullanılarak eğitilir. Eğitim sırasında sinir ağı her bir kategoriyle ilişkili desenleri, dokuları, şekilleri ve renk kombinasyonlarını tanımlamayı öğrenir. Bu öğrenme , tahminleri ile gerçek etiketler arasındaki farkı en aza indirmek için modelin dahili parametrelerini veya ağırlıklarını ayarlayan geri yayılım adı verilen bir süreçle gerçekleştirilir.
Modern sınıflandırma modelleri genellikle birçok katmana sahip derin öğrenme mimarileri kullanır. İlk katmanlar kenarlar ve köşeler gibi basit özellikleri tanımayı öğrenebilirken, daha derin katmanlar bunları birleştirerek gözler, tekerlekler veya yüzler gibi daha karmaşık yapıları tanımlayabilir. Ağın son katmanı, her olası sınıf için bir olasılık puanı üretmek üzere tipik olarak bir softmax işlevi kullanır. En yüksek olasılığa sahip sınıf nihai tahmin olarak seçilir. Bu sürecin anahtarı, modelin sınıflandırma görevi için en bilgilendirici özellikleri otomatik olarak öğrendiği özellik çıkarma işlemidir.
Görüntü sınıflandırma, görsel tanıma görevlerini otomatikleştirmek ve ölçeklendirmek için çok sayıda sektörde kullanılmaktadır. Öne çıkan iki örnek şunlardır:
Diğer bilgisayarla görme görevleriyle yakından ilişkili olsa da, görüntü sınıflandırmanın farklı bir amacı vardır. Bunu aşağıdakilerden ayırmak önemlidir:
Özetle, sınıflandırma size bir görüntüde ne olduğunu söyler, algılama size neyin nerede olduğunu söyler ve segmentasyon sahnedeki her şeyin ayrıntılı, piksel düzeyinde bir haritasını sağlar.
Nesne algılama konusunda ünlü olan Ultralytics YOLO modelleri, görüntü sınıflandırma görevlerinde de mükemmeldir. YOLO11 gibi son teknoloji modeller, sezgisel Ultralytics Python paketi veya kodsuz Ultralytics HUB platformu kullanılarak özel veri kümeleri üzerinde kolayca eğitilebilir veya ince ayar yapılabilir.
Belgelerimiz, model eğitim ipuçları ve YOLO11'in görüntü sınıflandırması için nasıl kullanılacağına dair ayrıntılı bir kılavuz da dahil olmak üzere kapsamlı kaynaklar sağlar. Geliştiriciler ImageNet, CIFAR-100 ve Caltech-101 gibi kıyaslama veri kümeleri üzerinde önceden eğitilmiş modellerden yararlanabilir veya sıfırdan yeni bir model eğitebilirler. En son gelişmelerle ilgilenenler için Papers With Code gibi kaynaklar, en iyi performans gösteren modellere kapsamlı bir genel bakış sunar. Ayrıca YOLO model performansını standart kıyaslamalarla da karşılaştırabilirsiniz. PyTorch ve TensorFlow gibi çerçeveler bu modelleri oluşturmak ve eğitmek için temel sağlar.