Ultralytics YOLO ile görüntü sınıflandırmayı keşfedin: en son araçları kullanarak sağlık, tarım, perakende ve daha fazlası için özel modeller eğitin.
Görüntü sınıflandırma, bilgisayar görüşünde (CV) temel bir görevdir ve önceden tanımlanmış bir kategori kümesinden tüm bir görüntüye tek, belirli bir etiket atamayı içerir. Temel amaç, bir görüntünün ana konusunu tanımlamak ve buna göre kategorize etmektir. Örneğin, bir sınıflandırma modeli bir görüntüyü analiz eder ve "kedi", "köpek" veya "araba" gibi bir etiket çıkarır. Bu görev, daha karmaşık birçok CV uygulaması için temel oluşturur ve makine öğreniminin (ML) temel bir bileşenidir. Süreç, büyük etiketli veri kümelerinden ayırt edici özellikleri öğrenmek için algoritmalar, özellikle de Evrişimsel Sinir Ağları (CNN'ler) üzerine kuruludur.
Görüntü sınıflandırma modelleri, denetimli öğrenme kullanılarak eğitilir; burada, doğru sınıfla zaten manuel olarak etiketlenmiş çok sayıda görüntüyle beslenirler. Eğitim sırasında, sinir ağı her kategoriyle ilişkili desenleri, dokuları, şekilleri ve renk kombinasyonlarını öğrenir. Bu öğrenme, modelin tahminleri ile gerçek etiketler arasındaki farkı en aza indirmek için modelin iç parametrelerini veya ağırlıklarını ayarlayan geri yayılım adı verilen bir işlemle elde edilir.
Modern sınıflandırma modelleri genellikle birçok katmana sahip derin öğrenme mimarileri kullanır. Erken katmanlar kenarlar ve köşeler gibi basit özellikleri tanımayı öğrenebilirken, daha derin katmanlar bunları birleştirerek gözler, tekerlekler veya yüzler gibi daha karmaşık yapıları tanımlar. Ağın son katmanı tipik olarak her olası sınıf için bir olasılık puanı üretmek üzere bir softmax fonksiyonu kullanır. En yüksek olasılığa sahip sınıf, nihai tahmin olarak seçilir. Bu sürecin anahtarı, modelin sınıflandırma görevi için en bilgilendirici özellikleri otomatik olarak öğrendiği özellik çıkarımıdır.
Görüntü sınıflandırma, görsel tanıma görevlerini otomatikleştirmek ve ölçeklendirmek için çok sayıda endüstride kullanılmaktadır. İki önemli örnek şunlardır:
Diğer bilgisayarlı görü görevleriyle yakından ilişkili olmasına rağmen, görüntü sınıflandırması farklı bir amaca sahiptir. Aşağıdakilerden ayırt etmek önemlidir:
Özetle, sınıflandırma bir görüntüde ne olduğunu söyler, tespit ne ve nerede olduğunu söyler ve segmentasyon sahnedeki her şeyin ayrıntılı, piksel düzeyinde bir haritasını sağlar.
Ultralytics YOLO modelleri nesne tespiti ile ünlü olmasına rağmen, görüntü sınıflandırma görevlerinde de başarılıdır. YOLO11 gibi son teknoloji modeller, sezgisel Ultralytics Python paketi veya kodsuz Ultralytics HUB platformu kullanılarak özel veri kümeleri üzerinde kolayca eğitilebilir veya ince ayar yapılabilir.
Belgelerimiz, model eğitimi ipuçları ve YOLO11'i görüntü sınıflandırması için kullanma hakkında ayrıntılı bir kılavuz dahil olmak üzere kapsamlı kaynaklar sunar. Geliştiriciler, ImageNet, CIFAR-100 ve Caltech-101 gibi kıyaslama veri kümelerinde önceden eğitilmiş modellerden yararlanabilir veya sıfırdan yeni bir model eğitebilir. En son gelişmelerle ilgilenenler için, Papers With Code gibi kaynaklar, en iyi performans gösteren modellere kapsamlı bir genel bakış sunar. Ayrıca, standart kıyaslamalarda YOLO model performansını karşılaştırabilirsiniz. PyTorch ve TensorFlow gibi çerçeveler, bu modelleri oluşturmak ve eğitmek için temel sağlar.