Makine öğreniminde veri etiketlemenin kritik rolünü, sürecini, zorluklarını ve yapay zeka geliştirmedeki gerçek dünya uygulamalarını keşfedin.
Veri etiketleme, bir veri kümesi oluşturmak için ham verileri anlamlı bir bağlamla etiketleme veya açıklama ekleme temel sürecidir eğitim için uygun makine öğrenimi (ML) modelleri. Bu bağlamda denetimli öğrenme, algoritmalar şunları gerektirir Hem girdi verilerini (görüntü gibi) hem de beklenen çıktıyı (etiket) içeren örnekler. Bu etiketli bilgi, temel gerçek olarak hizmet eder ve Modelin tahminlerinin ölçüldüğü ve geliştirildiği kesin standart. Yüksek kaliteli etiketleme olmadan, gibi en sofistike mimariler bile Ultralytics YOLO11, doğru bir şekilde tanımayı öğrenemez örüntüler veya nesneleri tanımlama.
Herhangi bir yapay zeka sisteminin performansı, ayrılmaz bir şekilde sistemin kalitesiyle bağlantılıdır. eğitim verileri. Etiketler tutarsızsa, Kesin olmayan veya yanlış, model hatalı ilişkilendirmeler öğrenecektir - bilgisayar biliminde yaygın olarak bilinen bir sorun "Çöp girer, çöp çıkar." Hassas etiketleme, modellerin yeni, görülmemiş verilere iyi genelleme yapmasını sağlar. sağlam dağıtım için çok önemlidir bilgisayarla görme (CV) uygulamaları. Binbaşı gibi kıyaslama veri setleri COCO veri seti ve ImageNet tam olarak endüstri standartları haline geldi kapsamlı ve dikkatli etiketlemeleri nedeniyle.
Özel veri etiketleme yöntemi büyük ölçüde amaçlanan bilgisayarla görme görevine bağlıdır:
Veri etiketleme, yapay zekanın karmaşık, gerçek dünya ortamlarında çalışmasını sağlar. Öne çıkan iki örnek şunlardır:
Etiketlemeyi veri hazırlama hattında kullanılan benzer terimlerden ayırmak faydalı olacaktır:
Manuel etiketleme zaman alıcı olsa da, modern iş akışlarında genellikle aşağıdaki gibi özel yazılımlar kullanılır CVAT (Computer Vision Annotation Tool) veya kaldıraç süreci hızlandırmak için aktif öğrenme. Bu Yaklaşan Ultralytics Platformu tüm bu süreci kolaylaştırmak için tasarlanmıştır. yaşam döngüsü, veri kaynağından otomatik notlandırmaya kadar.
Aşağıdaki Python kod parçacığı, önceden etiketlenmiş bir veri kümesi kullanarak bir YOLO11 modelinin nasıl eğitileceğini göstermektedir
(coco8.yaml). Eğitim süreci tamamen, eğitim programında tanımlanan doğru etiketlerin varlığına dayanır.
veri kümesi yapılandırma dosyası.
from ultralytics import YOLO
# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset
# The dataset YAML file contains paths to images and their corresponding labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
# The model updates its weights based on the labeled data provided
