Makine öğrenimi için veri etiketlemenin temellerini öğrenin. Nesne algılama gibi temel türleri ve Ultralytics kullanarak iş akışlarını nasıl hızlandırabileceğinizi keşfedin.
Veri etiketleme, görüntüler, video kareleri, metin veya ses gibi ham verileri tanımlama ve bağlam sağlamak için bilgilendirici etiketler veya meta veriler ekleme temel sürecidir. Makine öğrenimi (ML) alanında, algoritmalar fiziksel dünyayı doğal olarak anlayamazlar; onlara rehberlik edecek bir "öğretmen"e ihtiyaç duyarlar. Bu rehberlik, denetimli öğrenme sırasında kullanılan etiketli veri kümeleri şeklinde gelir. Etiketler, modelin tahmin etmeye çalıştığı doğru cevapları temsil eden temel gerçekler olarak işlev görür. Basit bir sınıflandırıcı veya Ultralytics gibi karmaşık bir mimari eğitilirken, bu etiketlerin doğruluğu, tutarlılığı ve kalitesi modelin başarısının temel belirleyicileridir. Ultralytics gibi karmaşık bir mimari eğitilirken, bu etiketlerin doğruluğu, tutarlılığı ve kalitesi
Bu terimler gündelik konuşmalarda sıklıkla birbirinin yerine kullanılır, ancak dikkat edilmesi gereken ince bir fark vardır. "Veri etiketleme" genellikle bir veri parçasına bir kategori veya etiket atama eylemini ifade eder (örneğin, bir e-postayı "spam" olarak etiketlemek). Buna karşılık, veri açıklaması genellikle bilgisayar görüşü (CV) ile daha ilgili olup, sınırlayıcı kutular, çokgenler veya anahtar noktalar kullanılarak nesnelerin kesin sınırlarının belirlenmesi ile ilgilidir. Ancak, çoğu ML işlemleri (MLOps) iş akışında, her iki terim de yüksek kaliteli eğitim verilerinin oluşturulmasını tanımlar.
Etiketleme yöntemi, modelin gerçekleştirmesi gereken göreve göre değişir. Yaygın türler şunlardır:
Veri etiketlemenin kullanışlılığı, yapay zeka kullanan hemen hemen her sektöre yayılmıştır.
Etiketli veri seti oluşturmak, genellikle bir AI projesinin en zaman alıcı kısmıdır. Bu süreç genellikle "Human-in-the-Loop" (HITL) yaklaşımını içerir; bu yaklaşımda, insan anotatörler yüksek doğruluk sağlamak için etiketleri doğrular. Modern iş akışları, veri kümesi yönetimini basitleştiren ve ekiplerin açıklamalar üzerinde işbirliği yapmasına olanak tanıyan Ultralytics gibi araçlardan yararlanır. Aktif öğrenme gibi gelişmiş teknikler de kullanılabilir. Bu teknikte model verileri önceden etiketler ve insanlar yalnızca düşük güvenilirlikteki tahminleri düzeltir, bu da süreci önemli ölçüde hızlandırır.
Aşağıdaki örnek, önceden eğitilmiş bir YOLO26 modelini kullanarak yeni bir görüntü için otomatik olarak etiketler (otomatik etiketleme) oluşturmayı ve bu etiketlerin daha sonra insanlar tarafından düzeltilebilmesini göstermektedir:
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Save the detection results to a text file in standard YOLO format
# This file can now be used as a starting point for data labeling
results[0].save_txt("bus_labels.txt")