Veri Etiketleme
Veri etiketleme nedir? Sınırlandırma kutuları veya poligonlarla veri etiketlemenin, doğru yapay zeka ve bilgisayarlı görü modellerini eğitmek için nasıl gerekli olduğunu öğrenin.
Veri etiketleme, makine öğrenimi (ML) modelinin
öğrenmesi için gerekli olan bağlamı sağlamak üzere ham verileri etiketleme, işaretleme veya transkripsiyonlama gibi kritik bir süreçtir.
Bu adım, algoritmaların
giriş-çıkış çiftleri üzerinde eğitilerek kalıpları tanıması ve tahminlerde bulunması için kullanılan bir yöntem olan
denetimli öğrenmenin temel taşıdır. Etiketlenen bilgiler, modelin
taklit etmeye çalıştığı ideal sonucu temsil eden
temel gerçek olarak işlev görür. Kesin ve tutarlı bir açıklama olmadan, Ultralytics gibi gelişmiş mimariler bile
etkin bir şekilde çalışamaz, çünkü
sistemin doğruluğu,
eğitim verilerinin kalitesine doğrudan bağlıdır.
Bilgisayar Görmesinde Yaygın Anotasyon Türleri
Bilgisayar görme (CV) alanında, veri
anotasyonu, görüntüler veya video kareleri içindeki belirli özellikleri işaretlemeyi içerir. Kullanılan yöntem, büyük ölçüde
modelin gerçekleştirmek üzere oluşturulduğu belirli göreve bağlıdır.
-
Nesne Algılama: Anotatörler
araçlar veya yayalar gibi ilgi çekici nesnelerin etrafına 2D sınırlayıcı kutular çizerler.
Bu, modele nesnenin ne olduğunu ve sahnede nerede bulunduğunu öğretir.
-
Örnek Segmentasyon:
Bu teknik, bir nesnenin kenarları etrafında hassas çokgenler çizmeyi içerir. Basit kutulardan farklı olarak, segmentasyon
robotik kavrama gibi yüksek hassasiyet gerektiren görevler için hayati önem taşıyan
kesin şekli ve konturu haritalandırır.
-
Poz Tahmini: Anotatörler, bir nesnenin belirli kilit noktalarını, örneğin insan vücudunun eklemlerini (dirsekler, dizler, omuzlar) işaretler. Bu, modellerin track , duruşu track ve hatta atletik performansı analiz etmesine olanak tanır.
-
Görüntü Sınıflandırması: Bu
en basit biçimdir ve tek bir kategori etiketi (örneğin, "sağlıklı yaprak" ve "hastalıklı yaprak")
tüm görüntüye atanır.
Gerçek Dünya Uygulamaları
Veri açıklamaları, çeşitli endüstrilerde ham sensör verileri ile akıllı karar verme arasında köprü görevi görür.
-
Akıllı Tarım:
Tarımda yapay zeka, yabani otları, zararlıları veya besin eksikliklerini tanımlamak için geniş mahsul
görüntü veri setlerini açıklamalı hale getirir. Bu verilerle modelleri eğiterek, çiftçiler
mahsul izlemeyi otomatikleştirebilir ve sadece gerekli yerlerde işlem uygulayabilir, böylece israfı azaltıp verimi artırabilirler.
-
Otonom Sürüş: Otonom araçlar, her şerit
işareti, trafik işareti ve engelin etiketlendiği büyük boyutlu açıklamalı veri kütüphanelerine dayanır. Kameralardan ve
LiDAR sensörlerinden gelen veriler, aracın algılama
sistemini eğitmek için işlenir ve böylece aracın karmaşık trafik senaryolarında güvenli bir şekilde yol alması sağlanır.
İlgili Kavramları Ayırt Etme
Veri anotasyonunu, veri kümesi hazırlama iş akışında sıklıkla kullanılan diğer terimlerden ayırmak yararlıdır.
-
Anotasyon ve Veri Etiketleme:
Sıklıkla birbirinin yerine kullanılmasına rağmen, "etiketleme" genellikle daha basit sınıflandırma görevlerini (etiket atama) ifade ederken, "anotasyon" karmaşık geometri çizme veya videoda zaman damgası işaretleme gibi daha zengin meta veri üretimi anlamına gelir.
-
Anotasyon ve Veri Artırma:
Anotasyon, ilk temel gerçeği oluşturur. Artırma, modelin sağlamlığını artırmak için mevcut anotasyonlu görüntülere dönüşümler (dönüş veya renk kaymaları gibi) uygulayarak veri setini yapay olarak genişleten bir sonraki süreçtir.
-
Anotasyon ve Aktif Öğrenme:
Aktif öğrenme, modelin en kafa karıştırıcı bulduğu belirli veri noktalarını belirlediği ve
sadece bu örnekler için insan anotasyonu talep ettiği, anotasyon sürecinin zaman ve maliyetini optimize eden bir stratejidir.
Araçlar ve İş Akışı
Yüksek kaliteli açıklamalar oluşturmak için genellikle
JSON veya XML gibi standart formatlarda veri dışa aktaran özel yazılımlar gerekir. Modern iş akışları
, veri kaynağı, otomatik açıklama ve
model eğitimi işlemlerini tek bir arayüzde kolaylaştıran
Ultralytics gibi entegre ortamlara doğru giderek daha fazla yönelmektedir.
Veriler anotlandıktan sonra, eğitim için bir yapılandırma dosyasında (genellikle YAML) referanslanır. Aşağıdaki örnek,
önceden mevcut anotlamalarla birlikte gelen standart
COCO8 kullanarak bir YOLO26 modelinin nasıl eğitileceğini göstermektedir
.
from ultralytics import YOLO
# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")
# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)