YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Veri Etiketleme

Makine öğreniminde veri etiketlemenin kritik rolünü, sürecini, zorluklarını ve yapay zeka geliştirmedeki gerçek dünya uygulamalarını keşfedin.

Veri etiketleme, ham verileri (görüntüler, metin dosyaları veya videolar gibi) tanımlama ve bir makine öğrenimi modelinin bunlardan öğrenmesini sağlamak için bir veya daha fazla bilgilendirici etiket veya açıklama ekleme işlemidir. Bu işlem, etiketlenmiş veri kümesinin algoritmanın yeni, etiketlenmemiş veriler üzerinde doğru tahminler yapmak için kendini eğitmek için kullandığı "gerçek değer" olarak işlev gördüğü denetimli öğrenme için temeldir. Yüksek kaliteli veri etiketleme, sağlam bir yapay zeka modeli oluşturmada en kritik ve zaman alıcı adımlardan biridir, çünkü modelin performansı doğrudan öğrendiği etiketlerin kalitesine ve doğruluğuna bağlıdır.

Veri Etiketleme Neden Önemli?

Veri etiketleme, modellerin dünyayı anlaması ve yorumlaması için gerekli temeli sağlar. Bilgisayarlı görüde (CV), etiketler bir modele bir nesnenin ne olduğunu ve bir görüntü içinde nerede bulunduğunu öğretir. Doğru etiketler olmadan, bir model görevini yerine getirmek için gereken kalıpları öğrenemez, bu da düşük doğruluğa ve güvenilirliğe yol açar. Etiketleme yoluyla oluşturulan eğitim verilerinin kalitesi, elde edilen yapay zekanın kalitesini doğrudan belirler. Bu ilke genellikle "çöp girerse, çöp çıkar" şeklinde özetlenir. COCO ve ImageNet gibi iyi etiketlenmiş kıyaslama veri kümeleri, bilgisayarlı görüdeki son teknolojinin geliştirilmesinde etkili olmuştur.

Bilgisayarlı Görüde Veri Etiketleme Türleri

Farklı CV görevleri, farklı türde etiketleme gerektirir. En yaygın yöntemler şunlardır:

  • Görüntü Sınıflandırma: En basit biçimi, içeriğini tanımlamak için tüm bir görüntüye tek bir etiket atanır (örneğin, "kedi", "köpek"). Bu görev için CIFAR-100 gibi veri kümelerini keşfedebilirsiniz.
  • Nesne Tespiti: Bir görüntüdeki her ilgi çekici nesnenin etrafına bir sınırlayıcı kutu çizilmesi ve ona bir sınıf etiketi atanmasını içerir. Bu, modele hem nesnenin ne olduğunu hem de nerede olduğunu söyler.
  • Görüntü Bölütleme: Bir nesnenin tam şeklini piksel düzeyinde ana hatlarıyla belirtmeyi içeren daha ayrıntılı bir yöntem. Bu, aynı sınıftaki tüm nesnelerin tek bir maskeyi paylaştığı semantik bölütleme ve her bir nesne örneğinin ayrı ayrı bölümlere ayrıldığı örnek bölütleme olarak daha da ayrılabilir.
  • Poz Tahmini (Pose Estimation): Bu teknik, kilit noktaları etiketleyerek nesnelerin konumunu ve yönünü tanımlar. Örneğin, insan poz tahmini işleminde, kilit noktalar dirsekler, dizler ve bilekler gibi eklemleri işaretler. COCO Kilit Noktaları veri kümesi bu görev için popüler bir kaynaktır.

Gerçek Dünya Uygulamaları

  1. Otonom Araçlar: Veri etiketleme, sürücüsüz otomobillerin algılama sistemlerini eğitmek için çok önemlidir. İnsan etiketleyiciler, milyonlarca görüntü ve video karesini titizlikle etiketleyerek arabaların, yayaların ve bisikletlilerin etrafına sınırlayıcı kutular çizer, şerit işaretlerini bölümlere ayırır ve trafik işaretlerini sınıflandırır. Bu zengin, etiketlenmiş veriler, Ultralytics YOLO11 gibi modellerin karmaşık kentsel ortamlarda güvenli bir şekilde gezinmeyi öğrenmesini sağlar. Waymo gibi şirketlerin yaptığı çalışmalar büyük ölçüde geniş ve doğru bir şekilde etiketlenmiş veri kümelerine dayanmaktadır. Bu alan hakkında daha fazla bilgiyi Otomotivde Yapay Zeka çözümleri sayfamızda bulabilirsiniz.
  2. Tıbbi Görüntü Analizi: Sağlık hizmetlerinde yapay zeka alanında, radyologlar ve tıp uzmanları, tümörleri, lezyonları ve diğer anormallikleri belirlemek için MR'lar, BT'ler ve röntgenler gibi taramaları etiketler. Örneğin, bir beyin tümörü veri kümesinde, uzmanlar bir tümörün kesin sınırlarını çizer. Bu etiketli veriler, erken teşhise yardımcı olabilecek, potansiyel olarak tıp uzmanlarının iş yükünü azaltan ve hasta sonuçlarını iyileştiren modelleri eğitmek için kullanılır. Kuzey Amerika Radyoloji Derneği (RSNA), yapay zekanın tıbbi teşhisteki rolünü aktif olarak araştırmaktadır.

Veri Etiketleme ve İlgili Kavramlar

Veri etiketleme genellikle diğer veri hazırlama görevleriyle birlikte yapılır, ancak aralarındaki ayrımı yapmak önemlidir:

  • Veri Artırımı (Data Augmentation): Bu teknik, halihazırda etiketlenmiş verilerin değiştirilmiş versiyonlarını (örneğin, bir görüntüyü döndürmek, çevirmek veya parlaklığını değiştirmek) oluşturarak eğitim veri kümesini yapay olarak genişletir. Artırma, veri çeşitliliğini artırır ancak etiketlenmiş bir başlangıç veri kümesine bağlıdır. Veri artırmaya genel bir bakış daha fazla ayrıntı sunar.
  • Veri Temizleme (Data Cleaning): Bu işlem, bir veri kümesindeki hataları, tutarsızlıkları ve yanlışlıkları belirlemeyi ve düzeltmeyi veya kaldırmayı içerir. Bu, yanlış etiketleri düzeltmeyi içerebilse de, veri temizleme bir kalite güvence adımıdır, oysa veri etiketleme, etiketlerin oluşturulmasının ilk eylemidir. Wikipedia'daki veri temizleme daha fazla bağlam sunar.
  • Veri Ön İşleme (Data Preprocessing): Bu, veri etiketleme, temizleme ve bir modeli hazırlamak için normalleştirme veya görüntüleri yeniden boyutlandırma gibi diğer dönüşümleri kapsayan daha geniş bir terimdir. Etiketleme, daha büyük ön işleme hattı içinde belirli, kritik bir adımdır.

Zorluklar ve Çözümler

Önemi tartışılmaz olsa da, veri etiketleme yüksek maliyetler, önemli zaman yatırımı ve insan hatası veya sübjektiflik potansiyeli gibi zorluklarla doludur. Geniş etiketleyici ekipleri arasında etiket kalitesini ve tutarlılığını sağlamak büyük bir lojistik engeldir.

Bu süreci kolaylaştırmak için ekipler genellikle CVAT gibi özel etiketleme araçlarını veya veri kümelerini ve etiketleme iş akışlarını yönetmek için işbirliğine dayalı bir ortam sağlayan Ultralytics HUB gibi platformları kullanır. Ayrıca, Aktif Öğrenme gibi gelişmiş teknikler, etiketlenecek en bilgilendirici veri noktalarını akıllıca seçerek insan etiketleyicilerin zaman ve çabalarının kullanımını optimize etmeye yardımcı olabilir. Bir Stanford AI Lab makalesinde ayrıntılı olarak açıklandığı gibi, veri kalitesine odaklanmak, başarılı bir yapay zeka için anahtardır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı