Veri Etiketleme
Veri etiketleme nedir? Sınırlandırma kutuları veya poligonlarla veri etiketlemenin, doğru yapay zeka ve bilgisayarlı görü modellerini eğitmek için nasıl gerekli olduğunu öğrenin.
Veri etiketleme, makine öğrenimi (ML) modellerinin anlamasına ve öğrenmesine yardımcı olmak için ham verileri etiketleme veya etiketleme işlemidir. Bu kritik adım, görüntüler veya videolar gibi yapılandırılmamış verileri, algoritmaların yorumlayabileceği yapılandırılmış bilgilere dönüştürür. Denetimli öğrenme bağlamında, bu etiketler modelin kendini eğitmek için kullandığı "gerçek değer" olarak hizmet eder. Veri etiketlemenin kalitesi ve doğruluğu, ortaya çıkan yapay zeka (AI) modelinin performansını ve güvenilirliğini doğrudan etkiler. Hassas etiketler olmadan, en gelişmiş modeller bile kalıpları etkili bir şekilde öğrenemez.
Bilgisayarlı Görüde Etiketlemenin Rolü
Bilgisayar görüşünde (CV), veri etiketleme, modellere dünyayı "görmeyi" ve yorumlamayı öğretmek için temeldir. İnsan etiketleyicilerin görsel veriler içindeki ilgi çekici nesneleri tanımlamak ve işaretlemek için özel yazılımlar kullanmasını içerir. Her biri farklı CV görevleri için uygun olan çeşitli etiketleme türleri vardır:
- Sınırlayıcı Kutu Açıklaması (Bounding Box Annotation): Bu, nesne algılama için kullanılan en yaygın biçimdir. Açıklayıcılar, tek tek nesnelerin etrafına dikdörtgen kutular çizer ve bir sınıf etiketi atar (örneğin, "araba", "kişi").
- Çokgen Segmentasyonu: Örnek segmentasyonu gibi daha fazla hassasiyet gerektiren görevler için, etiketleyiciler her nesnenin tam hatlarını çizer. Bu, modelin nesnelerin üst üste gelmesi durumunda bile, bir nesnenin belirli şeklini ve sınırlarını anlamasını sağlar.
- Semantik Bölütleme (Semantic Segmentation): Bu yöntem, bir görüntüdeki her bir pikseli belirli bir kategoriye (örneğin, "gökyüzü," "yol," "bina") sınıflandırmayı içerir. Örnek bölütlemeden (instance segmentation) farklı olarak, aynı nesne sınıfının farklı örnekleri arasında ayrım yapmaz.
- Anahtar Nokta Etiketleme: Poz tahmini (pose estimation) için kullanılan bu teknik, bir nesne üzerindeki belirli ilgi noktalarını (anahtar noktaları), örneğin bir insan vücudunun eklemlerini veya bir yüzün köşelerini işaretlemeyi içerir.
- Sınıflandırma: En basit biçimi, tüm bir görüntüye tek bir etiket atanmasıdır. Bu, görüntü sınıflandırma görevleri için temel oluşturur.
Açıklama yönteminin seçimi, proje hedeflerini tanımlama kılavuzunda belirtilen CV projesinin özel hedeflerine bağlıdır.
Gerçek Dünya Uygulamaları
- Otonom Araçlar: Sürücüsüz otomobiller, kapsamlı bir şekilde etiketlenmiş veriler üzerinde eğitilmiş modellere dayanır. Etiketleyiciler, milyonlarca görüntü ve LiDAR nokta bulutunda yayalardan bisikletlilere, trafik ışıklarından şerit çizgilerine ve yol işaretlerine kadar her şeyi etiketler. Bu ayrıntılı eğitim verisi, aracın algılama sisteminin çevresini anlamasını ve güvenli sürüş kararları vermesini sağlar. Argoverse gibi veri kümeleri, sağlam otomotivde yapay zeka çözümleri geliştirmek için çok önemlidir.
- Tıbbi Görüntü Analizi: Sağlık hizmetleri için yapay zekada, radyologlar ve tıp uzmanları, tümörleri, lezyonları, kırıkları veya diğer anormallikleri vurgulamak için MR, BT ve röntgen gibi tıbbi taramaları etiketler. Herkese açık Beyin Tümörü veri seti gibi bu etiketli veri kümeleri, erken teşhis ve tedavi planlamasına yardımcı olabilecek Ultralytics YOLO gibi modelleri eğitmek için kullanılır. Kuzey Amerika Radyoloji Derneği (RSNA), araştırma için bu tür çeşitli veri kümeleri sağlar.
Veri Etiketleme ve İlgili Kavramlar
Veri etiketleme genellikle diğer veri hazırlama teknikleriyle birlikte tartışılır, ancak farklı amaçlara hizmet ederler.
- Veri Etiketleme - Veri İşaretleme Karşılaştırması: Bu iki terim sıklıkla birbirinin yerine kullanılır ve aynı temel süreci ifade eder. "Etiketleme", bilgisayarlı görüde poligonlar veya anahtar noktaları çizmek gibi daha karmaşık görevleri tanımlamak için sıklıkla tercih edilirken, "işaretleme" sınıflandırma gibi daha basit görevler için kullanılabilir. Ancak, tüm pratik amaçlar için eş anlamlıdırlar. Derinlemesine bir bakış için, bilgisayarlı görü için veri işaretleme hakkındaki açıklayıcımızı okuyabilirsiniz.
- Veri Etiketleme - Veri Artırma Karşılaştırması: Etiketleme, ilk gerçek değer etiketlerini oluşturma sürecidir. Veri artırma ise, etiketlenmiş görüntülerin değiştirilmiş versiyonlarını (örneğin, döndürme, çevirme veya parlaklığı değiştirme) oluşturarak veri kümesinin boyutunu yapay olarak artırmak için etiketlemeden sonra kullanılan bir tekniktir.
- Veri Etiketleme - Veri Temizleme Karşılaştırması: Veri temizleme, genel kalitesini sağlamak için bir veri kümesi içindeki hataları düzeltmeyi, yinelenenleri kaldırmayı ve eksik değerleri işlemeyi içerir. Temizleme, etiketlemeden önce (örneğin, bulanık görüntüleri kaldırma) veya sonra (örneğin, yanlış etiketleri düzeltme) gerçekleşebilir, ancak yeni etiketler ekleme eyleminden farklıdır. Yüksek veri kalitesi, etkili etiketleme için çok önemlidir.
Etiketleme süreci, CVAT gibi açık kaynaklı seçeneklerden Scale AI ve Labelbox gibi ticari platformlara kadar çeşitli araçlar kullanılarak yönetilebilir. Ultralytics HUB gibi platformlar, veri kümelerini yönetmek, modelleri eğitmek ve veri toplama ve etiketlemeden dağıtıma kadar tüm iş akışını kolaylaştırmak için entegre çözümler sunar.