Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Veri Etiketleme

Veri anotasyonunun makine öğrenimi için temel gerçeği nasıl oluşturduğunu öğrenin. Ultralytics güçlendirmek için nesne algılama ve segmentasyon tekniklerini keşfedin.

Veri anotasyonu, makine öğrenimi (ML) modelleri için anlaşılır hale getirmek amacıyla görüntü, video, metin veya ses gibi ham verilere açıklayıcı meta veriler veya etiketler eklemeyi içeren kritik bir süreçtir. Bu uygulama, algoritmaların kalıpları öğrenmek, nesneleri tanımak ve tahminlerde bulunmak için kullandığı "temel gerçek"i oluşturur. Denetimli öğrenme bağlamında, Denetimli öğrenme bağlamında, yüksek kaliteli anotasyonlar öğretmen görevi görür ve belirli bir girdi için beklenen çıktının ne olduğu konusunda modele rehberlik eder. Hassas veri anotasyonu olmadan, Ultralytics gibi gelişmiş mimariler bile detect doğru bir şekilde detect veya karmaşık sahneleri yorumlayamaz, çünkü modelin performansı, eğitim verilerinin kalitesiyle doğrudan bağlantılıdır.

Yapay Zeka Geliştirmede Anotasyonun Rolü

Sağlam AI sistemleri oluşturmak için yapılandırılmamış verilerin yapılandırılmış veri kümelerine dönüştürülmesi gerekir. Veri açıklamaları, ilgi çekici özellikleri açıkça işaretleyerek bu boşluğu doldurur. Örneğin, bilgisayar görüşünde (CV) bu, arabaların etrafına sınırlayıcı kutular çizmek veya tıbbi bir taramada bir tümörün dış hatlarını izlemek olabilir.

Anotasyon görevinin karmaşıklığı, amaçlanan uygulamaya göre değişir:

  • Nesne Algılama: Modele nesnenin ne olduğunu ve nerede bulunduğunu öğretmek için nesnelerin etrafına 2D dikdörtgenler çizmeyi içerir.
  • Örnek Segmentasyonu: Nesnelerin etrafında, tek tek örnekleri ve bunların tam şekillerini ayırt etmek için piksel mükemmelliğinde poligonlar gerektirir.
  • Poz Tahmini: Hareket veya duruşu analiz etmek için insan vücudundaki eklemler gibi belirli kilit noktaları işaretlemeye odaklanır.
  • Görüntü Sınıflandırma: Bir fotoğrafa "güneşli" veya "yağmurlu" gibi tek bir kategorik etiket atar. "

Gerçek Dünya Uygulamaları

Veri anotasyonu, makinelerin dünyayı doğru bir şekilde algılamasını sağlayarak çeşitli sektörlerde yenilikçiliği teşvik eder.

  1. Otonom Araçlar: Otonom araçlar, her yaya, trafik ışığı ve şerit işaretinin etiketlendiği devasa veri setlerine dayanır. Bu etiketli veriler, algılama sistemlerinin güvenli bir şekilde navigasyon yapmasını sağlar. Şirketler, LiDAR nokta bulutu etiketlemelerini video verileriyle birlikte kullanarak ortamın 3D haritalarını oluşturur.
  2. Tıbbi Görüntüleme: Sağlık hizmetlerinde yapay zeka alanında, radyologlar X-ışınları ve MRG taramalarını anotlayarak anomalileri vurgular. Bu anotlanmış veri kümeleri, yalnızca insan gözlemiyle tümörleri tespit etmek gibi erken teşhise yardımcı olmak için modelleri eğitir.

Açıklama, Etiketleme ve Artırma

Sıklıkla birbirinin yerine kullanılmasına rağmen, veri anotasyonunu ML operasyonları (MLOps) iş akışındaki ilgili kavramlardan ayırmak yararlıdır.

  • Anotasyon ve Veri Etiketleme: "Etiketleme" genellikle basit kategorizasyonu ifade eden daha geniş bir terimdir (örneğin, bir e-postayı spam olarak etiketlemek). "Anotasyon" ise genellikle daha zengin ve daha ayrıntılı bir süreci ifade eder, örneğin bir görüntüdeki belirli alanları veya bir ses dosyasındaki zaman segmentlerini işaretlemek gibi.
  • Anotasyon ve Veri Artırma: Anotasyon, ilk temel gerçeği oluşturur. Artırma ise, mevcut anotlanmış örnekler üzerinde döndürme, çevirme veya gürültü ekleme gibi dönüşümler uygulayarak veri kümesini yapay olarak genişleten bir sonraki adımdır. Bu, aşırı uyumu önlemeye ve model genellemesini iyileştirmeye yardımcı olur.

Araçlar ve İş Akışı

Modern veri etiketleme, nadiren manuel ve tek başına yapılan bir iştir. İşbirliğine dayalı platformlar ve giderek artan bir şekilde AI destekli araçlar içerir. Ultralytics , veri kümesi yönetimi ve otomatik etiketleme için entegre araçlar sunarak bu iş akışını basitleştirir. Önceden eğitilmiş bir model kullanarak ilk etiketleri önermek, süreci önemli ölçüde hızlandırabilir; bu teknik, aktif öğrenme olarak bilinir.

Anotasyon yapıldıktan sonra, veriler genellikle eğitim için JSON veya YOLO formatı gibi standart formatlarda dışa aktarılır. Aşağıdaki Python , YOLO26 modelini eğitmeden önce anotasyonlu veri seti yapılandırmanızı nasıl doğrulayacağınızı gösterir.

from ultralytics import YOLO

# Load a YOLO26 model (recommended for new projects)
model = YOLO("yolo26n.pt")

# Train the model using a dataset configuration file
# The YAML file defines paths to your annotated training and validation images
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Doğru veri etiketleme, yüksek performanslı yapay zekanın temelidir. Yüksek kaliteli etiketlemelere yatırım yaparak, geliştiriciler modellerinin net ve tutarlı örneklerden öğrenmesini sağlar ve bu da gerçek dünyada güvenilir tahminler yapılmasını sağlar.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın