Veri Açıklaması
Veri ek açıklaması nedir? Verileri sınırlayıcı kutular veya poligonlarla etiketlemenin doğru yapay zeka ve bilgisayarla görme modellerini eğitmek için nasıl gerekli olduğunu öğrenin.
Veri ek açıklaması, makine öğrenimi (ML) modellerinin verileri anlamasına ve onlardan öğrenmesine yardımcı olmak için ham verileri etiketleme veya etiketleme işlemidir. Bu kritik adım, resimler veya videolar gibi yapılandırılmamış verileri algoritmaların yorumlayabileceği yapılandırılmış bilgilere dönüştürür. Denetimli öğrenme bağlamında bu ek açıklamalar, modelin kendini eğitmek için kullandığı doğru yanıtlar olan "temel gerçek" olarak hizmet eder. Veri açıklamalarının kalitesi ve doğruluğu, ortaya çıkan yapay zeka (AI) modelinin performansını ve güvenilirliğini doğrudan etkiler. Kesin ek açıklamalar olmadan, en gelişmiş modeller bile kalıpları etkili bir şekilde öğrenemeyecektir.
Bilgisayarlı Görüde Ek Açıklamanın Rolü
Bilgisayarlı görüde (CV), modellere dünyayı "görmeyi" ve yorumlamayı öğretmek için veri açıklaması esastır. Görsel verilerdeki ilgi çekici nesneleri tanımlamak ve işaretlemek için özel yazılım kullanan insan açıklamacıları içerir. Her biri farklı CV görevleri için uygun olan çeşitli açıklama türleri vardır:
- Sınırlayıcı Kutu Ek Açıklaması: Bu, nesne tespiti için kullanılan en yaygın biçimdir. Açıklayıcılar tek tek nesnelerin etrafına dikdörtgen kutular çizer ve bir sınıf etiketi atar (örneğin, "araba", "kişi").
- Poligonal Segmentasyon: Örnek segmentasyonu gibi daha fazla hassasiyet gerektiren görevler için, yorumlayıcılar her nesnenin tam dış hatlarını izler. Bu, nesneler üst üste geldiğinde bile modelin bir nesnenin belirli şeklini ve sınırlarını anlamasını sağlar.
- Anlamsal Segmentasyon: Bu yöntem, bir görüntüdeki her bir pikseli belirli bir kategoriye (örneğin, "gökyüzü", "yol", "bina") sınıflandırmayı içerir. Örnek segmentasyonunun aksine, aynı nesne sınıfının farklı örnekleri arasında ayrım yapmaz.
- Anahtar Nokta Ek Açıklaması: Poz tahmini için kullanılan bu teknik, bir insan vücudunun eklemleri veya bir yüzün köşeleri gibi bir nesne üzerindeki belirli ilgi noktalarının (anahtar noktalar) işaretlenmesini içerir.
- Sınıflandırma: Bütün bir görüntüye tek bir etiket atandığı en basit biçim. Bu, görüntü sınıflandırma görevleri için temeldir.
Ek açıklama yönteminin seçimi, CV projesinin özel hedeflerine bağlıdır ve bu hedefler proje hedeflerini tanımlama kılavuzunda ana hatlarıyla belirtilmiştir.
Gerçek Dünya Uygulamaları
- Otonom Araçlar: Sürücüsüz araçlar, kapsamlı bir şekilde açıklanmış veriler üzerinde eğitilmiş modellere dayanır. Açıklayıcılar, milyonlarca görüntü ve LiDAR nokta bulutunda yayalar ve bisikletlilerden trafik ışıklarına, şerit işaretlerine ve yol işaretlerine kadar her şeyi etiketler. Bu ayrıntılı eğitim verileri, aracın algılama sisteminin çevresini anlamasını ve güvenli sürüş kararları almasını sağlar. Argoverse gibi veri kümeleri, otomotiv çözümlerinde sağlam yapay zeka geliştirmek için çok önemlidir.
- Tıbbi Görüntü Analizi: Sağlık hizmetleri için yapay zekada, radyologlar ve tıp uzmanları tümörleri, lezyonları, kırıkları veya diğer anormallikleri vurgulamak için MRI'lar, CT'ler ve X-ışınları gibi tıbbi taramalara açıklama ekler. Halka açık Beyin Tümörü veri kümesi gibi bu açıklamalı veri kümeleri, erken teşhis ve tedavi planlamasına yardımcı olabilecek Ultralytics YOLO gibi modelleri eğitmek için kullanılır. Kuzey Amerika Radyoloji Derneği (RSNA) araştırma için bu tür birkaç veri kümesi sağlamaktadır.
Veri Ek Açıklamaları ve İlgili Kavramlar
Veri ek açıklaması genellikle diğer veri hazırlama teknikleriyle birlikte ele alınır, ancak bunlar farklı amaçlara hizmet eder.
- Veri Açıklama ve Veri Etiketleme: Bu iki terim sıklıkla birbirinin yerine kullanılır ve aynı temel süreci ifade eder. "Açıklama" genellikle bilgisayarla görmede çokgen veya anahtar nokta çizmek gibi daha karmaşık görevleri tanımlamak için tercih edilirken, "etiketleme" sınıflandırma gibi daha basit görevler için kullanılabilir. Ancak, tüm pratik amaçlar için eş anlamlıdırlar. Derinlemesine bir bakış için, bilgisayarla görüde veri etiketleme hakkındaki açıklamamızdan daha fazlasını okuyabilirsiniz.
- Veri Ek Açıklamaları ve Veri Artırma: Ek açıklama, ilk temel gerçek etiketlerini oluşturma sürecidir. Öte yandan veri büyütme, ek açıklamadan sonra, ek açıklamalı görüntülerin değiştirilmiş versiyonlarını (örneğin, döndürme, çevirme veya parlaklığı değiştirme) oluşturarak veri kümesinin boyutunu yapay olarak artırmak için kullanılan bir tekniktir.
- Veri Açıklama ve Veri Temizleme: Veri temizleme, genel kalitesini sağlamak için bir veri kümesindeki hataların düzeltilmesini, mükerrerlerin kaldırılmasını ve eksik değerlerin ele alınmasını içerir. Temizleme, ek açıklamadan önce (örneğin, bulanık görüntülerin kaldırılması) veya sonra (örneğin, yanlış etiketlerin düzeltilmesi) gerçekleşebilir, ancak yeni etiket ekleme eyleminden farklıdır. Etkili bir açıklama için yüksek veri kalitesi şarttır.
Ek açıklama süreci, CVAT gibi açık kaynak seçeneklerinden Scale AI ve Labelbox gibi ticari platformlara kadar çeşitli araçlar kullanılarak yönetilebilir. Ultralytics HUB gibi platformlar, veri kümelerini yönetmek, modelleri eğitmek ve veri toplama ve ek açıklamadan dağıtıma kadar tüm iş akışını kolaylaştırmak için entegre çözümler sunar.