Bilgisayarla Görme | Ultralytics için Veri Etiketleme

Yapay zeka (AI), makinelere insan benzeri yetenekler kazandırmaya odaklanır ve bunu yapmanın en popüler yollarından biri denetimli öğrenmedir. Başka bir deyişle, AI modellerine etiketli örnekler göstererek öğretmek, onların kalıplardan öğrenmelerine ve görevlerde gelişmelerine yardımcı olabilir. Bu, insanların deneyimden öğrenmesine çok benzer. Peki, bu etiketli örnekler nasıl oluşturuluyor?

Veri etiketleme, makine öğrenimi algoritmalarının anlamasına yardımcı olmak için verileri etiketlemeyi veya etiketlemeyi içerir. Görüntü işlemede bu, nesneleri, eylemleri veya sahneleri doğru bir şekilde tanımak ve kategorize etmek için görüntüleri veya videoları işaretlemek anlamına gelir. Bir yapay zeka modelinin başarısı, büyük ölçüde eğitildiği etiketli verilerin kalitesine bağlı olduğundan, veri etiketleme hayati önem taşır.

Araştırmalar, AI proje zamanının %80'inden fazlasının verileri toplama ve bir araya getirmeden temizleme ve etiketlemeye kadar yönetmekle geçtiğini gösteriyor. Bu, veri etiketlemenin AI model geliştirmede ne kadar önemli olduğunu gösteriyor. Yüksek kaliteli etiketlenmiş verilerin kullanılması, AI modellerinin gerçek dünya durumlarında yüz tanıma ve nesne algılama gibi görevleri daha yüksek doğruluk ve güvenilirlikle gerçekleştirmesini mümkün kılar.

Veri etiketleme neden gereklidir?

Veri etiketleme, bir bilgisayarlı görü modelinin ne kadar iyi performans gösterdiğinin temelini oluşturur. Etiketlenmiş veri, modelin öğrenmek ve tahminlerde bulunmak için kullandığı temel gerçektir. Temel gerçek veri, modelin anlamaya çalıştığı gerçek dünyayı temsil ettiği için çok önemlidir. Bu güvenilir temel olmadan, yapay zeka modeli pusulasız seyreden bir gemi gibi olurdu.

__wf_reserved_inherit — Şekil 1. Gerçek Değerlere Karşı Tahmin.

‍

Doğru etiketleme, bu modellerin ne gördüklerini anlamalarına yardımcı olur ve daha iyi karar almaya yol açar. Veriler kötü etiketlenmiş veya tutarsızsa, model tıpkı yanlış ders kitaplarından öğrenen bir öğrenci gibi doğru tahminler ve kararlar almakta zorlanacaktır. Etiketlenmiş veriler sayesinde, bir model görüntülerdeki ve videolardaki nesnelerin görüntü sınıflandırması, örnek segmentasyonu ve poz tahmini gibi görevleri öğrenebilir.

Veri kümeleri için en iyi kaynaklar

Yepyeni bir veri kümesi oluşturup görüntüleri ve videoları titizlikle etiketlemeden önce, projeniz için önceden var olan veri kümelerini kullanıp kullanamayacağınızı görmek iyi bir fikirdir. Yüksek kaliteli veri kümelerine ücretsiz olarak erişebileceğiniz çeşitli harika açık kaynaklı depolar bulunmaktadır. En popüler olanlardan bazıları şunlardır:

ImageNet: Genellikle görüntü sınıflandırma modellerini eğitmek için kullanılır.
‍
COCO: Bu veri seti nesne algılama, segmentasyon ve görüntü altyazılama için tasarlanmıştır.
‍
PASCAL VOC: Nesne algılama ve segmentasyon görevlerini destekler.

‍

Bir veri seti seçerken, projenize ne kadar uygun olduğu, veri setinin boyutu, çeşitliliği ve etiketlerin kalitesi gibi faktörleri göz önünde bulundurmak önemlidir. Ayrıca, herhangi bir yasal sonucu önlemek için veri setinin lisans koşullarını incelediğinizden ve verilerin iş akışınıza ve araçlarınıza uygun bir şekilde biçimlendirilip biçimlendirilmediğini kontrol ettiğinizden emin olun.

Mevcut veri kümeleri ihtiyaçlarınıza tam olarak uymuyorsa, özel bir veri kümesi oluşturmak harika bir seçenektir. Projenizin gereksinimlerine bağlı olarak web kameraları, dronlar veya akıllı telefonlar gibi araçları kullanarak görüntüler toplayabilirsiniz. İdeal olarak, özel veri kümeniz çeşitli, dengeli ve çözmeye çalıştığınız sorunu gerçekten temsil etmelidir. Bu, farklı aydınlatma koşullarında, çeşitli açılardan ve birden çok ortamda görüntü yakalamak anlamına gelebilir.

Yalnızca daha az sayıda resim veya video toplayabiliyorsanız, veri artırma yardımcı bir tekniktir. Mevcut görüntülere döndürme, çevirme veya renk ayarlamaları gibi dönüşümler uygulayarak veri kümenizi genişletmeyi içerir. Veri kümenizin boyutunu artırır ve modelinizi daha sağlam hale getirir ve verilerdeki değişiklikleri daha iyi işleyebilir. Açık kaynaklı veri kümeleri, özel veri kümeleri ve artırılmış verilerin bir karışımını kullanarak, bilgisayar görüşü modellerinizin performansını önemli ölçüde artırabilirsiniz.

Görüntü açıklama teknikleri türleri

Görüntüleri etiketlemeye başlamadan önce, farklı etiketleme türlerini bilmek önemlidir. Projeniz için doğru olanı seçmenize yardımcı olacaktır. Ardından, ana etiketleme türlerinden bazılarına göz atacağız.

Sınırlayıcı kutular

Sınırlayıcı kutular (Bounding boxes), bilgisayarlı görüde en yaygın kullanılan etiketleme türüdür. Bir görüntüdeki bir nesnenin konumunu işaretlemek için kullanılan dikdörtgen kutulardır. Bu kutular, köşelerinin koordinatları ile tanımlanır ve yapay zeka modellerinin nesneleri tanımlamasına ve konumlandırmasına yardımcı olur. Sınırlayıcı kutular (Bounding boxes) temel olarak nesne tespiti (object detection) için kullanılır.

‍

Segmentasyon maskeleri

Bazen, bir nesnenin etrafına çizilen bir sınırlayıcı kutudan daha doğru bir şekilde tespit edilmesi gerekebilir. Bir görüntüdeki nesnelerin sınırıyla ilgilenebilirsiniz. Bu durumda, segmentasyon maskeleri karmaşık nesnelerin ana hatlarını çizmenizi sağlar. Segmentasyon maskeleri, daha ayrıntılı bir piksel seviyesi temsilidir.

Bu maskeler semantik segmentasyon ve örnek segmentasyonu için kullanılabilir. Semantik segmentasyon, bir görüntüdeki her pikseli, bir yaya, araba, yol veya kaldırım gibi temsil ettiği nesneye veya alana göre etiketlemeyi içerir. Ancak örnek segmentasyonu, bir adım daha ileri giderek her nesneyi ayrı ayrı tanımlar ve ayırır; örneğin, bir görüntüdeki her arabayı, hepsi aynı türde olsa bile ayırt eder.

‍

3B Küp Şekiller

3B küp şekiller sınırlayıcı kutulara benzer, onları benzersiz kılan şey, 3B küp şekillerin derinlik bilgisi eklemesi ve bir nesnenin 3B gösterimini sağlamasıdır. Bu ekstra bilgi, sistemlerin nesnelerin şeklini, hacmini ve 3B uzaydaki konumunu anlamasını sağlar. 3B küp şekiller genellikle otonom sürüşlü araçlarda nesnelerin araçtan olan mesafesini ölçmek için kullanılır.

‍

Anahtar noktalar ve işaret noktaları

Bir diğer ilginç açıklama türü de, gözler, burunlar veya eklemler gibi belirli noktaların nesneler üzerinde işaretlendiği anahtar noktalardır. İşaret noktaları, yüzler veya vücut pozları gibi daha karmaşık şekillerin yapısını ve hareketini yakalamak için bu noktaları birbirine bağlayarak bunu bir adım daha ileri götürür. Bu tür açıklamalar, yüz tanıma, hareket yakalama ve artırılmış gerçeklik gibi uygulamalar için kullanılır. Ayrıca, jest tanıma veya spor performansını analiz etme gibi görevlerde yapay zeka modellerinin doğruluğunu artırırlar.

‍

labelImg kullanarak veriler nasıl etiketlenir

Farklı ek açıklama türlerinden bahsettiğimize göre, şimdi popüler bir araç olan LabelImg'yi kullanarak görüntülere nasıl açıklama ekleyebileceğinizi anlayalım. LabelImg, görüntü açıklamasını basitleştiren ve YOLO (You Only Look Once) formatında veri kümeleri oluşturmak için kullanılabilen açık kaynaklı bir araçtır. Küçük Ultralytics YOLOv8 projeleri üzerinde çalışan yeni başlayanlar için mükemmel bir seçimdir.

LabelImg'nin kurulumu basittir. Öncelikle, bilgisayarınızda Python 3 'ün kurulu olduğundan emin olun. Daha sonra LabelImg'yi hızlı bir komutla kurabilirsiniz.

Kurulduktan sonra, aracı şu komutu kullanarak başlatabilirsiniz:

LabelImg, Windows, macOS ve Linux dahil olmak üzere birden çok platformda çalışır. Kurulum sırasında herhangi bir sorunla karşılaşırsanız, resmi LabelImg deposu size daha ayrıntılı talimatlar sağlayabilir.

‍

Aracı başlattıktan sonra, görüntülerinizi etiketlemeye başlamak için bu basit adımları izleyin:

Sınıflarınızı ayarlayın: “predefined_classes.txt” adlı bir dosyada etiketlemek istediğiniz sınıfların (kategorilerin) listesini tanımlayarak başlayın. Bu dosya, yazılıma resimlerinizde hangi nesneleri etiketleyeceğinizi bildirir.
‍
YOLO formatına geçin: LabelImg varsayılan olarak PASCAL VOC formatını kullanır, ancak YOLO ile çalışıyorsanız formatları değiştirmeniz gerekir. YOLO'ya geçmek için araç çubuğundaki "PascalVOC" düğmesine tıklamanız yeterlidir.
‍
Açıklama eklemeye başlayın: Görüntülerinizi yüklemek için "Aç" veya "OpenDIR" seçeneklerini kullanın. Ardından, açıklama eklemek istediğiniz nesnelerin etrafına sınırlayıcı kutular çizin ve doğru sınıf etiketini atayın. Her görüntüyü etiketledikten sonra çalışmanızı kaydedin. LabelImg, resminizle aynı adı taşıyan ve YOLO ek açıklamalarını içeren bir metin dosyası oluşturacaktır.
‍
Kaydedin ve gözden geçirin: Ek açıklamalar YOLO formatında bir .txt dosyasına kaydedilir. Yazılım ayrıca tüm sınıf adlarınızı listeleyen bir "classes.txt" dosyası da kaydeder.

Verimli veri etiketleme stratejileri

Veri etiketleme sürecini kolaylaştırmak için akılda tutulması gereken birkaç temel strateji vardır. Örneğin, net etiketleme yönergeleri çok önemlidir. Bunlar olmadan, farklı etiketleyiciler bir görevi farklı şekilde yorumlayabilir.

Diyelim ki görev, görüntülerdeki kuşları sınırlayıcı kutularla işaretlemek. Bir etiketleyici tüm kuşu etiketleyebilirken, diğeri yalnızca başını veya kanatlarını etiketleyebilir. Bu tür bir tutarsızlık, eğitim sırasında modeli karıştırabilir. "Kanatlar ve kuyruk dahil tüm kuşu etiketleyin" gibi net tanımlar sağlayarak, zorlu durumlar için örnekler ve talimatlarla birlikte, verilerin doğru ve tutarlı bir şekilde etiketlendiğinden emin olabilirsiniz.

Yüksek standartları korumak için düzenli kalite kontrolleri de önemlidir. Kriterler belirleyerek ve çalışmaları incelemek için belirli ölçütler kullanarak, verileri doğru tutabilir ve sürekli geri bildirim yoluyla süreci iyileştirebilirsiniz.

Kısaca veri etiketleme

Veri etiketleme, bilgisayarlı görü modeliniz üzerinde önemli bir etkiye sahip olabilecek basit bir kavramdır. İster görüntüleri etiketlemek için LabelImg gibi araçlar kullanıyor olun, ister açık kaynaklı veri kümeleri üzerinde modeller eğitiyor olun, veri etiketlemeyi anlamak çok önemlidir. Veri etiketleme stratejileri, tüm süreci kolaylaştırmaya ve daha verimli hale getirmeye yardımcı olabilir. Etiketleme yaklaşımınızı iyileştirmek için zaman ayırmak, daha iyi, daha güvenilir yapay zeka sonuçlarına yol açabilir.

Keşfetmeye ve becerilerinizi geliştirmeye devam edin! Yapay zeka hakkında bilgi edinmeye devam etmek için topluluğumuzla bağlantıda kalın! GitHub depomuzu inceleyerek, üretim ve sağlık hizmetleri gibi sektörlerde yenilikçi çözümler oluşturmak için yapay zekayı nasıl kullandığımızı keşfedin. 🚀

Bilgisayarlı görü projeleri için veri etiketlemeyi keşfetme

Veri etiketleme neden gereklidir?

Veri kümeleri için en iyi kaynaklar