Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

Veri artırımı ile AI modelinin sağlamlığını iyileştirin

Veri artırma yoluyla eğitim verilerine gerçekçi varyasyonlar eklemenin, AI modelinin sağlamlığını ve gerçek dünyadaki performansını nasıl iyileştirdiğini öğrenin.

Testler, herhangi bir teknolojik çözümün geliştirilmesinde çok önemli bir rol oynar. Testler, sistemin kullanıma sunulmadan önce nasıl çalıştığını ekiplere gösterir ve sorunları erken aşamada gidermelerini sağlar. Bu, modellerin kullanıma sunulduktan sonra öngörülemeyen gerçek dünya koşullarıyla başa çıkması beklenen yapay zeka dahil birçok alanda geçerlidir.

Örneğin, bilgisayar görme, makinelere görüntüleri ve videoları anlamayı öğreten bir yapay zeka dalıdır. Ultralytics gibi bilgisayar görme modelleri, nesne algılama, örnek segmentasyonu ve görüntü sınıflandırma gibi görevleri destekler.

Bunlar, hasta izleme, trafik analizi, otomatik ödeme ve üretimde kalite kontrol gibi uygulamalar için birçok sektörde kullanılabilir. Ancak, gelişmiş modeller ve yüksek kaliteli eğitim verileri olsa bile, Vision AI çözümleri, değişen ışıklandırma, hareket veya kısmen engellenmiş nesneler gibi gerçek dünyadaki değişikliklerle karşılaştıklarında hala zorluk yaşayabilir.

Bu durum, modellerin eğitim sırasında kendilerine verilen örneklerden öğrendikleri için meydana gelir. Parlama, hareket bulanıklığı veya kısmi görünürlük gibi koşulları daha önce görmemişlerse, bu senaryolarda nesneleri doğru bir şekilde tanıma olasılıkları daha düşüktür.

Model sağlamlığını artırmanın bir yolu, veri artırımıdır. Mühendisler, büyük miktarda yeni veri toplamak yerine, mevcut görüntülerde aydınlatmayı ayarlamak, kırpmak veya görüntüleri karıştırmak gibi küçük ve anlamlı değişiklikler yapabilirler. Bu, modelin daha geniş bir yelpazede aynı nesneleri tanımayı öğrenmesine yardımcı olur.

Bu makalede, veri artırmanın, kontrollü ortamlar dışında kullanıldığında model sağlamlığını ve Vision AI sistemlerinin güvenilirliğini nasıl artırdığını inceleyeceğiz. Başlayalım!

Bir modelin sağlamlığını kontrol etme

Veri artırmaya geçmeden önce, bir bilgisayar görme modelinin gerçek dünyada kullanıma gerçekten hazır olup olmadığını nasıl anlayabileceğimizi tartışalım. 

Sağlam bir model, yalnızca temiz ve mükemmel şekilde etiketlenmiş görüntüler üzerinde çalışmak yerine, koşullar değiştiğinde bile iyi performans göstermeye devam eder. AI modelinin sağlamlığını değerlendirirken dikkate alınması gereken bazı pratik faktörler şunlardır:

  • Aydınlatma değişiklikleri: Modeller, parlak ışık, düşük ışık, parlama veya gölgelere maruz kaldıklarında farklı davranabilir ve bu durum nesnelerin algılanma güvenilirliğini etkileyebilir.
  • Kısmi örtülme: Günlük yaşamda nesneler genellikle başka nesneler tarafından engellenir veya sadece kısmen görünür. Daha sağlam bir model, eksik görsel bilgilerle bile bunları tanıyabilir.
  • Kalabalık sahneler: Birbiriyle örtüşen nesnelerin çok olduğu ortamlarda algılama daha zor olabilir. Bu durumlarda iyi performans gösteren modeller genellikle karmaşık ortamlarda daha güvenilirdir.

Temiz, mükemmel şekilde yakalanmış görüntülerde elde edilen iyi sonuçlar, her zaman gerçek dünyada güçlü bir performans anlamına gelmez. Çeşitli koşullarda düzenli olarak yapılan testler, bir modelin kullanıma sunulduktan sonra ne kadar iyi performans gösterdiğini ortaya koymaya yardımcı olur.

Veri artırma nedir?

Bir nesnenin fotoğrafta görünüşü, ışıklandırma, açı, mesafe veya arka plana bağlı olarak değişebilir. Bir bilgisayar görme modeli eğitilirken, öğreneceği veri setinin bu tür varyasyonları içermesi gerekir, böylece öngörülemeyen ortamlarda iyi performans gösterebilir.

Veri artırma, mevcut görüntülerden ek örnekler oluşturarak eğitim veri setini genişletir. Bu, görüntüyü döndürme veya çevirme, parlaklığı ayarlama veya bir kısmını kırpma gibi kasıtlı değişiklikler uygulayarak yapılır. 

Örneğin, sadece bir kedi fotoğrafınız olduğunu düşünün. Görüntüyü döndürürseniz veya parlaklığını değiştirirseniz, o tek fotoğraftan birkaç yeni versiyon oluşturabilirsiniz. Her versiyon biraz farklı görünür, ancak yine de aynı kedinin fotoğrafıdır. Bu varyasyonlar, bir nesnenin aynı şey olmasına rağmen farklı görünebileceğini modele öğretmeye yardımcı olur.

Şekil 1. Bir kedi görüntüsünün büyütülmesine bir bakış (Kaynak)

Veri artırma, model performansını nasıl iyileştirir?

Model eğitimi sırasında, veri artırma doğrudan eğitim sürecine entegre edilebilir. Görüntülerin yeni kopyalarını manuel olarak oluşturup depolamak yerine, her görüntü yüklendiğinde rastgele dönüşümler uygulanabilir. 

Bu, modelin görüntünün her seferinde biraz farklı bir versiyonunu gördüğü anlamına gelir; görüntü daha parlak, ters çevrilmiş veya kısmen gizlenmiş olabilir. Rastgele silme gibi teknikler, görüntünün küçük bölgelerini bile kaldırabilir ve böylece bir nesnenin engellendiği veya sadece kısmen görülebildiği gerçek dünya durumlarını simüle edebilir.

Şekil 2. Rastgele silme tabanlı artırma örnekleri (Kaynak)

Aynı görüntünün birçok farklı versiyonunu görmek, modelin tek bir mükemmel örneğe bağlı kalmak yerine hangi özelliklerin önemli olduğunu öğrenmesini sağlar. Bu çeşitlilik, AI modelinin sağlamlığını artırarak gerçek dünya koşullarında daha güvenilir bir performans sergilemesini sağlar.

Yaygın veri artırma teknikleri

Eğitim görüntülerine çeşitlilik katmak için kullanılan bazı veri artırma teknikleri şunlardır:

  • Geometrik dönüşümler: Bu teknikler, bir nesnenin görüntü içinde uzamsal olarak nasıl göründüğünü değiştirir. Bir görüntüyü döndürmek, çevirmek, yeniden boyutlandırmak, kırpmak veya kaydırmak, modelin bir nesnenin farklı açılardan veya mesafelerden nasıl görülebileceğini anlamasını sağlar.
  • Renk ve ışık ayarları: Gerçek dünyadaki ışıklandırma nadiren tutarlıdır. Görüntüler, kullanılan ortama veya kameraya bağlı olarak çok parlak, çok karanlık veya renkleri biraz farklı olabilir. Parlaklık, kontrast, renk tonu ve doygunluk ayarları, modellerin bu görsel değişiklikleri yönetmesini ve farklı sahnelerde iyi performans göstermesini sağlar.
  • Görüntü kalitesi farklılıkları: Bulanıklık veya görsel gürültü, görüntülerin net görünmemesine neden olabilir. Eğitim sırasında bulanıklık veya gürültü eklemek, modelin hareket bulanıklığı, düşük ışıklı görüntüler veya düşük kaliteli kamera sonuçlarıyla başa çıkmayı öğrenmesine yardımcı olur, böylece kusurlu görsellere karşı daha az duyarlı hale gelir.
  • Tıkanma tabanlı büyütmeler: Gerçek ortamlarda, nesneler genellikle diğer nesneler tarafından kısmen engellenir. Buna görüntü tıkanması denir. Eğitim sırasında görüntünün küçük alanlarını gizlemek veya maskelemek, nesnelerin sadece bir kısmı görünür olsa bile detect öğrenmede modele destek olur.
  • Çoklu görüntü artırma: Bu teknikler, birden fazla görüntünün parçalarını tek bir eğitim örneğinde birleştirir. Bu, görüntüdeki nesne sayısını artırabilir ve modelin karmaşık veya kalabalık sahneleri işleme yeteneğini geliştirebilir.
Şekil 3. Çoklu görüntü artırma örneği (Kaynak)

Ultralytics Python ile veri artırma artık çok kolay

Veri kümelerini yönetmek, görüntü varyasyonları oluşturmak ve dönüştürme kodu yazmak, bilgisayar görme uygulaması oluşturmaya ek adımlar ekleyebilir. Ultralytics Python , YOLO26 gibi Ultralytics YOLO eğitmek, çalıştırmak ve dağıtmak için tek bir arayüz sağlayarak bunu basitleştirmeye yardımcı olur. Eğitim iş akışlarını kolaylaştırma çabasının bir parçası olarak, paket YOLO için optimize edilmiş, Ultralytics yerleşik veri artırma özelliğini içerir.

Ayrıca, ayrı araçlara veya özel kodlara olan ihtiyacı ortadan kaldıran kullanışlı entegrasyonları da destekler. Özellikle veri artırma için, paket yaygın olarak kullanılan bir görüntü artırma kütüphanesi olan Albumentations ile entegre olur. Bu entegrasyon, ekstra komut dosyaları veya özel kodlara ihtiyaç duymadan, eğitim sırasında artırmaların otomatik olarak uygulanmasını sağlar.

Anotasyonları ve artırılmış veri kümelerini yönetme

Model sağlamlığını etkileyen bir diğer faktör ise etiketleme kalitesidir. Roboflow gibi etiketleme araçlarıyla oluşturulan ve yönetilen temiz, doğru etiketler, modelin nesnelerin nerede olduğunu ve neye benzediğini anlamasına yardımcı olur.

Eğitim sırasında, çevirme, kırpma ve döndürme gibi veri artırma işlemleri dinamik olarak uygulanır ve açıklamalar bu değişikliklere uyacak şekilde otomatik olarak ayarlanır. Etiketler kesin olduğunda, bu süreç sorunsuz bir şekilde çalışır ve modele aynı sahnenin birçok gerçekçi örneğini sunar.

Anotasyonlar yanlış veya tutarsızsa, bu hatalar artırılmış görüntülerde tekrarlanabilir ve bu da eğitimin etkinliğini azaltabilir. Doğru anotasyonlarla başlamak, bu hataların yayılmasını önler ve modelin daha sağlam olmasına katkıda bulunur.

Vizyon AI uygulamalarını veri artırımı ile geliştirme

Şimdi, veri artırmanın gerçek dünya uygulamalarında AI modelinin sağlamlığına nasıl katkıda bulunduğuna dair örnekleri inceleyelim.

Gerçek ortamlarda nesne algılama doğruluğunu artırma

Sentetik görüntüler, gerçek veriler sınırlı, hassas veya toplanması zor olduğunda nesne algılama sistemlerini eğitmek için sıklıkla kullanılır. Bu görüntüler, ekiplerin gerçek hayattaki her senaryoyu yakalamaya gerek kalmadan ürün, ortam ve kamera açılarının örneklerini hızlı bir şekilde oluşturmasına olanak tanır. 

Ancak, sentetik veri kümeleri bazen gerçek dünya görüntülerine kıyasla çok temiz görünebilir. Gerçek dünya görüntülerinde ışık değişir, nesneler üst üste biner ve sahnelerde arka plan karmaşası vardır. Veri artırma, farklı ışıklandırma, gürültü veya nesne yerleşimi gibi gerçekçi varyasyonlar ekleyerek bu boşluğu doldurmaya yardımcı olur. Böylece model, kullanıma sunulduğunda karşılaşacağı koşul türlerini ele almayı öğrenir.

Örneğin, yakın zamanda yapılan bir çalışmada, YOLO11 tamamen sentetik görüntülerle eğitildi ve ekstra varyasyon eklemek için veri artırma eklendi. Bu, modelin nesneleri daha geniş bir şekilde tanımayı öğrenmesinde rol oynadı. Eğitim sırasında gerçek dünya verilerini hiç görmemiş olmasına rağmen, gerçek görüntüler üzerinde test edildiğinde iyi performans gösterdi.

Tıbbi görüntüleme çözümlerini daha güvenilir hale getirmek

Tıbbi görüntüleme veri kümeleri genellikle sınırlıdır ve taramalar, ekipman türüne, görüntüleme ayarlarına veya klinik ortama göre değişiklik gösterebilir. Hasta anatomisi, açılar, aydınlatma veya görsel gürültüdeki farklılıklar, bilgisayar görme modellerinin hastalar ve hastaneler arasında iyi bir şekilde genelleştirilebilen kalıpları öğrenmesini zorlaştırabilir.

Veri artırma, eğitim sırasında aynı taramanın birden fazla varyasyonunu oluşturarak, örneğin gürültü ekleyerek, görüntüyü hafifçe kaydırarak veya küçük bozulmalar uygulayarak bu sorunu çözmeye yardımcı olur. Bu değişiklikler, eğitim verilerinin gerçek klinik koşulları daha iyi temsil etmesini sağlar.

Örneğin, bir pediatrik görüntüleme çalışmasında, araştırmacılar anatomik segmentasyon YOLO11 kullandılar ve onu artırılmış tıbbi verilerle eğittiler. Görüntüleri daha gerçekçi hale getirmek için ek gürültü, hafif konum kaymaları ve küçük bozulmalar gibi varyasyonlar eklediler.

Şekil 4. Orijinal ve geliştirilmiş pediatrik tıbbi görüntüler (Kaynak)

Bu varyasyonlardan öğrenerek, model yüzey düzeyindeki farklılıklardan ziyade anlamlı anatomik özelliklere odaklandı. Bu, farklı taramalar ve hasta vakaları arasında segmentasyon sonuçlarının daha istikrarlı olmasını sağladı.

Önemli çıkarımlar

Çeşitli verileri toplamak zordur, ancak veri artırma, modellerin daha geniş bir görsel koşul yelpazesinden öğrenmesini sağlar. Bu, örtülmeler, aydınlatma değişiklikleri ve kalabalık sahnelerle başa çıkarken modelin daha sağlam olmasını sağlar. Genel olarak, bu, kontrollü eğitim ortamları dışında daha güvenilir bir performans sergilemelerine yardımcı olur. 

Topluluğumuza katılın ve GitHub depomuzda Vision AI'daki en son gelişmeleri keşfedin. Üretimde yapay zeka ve sağlık hizmetlerinde bilgisayarla görme gibi uygulamaların nasıl ilerleme sağladığını öğrenmek için çözüm sayfalarımızı ziyaret edin ve bir sonraki yapay zeka çözümünüzü güçlendirmek için lisanslama seçeneklerimize göz atın.

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın