Veri artırma yoluyla eğitim verilerine gerçekçi varyasyonlar eklemenin, AI modelinin sağlamlığını ve gerçek dünyadaki performansını nasıl iyileştirdiğini öğrenin.
Veri artırma yoluyla eğitim verilerine gerçekçi varyasyonlar eklemenin, AI modelinin sağlamlığını ve gerçek dünyadaki performansını nasıl iyileştirdiğini öğrenin.
Testler, herhangi bir teknolojik çözümün geliştirilmesinde çok önemli bir rol oynar. Testler, sistemin kullanıma sunulmadan önce nasıl çalıştığını ekiplere gösterir ve sorunları erken aşamada gidermelerini sağlar. Bu, modellerin kullanıma sunulduktan sonra öngörülemeyen gerçek dünya koşullarıyla başa çıkması beklenen yapay zeka dahil birçok alanda geçerlidir.
Örneğin, bilgisayar görme, makinelere görüntüleri ve videoları anlamayı öğreten bir yapay zeka dalıdır. Ultralytics gibi bilgisayar görme modelleri, nesne algılama, örnek segmentasyonu ve görüntü sınıflandırma gibi görevleri destekler.
Bunlar, hasta izleme, trafik analizi, otomatik ödeme ve üretimde kalite kontrol gibi uygulamalar için birçok sektörde kullanılabilir. Ancak, gelişmiş modeller ve yüksek kaliteli eğitim verileri olsa bile, Vision AI çözümleri, değişen ışıklandırma, hareket veya kısmen engellenmiş nesneler gibi gerçek dünyadaki değişikliklerle karşılaştıklarında hala zorluk yaşayabilir.
Bu durum, modellerin eğitim sırasında kendilerine verilen örneklerden öğrendikleri için meydana gelir. Parlama, hareket bulanıklığı veya kısmi görünürlük gibi koşulları daha önce görmemişlerse, bu senaryolarda nesneleri doğru bir şekilde tanıma olasılıkları daha düşüktür.
Model sağlamlığını artırmanın bir yolu, veri artırımıdır. Mühendisler, büyük miktarda yeni veri toplamak yerine, mevcut görüntülerde aydınlatmayı ayarlamak, kırpmak veya görüntüleri karıştırmak gibi küçük ve anlamlı değişiklikler yapabilirler. Bu, modelin daha geniş bir yelpazede aynı nesneleri tanımayı öğrenmesine yardımcı olur.
Bu makalede, veri artırmanın, kontrollü ortamlar dışında kullanıldığında model sağlamlığını ve Vision AI sistemlerinin güvenilirliğini nasıl artırdığını inceleyeceğiz. Başlayalım!
Veri artırmaya geçmeden önce, bir bilgisayar görme modelinin gerçek dünyada kullanıma gerçekten hazır olup olmadığını nasıl anlayabileceğimizi tartışalım.
Sağlam bir model, yalnızca temiz ve mükemmel şekilde etiketlenmiş görüntüler üzerinde çalışmak yerine, koşullar değiştiğinde bile iyi performans göstermeye devam eder. AI modelinin sağlamlığını değerlendirirken dikkate alınması gereken bazı pratik faktörler şunlardır:
Temiz, mükemmel şekilde yakalanmış görüntülerde elde edilen iyi sonuçlar, her zaman gerçek dünyada güçlü bir performans anlamına gelmez. Çeşitli koşullarda düzenli olarak yapılan testler, bir modelin kullanıma sunulduktan sonra ne kadar iyi performans gösterdiğini ortaya koymaya yardımcı olur.
Bir nesnenin fotoğrafta görünüşü, ışıklandırma, açı, mesafe veya arka plana bağlı olarak değişebilir. Bir bilgisayar görme modeli eğitilirken, öğreneceği veri setinin bu tür varyasyonları içermesi gerekir, böylece öngörülemeyen ortamlarda iyi performans gösterebilir.
Veri artırma, mevcut görüntülerden ek örnekler oluşturarak eğitim veri setini genişletir. Bu, görüntüyü döndürme veya çevirme, parlaklığı ayarlama veya bir kısmını kırpma gibi kasıtlı değişiklikler uygulayarak yapılır.
Örneğin, sadece bir kedi fotoğrafınız olduğunu düşünün. Görüntüyü döndürürseniz veya parlaklığını değiştirirseniz, o tek fotoğraftan birkaç yeni versiyon oluşturabilirsiniz. Her versiyon biraz farklı görünür, ancak yine de aynı kedinin fotoğrafıdır. Bu varyasyonlar, bir nesnenin aynı şey olmasına rağmen farklı görünebileceğini modele öğretmeye yardımcı olur.

Model eğitimi sırasında, veri artırma doğrudan eğitim sürecine entegre edilebilir. Görüntülerin yeni kopyalarını manuel olarak oluşturup depolamak yerine, her görüntü yüklendiğinde rastgele dönüşümler uygulanabilir.
Bu, modelin görüntünün her seferinde biraz farklı bir versiyonunu gördüğü anlamına gelir; görüntü daha parlak, ters çevrilmiş veya kısmen gizlenmiş olabilir. Rastgele silme gibi teknikler, görüntünün küçük bölgelerini bile kaldırabilir ve böylece bir nesnenin engellendiği veya sadece kısmen görülebildiği gerçek dünya durumlarını simüle edebilir.

Aynı görüntünün birçok farklı versiyonunu görmek, modelin tek bir mükemmel örneğe bağlı kalmak yerine hangi özelliklerin önemli olduğunu öğrenmesini sağlar. Bu çeşitlilik, AI modelinin sağlamlığını artırarak gerçek dünya koşullarında daha güvenilir bir performans sergilemesini sağlar.
Eğitim görüntülerine çeşitlilik katmak için kullanılan bazı veri artırma teknikleri şunlardır:

Veri kümelerini yönetmek, görüntü varyasyonları oluşturmak ve dönüştürme kodu yazmak, bilgisayar görme uygulaması oluşturmaya ek adımlar ekleyebilir. Ultralytics Python , YOLO26 gibi Ultralytics YOLO eğitmek, çalıştırmak ve dağıtmak için tek bir arayüz sağlayarak bunu basitleştirmeye yardımcı olur. Eğitim iş akışlarını kolaylaştırma çabasının bir parçası olarak, paket YOLO için optimize edilmiş, Ultralytics yerleşik veri artırma özelliğini içerir.
Ayrıca, ayrı araçlara veya özel kodlara olan ihtiyacı ortadan kaldıran kullanışlı entegrasyonları da destekler. Özellikle veri artırma için, paket yaygın olarak kullanılan bir görüntü artırma kütüphanesi olan Albumentations ile entegre olur. Bu entegrasyon, ekstra komut dosyaları veya özel kodlara ihtiyaç duymadan, eğitim sırasında artırmaların otomatik olarak uygulanmasını sağlar.
Model sağlamlığını etkileyen bir diğer faktör ise etiketleme kalitesidir. Roboflow gibi etiketleme araçlarıyla oluşturulan ve yönetilen temiz, doğru etiketler, modelin nesnelerin nerede olduğunu ve neye benzediğini anlamasına yardımcı olur.
Eğitim sırasında, çevirme, kırpma ve döndürme gibi veri artırma işlemleri dinamik olarak uygulanır ve açıklamalar bu değişikliklere uyacak şekilde otomatik olarak ayarlanır. Etiketler kesin olduğunda, bu süreç sorunsuz bir şekilde çalışır ve modele aynı sahnenin birçok gerçekçi örneğini sunar.
Anotasyonlar yanlış veya tutarsızsa, bu hatalar artırılmış görüntülerde tekrarlanabilir ve bu da eğitimin etkinliğini azaltabilir. Doğru anotasyonlarla başlamak, bu hataların yayılmasını önler ve modelin daha sağlam olmasına katkıda bulunur.
Şimdi, veri artırmanın gerçek dünya uygulamalarında AI modelinin sağlamlığına nasıl katkıda bulunduğuna dair örnekleri inceleyelim.
Sentetik görüntüler, gerçek veriler sınırlı, hassas veya toplanması zor olduğunda nesne algılama sistemlerini eğitmek için sıklıkla kullanılır. Bu görüntüler, ekiplerin gerçek hayattaki her senaryoyu yakalamaya gerek kalmadan ürün, ortam ve kamera açılarının örneklerini hızlı bir şekilde oluşturmasına olanak tanır.
Ancak, sentetik veri kümeleri bazen gerçek dünya görüntülerine kıyasla çok temiz görünebilir. Gerçek dünya görüntülerinde ışık değişir, nesneler üst üste biner ve sahnelerde arka plan karmaşası vardır. Veri artırma, farklı ışıklandırma, gürültü veya nesne yerleşimi gibi gerçekçi varyasyonlar ekleyerek bu boşluğu doldurmaya yardımcı olur. Böylece model, kullanıma sunulduğunda karşılaşacağı koşul türlerini ele almayı öğrenir.
Örneğin, yakın zamanda yapılan bir çalışmada, YOLO11 tamamen sentetik görüntülerle eğitildi ve ekstra varyasyon eklemek için veri artırma eklendi. Bu, modelin nesneleri daha geniş bir şekilde tanımayı öğrenmesinde rol oynadı. Eğitim sırasında gerçek dünya verilerini hiç görmemiş olmasına rağmen, gerçek görüntüler üzerinde test edildiğinde iyi performans gösterdi.
Tıbbi görüntüleme veri kümeleri genellikle sınırlıdır ve taramalar, ekipman türüne, görüntüleme ayarlarına veya klinik ortama göre değişiklik gösterebilir. Hasta anatomisi, açılar, aydınlatma veya görsel gürültüdeki farklılıklar, bilgisayar görme modellerinin hastalar ve hastaneler arasında iyi bir şekilde genelleştirilebilen kalıpları öğrenmesini zorlaştırabilir.
Veri artırma, eğitim sırasında aynı taramanın birden fazla varyasyonunu oluşturarak, örneğin gürültü ekleyerek, görüntüyü hafifçe kaydırarak veya küçük bozulmalar uygulayarak bu sorunu çözmeye yardımcı olur. Bu değişiklikler, eğitim verilerinin gerçek klinik koşulları daha iyi temsil etmesini sağlar.
Örneğin, bir pediatrik görüntüleme çalışmasında, araştırmacılar anatomik segmentasyon YOLO11 kullandılar ve onu artırılmış tıbbi verilerle eğittiler. Görüntüleri daha gerçekçi hale getirmek için ek gürültü, hafif konum kaymaları ve küçük bozulmalar gibi varyasyonlar eklediler.

Bu varyasyonlardan öğrenerek, model yüzey düzeyindeki farklılıklardan ziyade anlamlı anatomik özelliklere odaklandı. Bu, farklı taramalar ve hasta vakaları arasında segmentasyon sonuçlarının daha istikrarlı olmasını sağladı.
Çeşitli verileri toplamak zordur, ancak veri artırma, modellerin daha geniş bir görsel koşul yelpazesinden öğrenmesini sağlar. Bu, örtülmeler, aydınlatma değişiklikleri ve kalabalık sahnelerle başa çıkarken modelin daha sağlam olmasını sağlar. Genel olarak, bu, kontrollü eğitim ortamları dışında daha güvenilir bir performans sergilemelerine yardımcı olur.
Topluluğumuza katılın ve GitHub depomuzda Vision AI'daki en son gelişmeleri keşfedin. Üretimde yapay zeka ve sağlık hizmetlerinde bilgisayarla görme gibi uygulamaların nasıl ilerleme sağladığını öğrenmek için çözüm sayfalarımızı ziyaret edin ve bir sonraki yapay zeka çözümünüzü güçlendirmek için lisanslama seçeneklerimize göz atın.