Ultralytics YOLO Albümantasyonlarla Veri Artırma

Bir bilgisayarlı görü çözümü oluştururken, Vision AI modellerini eğitmek için çeşitli görüntüler toplamak sürecin önemli bir parçası olabilir. Bu genellikle çok fazla zaman ve para gerektirir ve bazen toplanan görüntüler modellerin etkili bir şekilde öğrenmesi için yeterince çeşitli olmayabilir.

Örneğin, bilgisayarla görme modelleri Ultralytics YOLO11 farklı uygulamalarla ilgili çeşitli bilgisayarla görme görevleri için görüntü veri kümeleri üzerinde özel olarak eğitilebilir. Farklı veriler çok önemlidir çünkü modelin daha iyi genelleme yapmasına yardımcı olarak çok çeşitli gerçek dünya senaryolarındaki nesneleri ve desenleri tanımasını sağlar.

Çeşitli veri eksikliğiyle mücadele ediyorsanız, görüntü veri artırma teknikleri harika bir çözüm olabilir. Döndürme, çevirme ve parlaklığı ayarlama gibi yöntemler, veri kümenizin çeşitliliğini artırmaya ve modelin daha geniş bir koşul aralığını işleme yeteneğini geliştirmeye yardımcı olabilir.

Bu nedenle Ultralytics , görüntü verilerinin artırılması için bir entegrasyonu destekler. Bir dönüşüm koleksiyonu sunan popüler bir araç olan Albumentations'ı kullanarak çeşitli görsel veriler oluşturabilirsiniz. Bu entegrasyon, eğitim görüntülerini otomatik olarak artırarak YOLO11 eğitim sürecini basitleştirir ve model performansının artmasını sağlar.

Bu makalede, Albumentations entegrasyonunu, faydalarını ve model eğitimi üzerindeki etkisini nasıl kullanabileceğinizi keşfedeceğiz.

Albumentations nedir?

Bilgisayarlı görü modelleri, farklı ortamlardaki nesneleri tanımak için geniş bir yüksek kaliteli görüntü kümesinden öğrenebilir. Gerçek dünya kaynaklarından büyük veri kümeleri toplamak yavaş, maliyetli ve verimsiz olabilir. Bu görevi kolaylaştırmak için, mevcut görüntülerin yeni varyasyonlarını oluşturmak için görüntü veri artırma kullanabilir ve modellerin daha fazla veri toplamadan farklı senaryolardan öğrenmesine yardımcı olabilirsiniz.

Özellikle, 2018'de verimli görüntü veri artırımı için tanıtılan açık kaynaklı bir kütüphane olan Albumentations'dan yararlanabilirsiniz. Döndürme ve çevirme gibi basit geometrik değişikliklerden, parlaklık, kontrast ve gürültü ekleme gibi daha karmaşık ayarlamalara kadar çeşitli işlemleri destekler.

__wf_reserved_inherit — Şekil 1. Farklı türde görüntü veri artırmalarına örnekler.

‍

Albumentations'ın temel özellikleri

Albumentations yüksek performansı ile bilinir, yani görüntüleri hızlı ve verimli bir şekilde işleyebilir. gibi optimize edilmiş kütüphaneler üzerine inşa edilmiştir. OpenCV ve NumPy ile birlikte kullanıldığında, büyük veri kümelerini minimum işlem süresiyle işler ve model eğitimi sırasında hızlı veri artırımı için idealdir.

İşte Albumentations'ın diğer temel özelliklerinden bazıları:

Geniş dönüşüm yelpazesi: Albumentations 70'in üzerinde çeşitlilik sağlar. Bu varyasyonlar, modellerin ışık, açı veya arka plandaki değişikliklere rağmen nesneleri detect öğrenmelerine yardımcı olur.
‍
Hız için optimize edildi: Görüntü büyütmeyi hızlandırmak ve büyük veri kümelerini verimli bir şekilde işlemek için aynı anda birden çok veri noktasını işleyen SIMD (Tek Komut, Çoklu Veri) gibi gelişmiş optimizasyon tekniklerini kullanır.
‍
Üç düzeyde artırma: Verileri üç şekilde geliştirir. Örneğin, piksel düzeyindeki artırmalar nesneleri değiştirmeden parlaklığı ve rengi ayarlar. Bu arada, uzamsal düzeydeki artırmalar temel ayrıntıları korurken nesne konumlandırmasını değiştirir ve karıştırma düzeyindeki artırmalar yeni örnekler oluşturmak için farklı görüntülerin parçalarını harmanlar.

Neden Albumentations entegrasyonunu kullanmalısınız?

Merak ediyor olabilirsiniz: Bir veri kümesine büyütme uygulamanın birçok yolu vardır ve hatta OpenCV gibi araçları kullanarak kendiniz bile oluşturabilirsiniz. Peki, neden Albumentations gibi bir kütüphaneyi destekleyen bir entegrasyon seçmelisiniz?

OpenCV gibi araçlarla manuel olarak büyütmeler oluşturmak çok zaman alabilir ve biraz uzmanlık gerektirir. En iyi sonuçları elde etmek için dönüşümlere ince ayar yapmak da zor olabilir. Albumentations entegrasyonu bu süreci kolaylaştırır. Veri setinizi hazırlarken size zaman ve emek kazandırabilecek birçok kullanıma hazır dönüşüm sunar.

Albumentations entegrasyonunu seçmenin bir başka nedeni de Ultralytics model eğitim hattı ile sorunsuz çalışmasıdır. Arttırmalar eğitim sırasında otomatik olarak uygulandığından, YOLO11'i özel olarak eğitmeyi çok daha kolay hale getirir. Süreci basitleştirir, böylece veri hazırlama ile uğraşmak yerine modelinizi geliştirmeye daha fazla odaklanabilirsiniz.

Albumentations entegrasyonuna başlama

İlginç bir şekilde, YOLO11 'i eğitmek için Albumentations entegrasyonlarını kullanmak göründüğünden daha basittir. Doğru kütüphaneler kurulduktan sonra, entegrasyon eğitim sırasında otomatik olarak görüntü verisi artırımları uygular. Modelin aynı veri kümesini kullanarak farklı görüntü varyasyonlarından öğrenmesine yardımcı olur.

Daha sonra, YOLO11'i özel olarak eğitirken Albumentations entegrasyonunun nasıl kurulacağını ve kullanılacağını inceleyelim.

Ultralytics Python paketini ve Albumentations'ı yükleme

Büyütmeleri uygulamadan önce, hem Ultralytics Python paketinin hem de Albumentations'ın yüklenmesi gerekir. Entegrasyon, her iki kütüphanenin de varsayılan olarak sorunsuz bir şekilde birlikte çalışacağı şekilde oluşturulmuştur, bu nedenle karmaşık yapılandırmalar hakkında endişelenmenize gerek yoktur.

Tüm yükleme işlemi, aşağıdaki resimde gösterildiği gibi Python kütüphanelerini yüklemek için bir paket yönetim aracı olan tek bir pip komutu ile sadece birkaç dakika içinde tamamlanabilir.

Albumentations yüklendikten sonra, Ultralytics model eğitim modu eğitim sırasında görüntü büyütmelerini otomatik olarak uygular. Albumentations yüklü değilse, bu büyütmeler uygulanmayacaktır. Daha fazla ayrıntı için resmi Ultralytics belgelerine başvurabilirsiniz.

Albumentations entegrasyonu yardımıyla YOLO11 eğitimi

Albumentations entegrasyonunun arka planında neler olup bittiğini daha iyi anlayalım.

İşte YOLO11 eğitimi sırasında uygulanan güçlendirmelere daha yakından bir bakış:

Bulanıklık: Bu dönüşüm bir görüntüye hafif bir bulanıklık ekler. Modelin nesneleri odak dışında olsalar bile detect yardımcı olur.
‍
Medyan bulanıklık: Bir görüntüdeki nesne kenarlarını korurken rastgele gürültüyü azaltır. Bu, modelin karmaşık ortamlardaki nesneleri detect etmesini kolaylaştırır.
‍
Gri Tonlama: Bir görüntüyü siyah beyaza dönüştürerek, bu artırma modelin renkler yerine şekillere ve dokulara odaklanmasına yardımcı olabilir.
‍
CLAHE (Kontrast sınırlı uyarlanabilir histogram eşitleme): Bu artırma, özellikle düşük ışık veya puslu koşullar gibi çok karanlık veya görülmesi zor alanlardaki görüntülerin kontrastını artırır. Bu, bu alanlardaki nesneleri daha net hale getirir ve modelin tanımlamasını kolaylaştırır.

‍

YOLO11 ve Albumentations entegrasyonunun uygulamaları

YOLO11 'i belirli bir uygulama için özel olarak eğitiyorsanız, Albumentations entegrasyonu çeşitli koşullara uyum sağlayarak modelin performansını artırmaya yardımcı olabilir. Bazı gerçek dünya uygulamalarını ve bu entegrasyonun çözebileceği zorlukları tartışalım.

Tıbbi görüntülemeyi iyileştirme

Sağlık hizmetlerinde yapay görme, doktorların teşhislere yardımcı olmak ve hasta bakımını iyileştirmek için tıbbi görüntüleri daha doğru bir şekilde analiz etmelerine yardımcı oluyor. Aslında, sağlık kuruluşlarının yaklaşık beşte biri zaten yapay zeka çözümleri kullanıyor.

Ancak, bu bilgisayarlı görü çözümlerini oluşturmak da kendi zorluklarını beraberinde getirir. Tıbbi taramalar, farklı ekipman, ayarlar ve hatta teknisyenlerin deneyimi gibi faktörlerden etkilenerek hastaneler arasında büyük farklılıklar gösterebilir. Parlaklık, kontrast ve pozlamadaki farklılıklar, Görüntü AI modellerinin tutarlılığını ve doğruluğunu etkileyebilir ve farklı ortamlarda güvenilir bir şekilde performans göstermelerini zorlaştırabilir.

İşte bu noktada Albumentations gibi araçların entegrasyonu önem kazanıyor. Albumentations, aynı taramanın birden fazla artırılmış versiyonunu oluşturarak modelin çeşitli görüntü kalitelerinden öğrenmesini sağlar. Bu, modelin daha sağlam olmasına yardımcı olarak hem yüksek hem de düşük kaliteli görüntülerde hastalıkları doğru bir şekilde detect etmesini sağlar.

‍

Güvenlik ve gözetimi geliştirme

Görüntü İşleme Yapay Zekasının bir diğer ilginç uygulaması da güvenlik ve gözetimdedir. Gerçek zamanlı nesne tespiti, güvenlik ekiplerinin potansiyel tehditleri hızlı bir şekilde belirlemesine yardımcı olabilir.

Bu uygulamayla ilgili temel endişe, güvenlik kameralarının gün boyunca çeşitli aydınlatma koşulları altında görüntü çekmesi ve bu koşulların bir modelin bu tür görüntüleri nasıl anladığını önemli ölçüde etkileyebilmesidir. Düşük ışıklı ortamlar, parlama veya zayıf görüş gibi faktörler bilgisayarla görme modellerinin nesneleri detect etmesini veya potansiyel tehditleri tutarlı bir şekilde tanımasını zorlaştırabilir.

Albumentations entegrasyonu, farklı aydınlatma koşullarını taklit etmek için dönüşümler uygulayarak yardımcı olur. Bu, modelin hem parlak hem de düşük ışıklı ortamlarda nesneleri detect öğrenmesini sağlayarak onu daha güvenilir hale getirir ve zorlu koşullarda yanıt sürelerini iyileştirir.

Perakende iş akışlarını ve müşteri deneyimini yeniden tanımlama

Bir süpermarket koridorunda dökülen bir şey, bir mağazada koşan bir köpek veya bir çocuğun bir ürün teşhirini devirmesi, perakende ortamlarındaki Görüntü İşleme Yapay Zekası için günlük olayların sadece birkaç örneğidir. Bilgisayarlı görü, alışveriş yapanların davranışlarını izleyerek, yaya trafiğini izleyerek ve raflardaki ürünleri tanımlayarak müşteri deneyimini iyileştirmek için giderek daha fazla kullanılmaktadır. Ancak, bu gerçek dünya durumlarının yapay zeka sistemleri tarafından anlaşılması ve doğru bir şekilde işlenmesi zor olabilir.

Her senaryo bir bilgisayarlı görü veri kümesinde temsil edilemese de, Albumentations entegrasyonu, beklenmedik aydınlatma, alışılmadık açılar veya engeller gibi birçok olası durumu kapsayacak şekilde verileri artırarak yardımcı olur. Bu, bilgisayarlı görü modellerinin çeşitli koşullara uyum sağlamasına, uç durumları ele alma ve dinamik perakende ortamlarında doğru tahminler yapma yeteneklerini geliştirmesine yardımcı olur.

Önemli çıkarımlar

Model eğitimi için çeşitli gerçek dünya verileri toplamak karmaşık olabilir, ancak Albumentations, modellerin farklı koşullara uyum sağlamasına yardımcı olan görüntü varyasyonları oluşturarak bu süreci kolaylaştırır.

Ultralytics tarafından desteklenen Albumentations entegrasyonu, YOLO11'i özel olarak eğitirken bu artırımları uygulama sürecini basitleştirir. Bu, daha doğru ve güvenilir Vision AI modelleri üreterek çok çeşitli endüstrilere fayda sağlayan daha iyi veri seti kalitesi ile sonuçlanır.

Yapay zeka hakkında daha fazla bilgi edinmek için topluluğumuza katılın ve GitHub depomuzu keşfedin ve Vision AI projelerinize başlamak için lisanslama seçeneklerimize göz atın. Üretimde yapay zeka veya otonom sürüşte bilgisayarlı görü gibi yeniliklerle mi ilgileniyorsunuz? Daha fazlasını keşfetmek için çözüm sayfalarımızı ziyaret edin.

Verilerinizi çeşitlendirmek için Albumentations artırmalarını kullanma