"Tüm Çerezleri Kabul Et" seçeneğine tıklayarak, sitede gezinmeyi geliştirmek, site kullanımını analiz etmek ve pazarlama çabalarımıza yardımcı olmak için cihazınızda çerezlerin saklanmasını kabul edersiniz. Daha fazla bilgi
Çerez Ayarları
"Tüm Çerezleri Kabul Et" seçeneğine tıklayarak, sitede gezinmeyi geliştirmek, site kullanımını analiz etmek ve pazarlama çabalarımıza yardımcı olmak için cihazınızda çerezlerin saklanmasını kabul edersiniz. Daha fazla bilgi
Çeşitli eğitim verileriyle model performansını artırmak için özel Ultralytics YOLO11 eğitimi yaparken Albumentations'ı artırmalar için nasıl kullanacağınızı öğrenin.
Bir bilgisayarlı görü çözümü oluştururken, Vision AI modellerini eğitmek için çeşitli görüntüler toplamak sürecin önemli bir parçası olabilir. Bu genellikle çok fazla zaman ve para gerektirir ve bazen toplanan görüntüler modellerin etkili bir şekilde öğrenmesi için yeterince çeşitli olmayabilir.
Örneğin, Ultralytics YOLO11 gibi bilgisayarlı görü modelleri, çeşitli uygulamalarla ilgili farklı bilgisayarlı görü görevleri için görüntü veri kümeleri üzerinde özel olarak eğitilebilir. Çeşitli veriler önemlidir çünkü modelin daha iyi genelleşmesine yardımcı olur ve çok çeşitli gerçek dünya senaryolarında nesneleri ve örüntüleri tanımasını sağlar.
Çeşitli veri eksikliğiyle mücadele ediyorsanız, görüntü veri artırma teknikleri harika bir çözüm olabilir. Döndürme, çevirme ve parlaklığı ayarlama gibi yöntemler, veri kümenizin çeşitliliğini artırmaya ve modelin daha geniş bir koşul aralığını işleme yeteneğini geliştirmeye yardımcı olabilir.
Bu nedenle Ultralytics, görüntü veri artırma için bir entegrasyonu destekler. Bir dönüşüm koleksiyonu sunan popüler bir araç olan Albumentations'ı kullanarak, çeşitli görsel veriler oluşturabilirsiniz. Bu entegrasyon, eğitim görüntülerini otomatik olarak artırarak YOLO11'i eğitme sürecini basitleştirir ve model performansının iyileşmesine yol açar.
Bu makalede, Albumentations entegrasyonunu, faydalarını ve model eğitimi üzerindeki etkisini nasıl kullanabileceğinizi keşfedeceğiz.
Albumentations nedir?
Bilgisayarlı görü modelleri, farklı ortamlardaki nesneleri tanımak için geniş bir yüksek kaliteli görüntü kümesinden öğrenebilir. Gerçek dünya kaynaklarından büyük veri kümeleri toplamak yavaş, maliyetli ve verimsiz olabilir. Bu görevi kolaylaştırmak için, mevcut görüntülerin yeni varyasyonlarını oluşturmak için görüntü veri artırma kullanabilir ve modellerin daha fazla veri toplamadan farklı senaryolardan öğrenmesine yardımcı olabilirsiniz.
Özellikle, 2018'de verimli görüntü veri artırımı için tanıtılan açık kaynaklı bir kütüphane olan Albumentations'dan yararlanabilirsiniz. Döndürme ve çevirme gibi basit geometrik değişikliklerden, parlaklık, kontrast ve gürültü ekleme gibi daha karmaşık ayarlamalara kadar çeşitli işlemleri destekler.
Şekil 1. Farklı türde görüntü veri artırmalarına örnekler.
Albumentations'ın temel özellikleri
Albumentations, yüksek performansıyla bilinir; yani görüntüleri hızlı ve verimli bir şekilde işleyebilir. OpenCV ve NumPy gibi optimize edilmiş kütüphaneler üzerine inşa edildiğinden, büyük veri kümelerini minimum işlem süresiyle işler ve bu da onu model eğitimi sırasında hızlı veri artırma için ideal hale getirir.
İşte Albumentations'ın diğer temel özelliklerinden bazıları:
Geniş dönüşüm yelpazesi: Albumentations, 70'in üzerinde artırma türü sağlar. Bu varyasyonlar, modellerin aydınlatma, açılar veya arka planlardaki değişikliklere rağmen nesneleri algılamayı öğrenmesine yardımcı olur.
Hız için optimize edildi: Görüntü büyütmeyi hızlandırmak ve büyük veri kümelerini verimli bir şekilde işlemek için aynı anda birden çok veri noktasını işleyen SIMD (Tek Komut, Çoklu Veri) gibi gelişmiş optimizasyon tekniklerini kullanır.
Üç düzeyde artırma: Verileri üç şekilde geliştirir. Örneğin, piksel düzeyindeki artırmalar nesneleri değiştirmeden parlaklığı ve rengi ayarlar. Bu arada, uzamsal düzeydeki artırmalar temel ayrıntıları korurken nesne konumlandırmasını değiştirir ve karıştırma düzeyindeki artırmalar yeni örnekler oluşturmak için farklı görüntülerin parçalarını harmanlar.
Neden Albumentations entegrasyonunu kullanmalısınız?
Merak ediyor olabilirsiniz: Bir veri kümesine artırmalar uygulamanın birçok yolu vardır ve OpenCV gibi araçları kullanarak kendi artırmalarınızı bile oluşturabilirsiniz. Peki, neden Albumentations gibi bir kitaplığı destekleyen bir entegrasyonu seçmelisiniz?
OpenCV gibi araçlarla manuel olarak veri artırma oluşturmak çok zaman alabilir ve uzmanlık gerektirebilir. Ayrıca, en iyi sonuçları elde etmek için dönüşümleri ince ayar yapmak da zor olabilir. Albumentations entegrasyonu bu süreci kolaylaştırır. Veri kümenizi hazırlarken size zaman ve emekten tasarruf sağlayabilecek birçok kullanıma hazır dönüşüm sunar.
Albumentations entegrasyonunu seçmek için bir başka neden de, Ultralytics model eğitimi hattıyla sorunsuz bir şekilde çalışmasıdır. Eğitim sırasında artırmalar otomatik olarak uygulandığından, YOLO11'i özel olarak eğitmek çok daha kolaydır. Bu, süreci basitleştirir, böylece veri hazırlama ile uğraşmak yerine modelinizi geliştirmeye daha fazla odaklanabilirsiniz.
Albumentations entegrasyonuna başlama
İlginç bir şekilde, YOLO11'i eğitmek için Albumentations entegrasyonlarını kullanmak göründüğünden daha basittir. Doğru kütüphaneler kurulduktan sonra, entegrasyon eğitim sırasında görüntü veri artırmalarını otomatik olarak uygular. Modelin aynı veri kümesini kullanarak farklı görüntü varyasyonlarından öğrenmesine yardımcı olur.
Şimdi de YOLO11'i özel olarak eğitirken Albumentations entegrasyonunun nasıl kurulacağını ve kullanılacağını inceleyelim.
Ultralytics Python paketini ve Albumentations'ı yükleme
Artırmaları uygulamadan önce, hem Ultralytics Python paketinin hem de Albumentations'ın kurulu olması gerekir. Entegrasyon, her iki kütüphanenin de varsayılan olarak sorunsuz bir şekilde birlikte çalışması için oluşturulmuştur, bu nedenle karmaşık konfigürasyonlar hakkında endişelenmenize gerek yoktur.
Tüm kurulum işlemi, aşağıdaki resimde gösterildiği gibi, Python kütüphanelerini yüklemek için bir paket yönetim aracı olan tek bir pip komutuyla sadece birkaç dakika içinde tamamlanabilir.
Şekil 2. Ultralytics ve Albumentations'ı kurma.
Albumentations kurulduktan sonra, Ultralytics model eğitim modu, eğitim sırasında otomatik olarak görüntü artırmaları uygular. Albumentations kurulu değilse, bu artırmalar uygulanmaz. Daha fazla ayrıntı için resmi Ultralytics belgelerine başvurabilirsiniz.
Albumentations entegrasyonu yardımıyla YOLO11 eğitimi
Albumentations entegrasyonunun arka planında neler olup bittiğini daha iyi anlayalım.
İşte YOLO11 eğitimi sırasında uygulanan augmentasyonlara daha yakından bir bakış:
Bulanıklık: Bu dönüşüm, bir görüntüye hafif bir bulanıklık ekler. Modelin, odak dışı olduklarında bile nesneleri algılamasına yardımcı olur.
Medyan bulanıklığı: Bir görüntüdeki nesne kenarlarını korurken rastgele gürültüyü azaltır. Bu, modelin karmaşık ortamlarda nesneleri algılamasını kolaylaştırır.
Gri Tonlama: Bir görüntüyü siyah beyaza dönüştürerek, bu artırma modelin renkler yerine şekillere ve dokulara odaklanmasına yardımcı olabilir.
CLAHE (Kontrast sınırlı uyarlanabilir histogram eşitleme): Bu artırma, özellikle düşük ışık veya puslu koşullar gibi çok karanlık veya görülmesi zor alanlardaki görüntülerin kontrastını artırır. Bu, bu alanlardaki nesneleri daha net hale getirir ve modelin tanımlamasını kolaylaştırır.
Şekil 3. Bir kedi resmine uygulanan bir gri tonlama artırma örneği.
YOLO11 ve Albumentations entegrasyonunun uygulamaları
Belirli bir uygulama için YOLO11'i özel olarak eğitiyorsanız, Albumentations entegrasyonu, çeşitli koşullara uyum sağlayarak modelin performansını artırmaya yardımcı olabilir. Şimdi bazı gerçek dünya uygulamalarını ve bu entegrasyonun çözebileceği zorlukları tartışalım.
Ancak, bu bilgisayarlı görü çözümlerini oluşturmak da kendi zorluklarını beraberinde getirir. Tıbbi taramalar, farklı ekipman, ayarlar ve hatta teknisyenlerin deneyimi gibi faktörlerden etkilenerek hastaneler arasında büyük farklılıklar gösterebilir. Parlaklık, kontrast ve pozlamadaki farklılıklar, Görüntü AI modellerinin tutarlılığını ve doğruluğunu etkileyebilir ve farklı ortamlarda güvenilir bir şekilde performans göstermelerini zorlaştırabilir.
İşte burada Albumentations gibi araçların entegrasyonu hayati önem taşıyor. Albumentations, aynı taramanın birden çok artırılmış sürümünü oluşturarak modelin çeşitli görüntü kalitelerinden öğrenmesini sağlar. Bu, modelin daha sağlam hale gelmesine yardımcı olur ve hem yüksek hem de düşük kaliteli görüntülerde hastalıkları doğru bir şekilde tespit etmesini sağlar.
Görüntü İşleme Yapay Zekasının bir diğer ilginç uygulaması da güvenlik ve gözetimdedir. Gerçek zamanlı nesne tespiti, güvenlik ekiplerinin potansiyel tehditleri hızlı bir şekilde belirlemesine yardımcı olabilir.
Bu uygulamayla ilgili temel bir endişe, güvenlik kameralarının gün boyunca çeşitli aydınlatma koşullarında çekim yapması ve bu koşulların bir modelin bu tür görüntüleri nasıl anladığını önemli ölçüde etkileyebilmesidir. Düşük ışıklı ortamlar, parlama veya yetersiz görüş gibi faktörler, bilgisayarlı görü modellerinin nesneleri algılamasını veya potansiyel tehditleri tutarlı bir şekilde tanımasını zorlaştırabilir.
Albumentations entegrasyonu, farklı ışıklandırma koşullarını taklit ederek dönüşümler uygulamaya yardımcı olur. Bu, modelin hem parlak hem de loş ortamlarda nesneleri algılamasını sağlayarak daha güvenilir hale getirir ve zorlu koşullarda yanıt sürelerini iyileştirir.
Perakende iş akışlarını ve müşteri deneyimini yeniden tanımlama
Bir süpermarket koridorunda dökülen bir şey, bir mağazada koşan bir köpek veya bir çocuğun bir ürün teşhirini devirmesi, perakende ortamlarındaki Görüntü İşleme Yapay Zekası için günlük olayların sadece birkaç örneğidir. Bilgisayarlı görü, alışveriş yapanların davranışlarını izleyerek, yaya trafiğini izleyerek ve raflardaki ürünleri tanımlayarak müşteri deneyimini iyileştirmek için giderek daha fazla kullanılmaktadır. Ancak, bu gerçek dünya durumlarının yapay zeka sistemleri tarafından anlaşılması ve doğru bir şekilde işlenmesi zor olabilir.
Her senaryo bir bilgisayarlı görü veri kümesinde temsil edilemese de, Albumentations entegrasyonu, beklenmedik aydınlatma, alışılmadık açılar veya engeller gibi birçok olası durumu kapsayacak şekilde verileri artırarak yardımcı olur. Bu, bilgisayarlı görü modellerinin çeşitli koşullara uyum sağlamasına, uç durumları ele alma ve dinamik perakende ortamlarında doğru tahminler yapma yeteneklerini geliştirmesine yardımcı olur.
Önemli çıkarımlar
Model eğitimi için çeşitli gerçek dünya verileri toplamak karmaşık olabilir, ancak Albumentations, modellerin farklı koşullara uyum sağlamasına yardımcı olan görüntü varyasyonları oluşturarak bu süreci kolaylaştırır.
Ultralytics tarafından desteklenen Albumentations entegrasyonu, özel YOLO11 eğitimi sırasında bu artırmaları uygulama sürecini basitleştirir. Bu, daha doğru ve güvenilir Vision AI modelleri üreterek çok çeşitli sektörlere fayda sağlayan daha iyi veri seti kalitesiyle sonuçlanır.