Verini çeşitlendirmek için Albumentations artırmalarını kullanma
Ultralytics YOLO11'i özel olarak eğitirken model performansını çeşitli eğitim verileriyle artırmak için Albumentations kütüphanesini nasıl kullanacağını öğren.

Bir bilgisayarlı görü çözümü geliştirirken, görü yapay zeka modellerini eğitmek için çeşitli görüntü setleri toplamak sürecin en önemli kısımlarından biridir. Bu durum genellikle çok fazla zaman ve para gerektirir ve bazen toplanan görüntüler modellerin etkili bir şekilde öğrenmesi için yeterince çeşitli olmayabilir.
Örneğin, Ultralytics YOLO11 gibi bilgisayarlı görü modelleri, farklı uygulamalarla ilgili çeşitli bilgisayarlı görü görevleri için görüntü veri setleri üzerinde özel olarak eğitilebilir. Çeşitli veriler, modelin daha iyi genelleme yapmasına yardımcı olduğu için çok önemlidir; bu sayede nesneleri ve desenleri çok çeşitli gerçek dünya senaryolarında tanıyabilir.
Eğer veri çeşitliliği eksikliğiyle mücadele ediyorsan, görüntü veri artırma teknikleri harika bir çözüm olabilir. Döndürme, yansıtma ve parlaklığı ayarlama gibi yöntemler veri setinin çeşitliliğini artırmana ve modelin daha geniş bir koşul yelpazesini ele alma yeteneğini geliştirmene yardımcı olabilir.
İşte bu yüzden Ultralytics, görüntü veri artırma için bir entegrasyonu destekler. Bir dizi dönüşüm sunan popüler bir araç olan Albumentations kullanarak çeşitli görsel veriler oluşturabilirsin. Bu entegrasyon, eğitim görüntülerini otomatik olarak artırarak YOLO11 eğitim sürecini basitleştirir ve model performansının iyileşmesini sağlar.
Bu makalede, Albumentations entegrasyonunu nasıl kullanabileceğini, sağladığı faydaları ve model eğitimi üzerindeki etkisini keşfedeceğiz.
Link to this sectionAlbumentations nedir?#
Bilgisayarlı görü modelleri, farklı ortamlardaki nesneleri tanımak için geniş bir yüksek kaliteli görüntü kümesinden öğrenebilirler. Gerçek dünya kaynaklarından büyük veri setleri toplamak yavaş, maliyetli ve verimsiz olabilir. Bu görevi hızlandırmak için, daha fazla veri toplamadan modellerin farklı senaryolardan öğrenmesine yardımcı olacak şekilde mevcut görüntülerin yeni varyasyonlarını oluşturmak adına görüntü veri artırmayı kullanabilirsin.
Özellikle, 2018 yılında verimli görüntü veri artırma için tanıtılan açık kaynaklı bir kütüphane olan Albumentations'dan yararlanabilirsin. Döndürme ve yansıtma gibi basit geometrik değişikliklerden parlaklık, kontrast ve gürültü ekleme gibi daha karmaşık ayarlamalara kadar çeşitli işlemleri destekler.

Şekil 1. Farklı görüntü veri artırma türlerine örnekler.
Link to this sectionAlbumentations'ın temel özellikleri#
Albumentations, yüksek performansıyla bilinir; yani görüntüleri hızlı ve verimli bir şekilde işleyebilir. OpenCV ve NumPy gibi optimize edilmiş kütüphaneler üzerine inşa edildiğinden, büyük veri setlerini minimum işlem süresiyle yönetir ve bu da model eğitimi sırasında hızlı veri artırma için idealdir.
İşte Albumentations'ın diğer bazı temel özellikleri:
- Geniş dönüşüm yelpazesi: Albumentations, 70'ten fazla artırma türü sunar. Bu varyasyonlar, aydınlatma, açılar veya arka planlardaki değişikliklere rağmen modellerin nesneleri tespit etmeyi öğrenmesine yardımcı olur.
- Hız için optimize edilmiştir: Görüntü artırmayı hızlandırmak ve büyük veri setlerini verimli bir şekilde işlemek için birden fazla veri noktasını aynı anda işleyen SIMD (Single Instruction, Multiple Data) gibi gelişmiş optimizasyon teknikleri kullanır.
- Üç seviyeli artırma: Veriyi üç şekilde geliştirir. Örneğin, piksel seviyesindeki artırmalar nesneleri değiştirmeden parlaklığı ve rengi ayarlar. Bu arada, uzamsal seviyedeki artırmalar önemli detayları koruyarak nesne konumlandırmasını değiştirir ve karıştırma seviyesindeki artırmalar yeni örnekler oluşturmak için farklı görüntülerin parçalarını harmanlar.
Link to this sectionNeden Albumentations entegrasyonunu kullanmalısın?#
Şunu merak ediyor olabilirsin: Bir veri setine artırma uygulamanın birçok yolu var ve hatta OpenCV gibi araçları kullanarak kendininkini bile oluşturabilirsin. Peki neden Albumentations gibi bir kütüphaneyi destekleyen bir entegrasyonu seçesin?
OpenCV gibi araçlarla manuel olarak artırmalar oluşturmak çok zaman alabilir ve biraz uzmanlık gerektirir. Ayrıca en iyi sonuçları elde etmek için dönüşümlere ince ayar yapmak zor olabilir. Albumentations entegrasyonu bu süreci kolaylaştırır. Veri setini hazırlarken sana zaman ve emek kazandırabilecek birçok kullanıma hazır dönüşüm sunar.
Albumentations entegrasyonunu seçmenin bir diğer nedeni, Ultralytics model eğitimi hattı ile sorunsuz çalışmasıdır. Eğitim sırasında artırmalar otomatik olarak uygulandığından, YOLO11'i özel olarak eğitmek çok daha kolay hale gelir. Süreci basitleştirir, böylece veri hazırlığıyla uğraşmak yerine modelini geliştirmeye daha fazla odaklanabilirsin.
Link to this sectionAlbumentations entegrasyonuna başlarken#
İlginç bir şekilde, YOLO11'i eğitmek için Albumentations entegrasyonlarını kullanmak göründüğünden daha kolaydır. Doğru kütüphaneler kurulduğunda, entegrasyon eğitim sırasında görüntü veri artırmalarını otomatik olarak uygular. Modelin aynı veri setini kullanarak farklı görüntü varyasyonlarından öğrenmesine yardımcı olur.
Şimdi, YOLO11'i özel olarak eğitirken Albumentations entegrasyonunun nasıl kurulacağını ve kullanılacağını adım adım inceleyelim.
Link to this sectionUltralytics Python paketini ve Albumentations'ı kurma#
Artırmaları uygulamadan önce, hem Ultralytics Python paketi hem de Albumentations kurulu olmalıdır. Entegrasyon, her iki kütüphane de varsayılan olarak sorunsuz bir şekilde birlikte çalışacak şekilde oluşturulduğundan, karmaşık yapılandırmalar konusunda endişelenmene gerek yoktur.
Tüm kurulum süreci, aşağıda gösterildiği gibi Python kütüphanelerini kurmak için bir paket yönetim aracı olan tek bir pip komutuyla birkaç dakika içinde tamamlanabilir.

Şekil 2. Ultralytics ve Albumentations'ı kurma.
Albumentations kurulduğunda, Ultralytics model eğitim modu eğitim sırasında otomatik olarak görüntü artırmalarını uygular. Eğer Albumentations kurulu değilse, bu artırmalar uygulanmayacaktır. Daha fazla ayrıntı için resmi Ultralytics belgelerine başvurabilirsin.
Link to this sectionAlbumentations entegrasyonunun yardımıyla YOLO11'i eğitme#
Albumentations entegrasyonunun perde arkasında neler olduğuna dair daha iyi bir anlayış kazanalım.
İşte YOLO11 eğitimi sırasında uygulanan artırmalara daha yakından bir bakış:
- Bulanıklaştırma (Blur): Bu dönüşüm, görüntüye hafif bir bulanıklık ekler. Modelin odak dışı kalsa bile nesneleri tespit etmesine yardımcı olur.
- Medyan bulanıklaştırma (Median blur): Görüntüdeki nesne kenarlarını korurken rastgele gürültüyü azaltır. Bu, modelin karmaşık ortamlardaki nesneleri tespit etmesini kolaylaştırır.
- Gri tonlama (Grayscale): Bir görüntüyü siyah beyaza dönüştürerek, bu artırma modelin renklere değil şekillere ve dokulara odaklanmasına yardımcı olabilir.
- CLAHE (Kontrast sınırlı uyarlamalı histogram eşitleme): Bu artırma, özellikle çok karanlık veya görülmesi zor olan alanlarda, örneğin düşük ışıklı veya puslu koşullarda, görüntüdeki kontrastı artırır. Bu, o alanlardaki nesneleri daha net hale getirir ve modelin tanımlamasını kolaylaştırır.

Şekil 3. Bir kedi görüntüsüne uygulanan gri tonlama artırması örneği.
Link to this sectionYOLO11'in uygulamaları ve Albumentations entegrasyonu#
YOLO11'i belirli bir uygulama için özel olarak eğitiyorsan, Albumentations entegrasyonu çeşitli koşullara uyum sağlayarak modelin performansını artırmaya yardımcı olabilir. Bazı gerçek dünya uygulamalarını ve bu entegrasyonun çözebileceği zorlukları tartışalım.
Link to this sectionTıbbi görüntülemeyi iyileştirme#
Sağlık hizmetlerinde yapay zeka görüşü, doktorların teşhislere yardımcı olmak ve hasta bakımını iyileştirmek için tıbbi görüntüleri daha doğru bir şekilde analiz etmelerine yardımcı oluyor. Hatta, sağlık kuruluşlarının yaklaşık beşte biri halihazırda sağlık çözümleri için yapay zeka modellerini kullanıyor.
Ancak, bu bilgisayarlı görü çözümlerini oluşturmak kendi zorluklarını da beraberinde getiriyor. Tıbbi taramalar, farklı ekipmanlar, ayarlar ve hatta teknisyenlerin deneyimi gibi faktörlerden etkilenerek hastaneler arasında büyük farklılıklar gösterebilir. Parlaklık, kontrast ve pozlamadaki farklılıklar, bilgisayarlı görü modellerinin tutarlılığını ve doğruluğunu etkileyebilir ve bu da farklı ortamlarda güvenilir bir şekilde çalışmalarını zorlaştırabilir.
İşte Albumentations gibi araçların entegrasyonunun temel hale geldiği nokta burasıdır. Aynı taramanın birden fazla artırılmış sürümünü oluşturarak, Albumentations modelin çeşitli görüntü kalitelerinden öğrenmesini sağlar. Bu, modelin daha dayanıklı hale gelmesine yardımcı olur ve hem yüksek hem de düşük kaliteli görüntülerde hastalıkları doğru bir şekilde tespit etmesine olanak tanır.

Şekil 4. Artırılmış röntgen görüntüleri.
Link to this sectionGüvenliği ve gözetimi geliştirme#
Yapay zeka görüşünün bir diğer ilginç uygulaması güvenlik ve gözetimdir. Gerçek zamanlı nesne tespiti, güvenlik ekiplerinin olası tehditleri hızlı bir şekilde tanımlamasına yardımcı olabilir.
Bu uygulamayla ilgili temel bir endişe, güvenlik kameralarının gün boyunca çeşitli aydınlatma koşullarında görüntü yakalamasıdır ve bu koşullar bir modelin bu tür görüntüleri nasıl anladığını önemli ölçüde etkileyebilir. Düşük ışıklı ortamlar, parlama veya zayıf görünürlük gibi faktörler, bilgisayarlı görü modellerinin nesneleri tespit etmesini veya olası tehditleri tutarlı bir şekilde tanımasını zorlaştırabilir.
Albumentations entegrasyonu, farklı aydınlatma koşullarını taklit etmek için dönüşümler uygulayarak yardımcı olur. Bu, modelin hem parlak hem de düşük ışıklı ortamlarda nesneleri tespit etmeyi öğrenmesini sağlayarak onu daha güvenilir hale getirir ve zorlu koşullarda tepki sürelerini iyileştirir.
Link to this sectionPerakende iş akışlarını ve müşteri deneyimini yeniden tanımlama#
Bir süpermarket koridoruna dökülen bir sıvı, mağazada koşan bir köpek veya bir ürün reyonunu deviren bir çocuk, perakende ortamlarındaki bilgisayarlı görü için uç durumlar (edge cases) olabilecek günlük olaylardan sadece birkaçıdır. Bilgisayarlı görü, alışveriş yapanların davranışlarını izleyerek, yaya trafiğini takip ederek ve raflardaki ürünleri tanımlayarak müşteri deneyimini iyileştirmek için giderek daha fazla kullanılmaktadır. Ancak, bu gerçek dünya durumları yapay zeka sistemlerinin anlaması ve doğru bir şekilde işlemesi için zor olabilir.
Her senaryo bir bilgisayarlı görü veri setinde temsil edilemese de, Albumentations entegrasyonu beklenmedik aydınlatma, alışılmadık açılar veya engeller gibi birçok olası durumu kapsayacak şekilde verileri artırarak yardımcı olur. Bu, bilgisayarlı görü modellerinin çeşitli koşullara uyum sağlamasına yardımcı olur, uç durumları ele alma ve dinamik perakende ortamlarında doğru tahminler yapma yeteneklerini geliştirir.
Link to this sectionÖne çıkanlar#
Model eğitimi için çeşitli gerçek dünya verileri toplamak karmaşık olabilir, ancak Albumentations, modellerin farklı koşullara uyum sağlamasına yardımcı olan görüntü varyasyonları oluşturarak bunu kolaylaştırır.
Ultralytics tarafından desteklenen Albumentations entegrasyonu, YOLO11'i özel olarak eğitirken bu artırmaları uygulama sürecini basitleştirir. Bu, daha doğru ve güvenilir bilgisayarlı görü modelleri üreterek çok çeşitli endüstrilere fayda sağlayan daha iyi veri seti kalitesi ile sonuçlanır.
Yapay zeka hakkında daha fazla bilgi edinmek için topluluğumuza katıl ve GitHub depomuza göz at, ayrıca bilgisayarlı görü projelerini başlatmak için lisanslama seçeneklerimize bak. Üretimde yapay zeka veya otonom sürüşte bilgisayarlı görü gibi yeniliklerle ilgileniyor musun? Daha fazlasını keşfetmek için çözüm sayfalarımızı ziyaret et.






