YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024

2025'teki en iyi bilgisayarlı görü veri kümelerini keşfetme

Abirami Vina

5 dakikalık okuma

21 Şubat 2025

2025'in en iyi bilgisayarlı görü veri kümelerine yakından bakarken bize katılın. Çeşitli ve yüksek kaliteli veri kümelerinin daha akıllı Vision AI çözümlerini nasıl desteklediğini öğrenin.

Verilerin günlük olarak yaptığınız neredeyse her şeyde rol oynadığını biliyor muydunuz? Bir video izlemek, fotoğraf çekmek veya Google Haritalar'ı kontrol etmek, 75 milyardan fazla bağlı cihaz tarafından yakalanan sürekli bilgi akışına katkıda bulunur. Bu veri parçaları, yapay zekanın (AI) temelini oluşturur. Aslında, Ultralytics YOLO11 gibi gelişmiş bilgisayarlı görü modelleri, kalıpları belirlemek, görüntüleri yorumlamak ve etrafımızdaki dünyayı anlamlandırmak için görsel verilere güvenir.

İlginç bir şekilde, verinin değeri sadece miktarla ilgili değildir. Ne kadar iyi organize edildiği ve hazırlandığı daha önemlidir. Bir veri kümesi dağınık veya eksikse, hatalara yol açabilir. Ancak, veri kümeleri temiz ve çeşitli olduğunda, kalabalıkta nesneleri tanımak veya karmaşık görselleri analiz etmek gibi bilgisayar görüşü modellerinin daha iyi performans göstermesine yardımcı olurlar. Yüksek kaliteli veri kümeleri her şeyi değiştirir.

Bu makalede, 2025'in en iyi bilgisayarlı görü veri kümelerini inceleyecek ve bunların daha doğru ve verimli bilgisayarlı görü modelleri oluşturmaya nasıl katkıda bulunduğunu göreceğiz. Hadi başlayalım!

Bilgisayarlı görü veri setleri nelerdir?

Bir bilgisayarlı görü veri kümesi, bilgisayarlı görü sistemlerinin görsel bilgileri anlamayı ve tanımayı öğrenmesine yardımcı olan bir resim veya video koleksiyonudur. Bu veri kümeleri, modellerin verilerdeki nesneleri, kişileri, sahneleri ve desenleri tanımasına yardımcı olan etiketler veya açıklamalarla birlikte gelir.

Bilgisayarlı görme modellerini eğitmek için kullanılabilirler ve yüzleri tanımlama, nesneleri algılama veya sahneleri analiz etme gibi görevleri geliştirmelerine yardımcı olurlar. Veri kümesi ne kadar iyi olursa (iyi organize edilmiş, çeşitli ve doğru), Vision AI modeli o kadar iyi performans gösterir ve günlük yaşamda daha akıllı ve daha kullanışlı teknolojiye yol açar.

Bir bilgisayarlı görü veri kümesi nasıl oluşturulur

Bir bilgisayarlı görü veri kümesi oluşturmak, birine dünyayı nasıl göreceğini ve anlayacağını öğretmek için çalışma notları hazırlamaya benzer. Her şey, geliştirmekte olduğunuz belirli uygulamayla eşleşen görüntüleri ve videoları toplamakla başlar. 

İdeal bir veri kümesi, farklı açılardan, çeşitli aydınlatma koşullarında ve birden fazla arka plan ve ortamda yakalanan ilgi nesnelerinin çeşitli örneklerini içerir. Bu çeşitlilik, bilgisayarlı görü modelinin kalıpları doğru bir şekilde öğrenmesini ve gerçek dünya senaryolarında güvenilir bir şekilde performans göstermesini sağlar.

__wf_reserved_inherit
Şekil 1. Mükemmel görüntü veri setini oluşturmak. Yazarın görseli.

İlgili görüntüleri ve videoları topladıktan sonraki adım, veri etiketlemedir. Bu işlem, yapay zekanın her görüntü veya videonun ne içerdiğini anlaması için verilere etiketler, açıklamalar veya tanımlar eklemeyi içerir. 

Etiketler, nesne adlarını, konumlarını, sınırlarını veya modelin görsel bilgileri doğru bir şekilde tanımasına ve yorumlamasına yardımcı olan diğer ilgili ayrıntıları içerebilir. Veri etiketleme, basit bir görüntü koleksiyonunu, bir bilgisayar görüşü modelini eğitmek için kullanılabilecek yapılandırılmış bir veri kümesine dönüştürür.

Model eğitimi yüksek kaliteli veriler gerektirir

Bir veri kümesini yüksek kaliteli yapan şeyin ne olduğunu merak ediyor olabilirsiniz. Doğru etiketleme, çeşitlilik ve tutarlılık gibi birçok faktör söz konusudur. Örneğin, birden fazla etiketleyici bir nesne algılama veri kümesini kedi kulaklarını tanımlamak için etiketliyorsa, biri bunları başın bir parçası olarak etiketleyebilirken, diğeri bunları ayrı olarak kulak olarak etiketleyebilir. Bu tutarsızlık modeli şaşırtabilir ve doğru öğrenme yeteneğini etkileyebilir.

İdeal bir bilgisayarlı görü veri setinin niteliklerine dair hızlı bir genel bakış:

  • Net etiketler: Her görüntü, tutarlı ve kesin etiketlerle doğru bir şekilde açıklanmıştır.
  • Çeşitli veriler: Veri seti, modelin çeşitli durumlarda iyi çalışmasına yardımcı olmak için farklı nesneler, arka planlar, aydınlatma koşulları ve açılar içerir.
  • Yüksek çözünürlüklü görüntüler: Keskin, ayrıntılı görüntüler, modelin özellikleri öğrenmesini ve tanımasını kolaylaştırır.

Ultralytics çeşitli veri kümelerini destekler

YOLO11 gibi Ultralytics YOLO modelleri, belirli bir YOLO dosya formatındaki veri kümeleriyle çalışmak üzere oluşturulmuştur. Kendi verilerinizi bu formata dönüştürmek kolay olsa da, hemen denemeye başlamak isteyenler için sorunsuz bir seçenek de sunuyoruz. 

Ultralytics Python paketi, çok çeşitli bilgisayarlı görü veri setlerini destekler ve nesne tespiti, örnek segmentasyonu veya poz tahmini gibi görevleri kullanarak herhangi bir ek kurulum yapmadan projelere dalmanıza olanak tanır.  

Kullanıcılar, eğitim fonksiyonunda parametrelerden biri olarak veri kümesi adını belirterek COCO, DOTA-v2.0, Open Images V7 ve ImageNet gibi kullanıma hazır veri kümelerine kolayca erişebilir. Bunu yaptığınızda, veri kümesi otomatik olarak indirilir ve önceden yapılandırılır, böylece modellerinizi oluşturmaya ve iyileştirmeye odaklanabilirsiniz.

2025'te en iyi 5 bilgisayar görüşü veri seti

Görüntü Yapay Zekasındaki gelişmeler, inovasyonu yönlendiren ve atılımları mümkün kılan çeşitli, büyük ölçekli veri kümelerine dayanır. Ultralytics tarafından desteklenen ve bilgisayarlı görü modellerini etkileyen en önemli veri kümelerinden bazılarına bir göz atalım.

ImageNet veri kümesi 

ImageNet, Fei-Fei Li ve Princeton Üniversitesi'ndeki ekibi tarafından 2007'de oluşturulan ve 2009'da tanıtılan, 14 milyondan fazla etiketli görüntüye sahip büyük bir veri kümesidir. Sistemleri farklı nesneleri tanımak ve kategorize etmek için eğitmek için yaygın olarak kullanılır. Yapılandırılmış tasarımı, modelleri görüntüleri doğru bir şekilde sınıflandırmayı öğretmek için özellikle yararlı kılar. İyi belgelenmiş olmasına rağmen, öncelikle görüntü sınıflandırmasına odaklanır ve nesne tespiti gibi görevler için ayrıntılı açıklamalardan yoksundur. 

İşte ImageNet'in bazı temel güçlü yönlerine bir bakış:

  • Çeşitlilik: 20.000'den fazla kategoriyi kapsayan görüntülerle ImageNet, model eğitimini ve genellemesini geliştiren geniş ve çeşitli bir veri seti sunar.
  • Yapılandırılmış organizasyon: Görüntüler, WordNet hiyerarşisi kullanılarak titizlikle kategorize edilir, bu da verimli veri alımını ve sistematik model eğitimini kolaylaştırır. 
  • Kapsamlı dokümantasyon: Kapsamlı araştırma ve yıllarca süren çalışma, ImageNet'i hem yeni başlayanlar hem de uzmanlar için erişilebilir kılar ve bilgisayarla görme projeleri için değerli içgörüler ve rehberlik sağlar.

Ancak, herhangi bir veri kümesi gibi, bunun da sınırlamaları vardır. İşte dikkate alınması gereken bazı zorluklar:

  • Hesaplama talepleri: Büyük boyutu, sınırlı bilgi işlem kaynaklarına sahip daha küçük ekipler için zorluklar oluşturabilir.
  • Zamansal veri eksikliği: Yalnızca statik görüntüler içerdiğinden, video veya zamana dayalı veriler gerektiren uygulamaların ihtiyaçlarını karşılamayabilir.
  • Güncel Olmayan Görüntüler: Veri kümesindeki bazı görüntüler daha eskidir ve mevcut nesneleri, stilleri veya ortamları yansıtmayabilir, bu da modern uygulamalar için alaka düzeyini potansiyel olarak azaltır.

DOTA-v2.0 veri kümesi

DOTA-v2.0 veri seti (DOTA, Hava Görüntülerinde Nesne Tespiti için Veri Seti anlamına gelir), özellikle yönlendirilmiş sınırlayıcı kutu (OBB) nesne tespiti için oluşturulmuş kapsamlı bir hava görüntüleri koleksiyonudur. OBB tespitinde, görüntüdeki nesnelerin gerçek yönelimine daha doğru şekilde hizalamak için döndürülmüş sınırlayıcı kutular kullanılır. Bu yöntem, nesnelerin genellikle çeşitli açılarda göründüğü hava görüntüleri için özellikle iyi sonuç verir ve daha hassas lokalizasyon ve genel olarak daha iyi tespit sağlar.

Bu veri seti, 18 nesne kategorisinde 11.000'den fazla görüntü ve 1,7 milyondan fazla yönlendirilmiş sınırlayıcı kutudan oluşur. Görüntüler 800×800 ile 20.000×20.000 piksel arasında değişir ve uçaklar, gemiler ve binalar gibi nesneleri içerir. 

__wf_reserved_inherit
Şekil 2. DOTA-v2.0 veri setinden görüntüler ve açıklamalar örnekleri. Yazarın görseli.

Ayrıntılı açıklamaları nedeniyle DOTA-v2.0, uzaktan algılama ve hava gözetleme projeleri için popüler bir seçim haline geldi. İşte DOTA-v2.0'ın temel özelliklerinden bazıları:

  • Çeşitli nesne kategorileri: Modelleri çeşitli gerçek dünya nesnelerine maruz bırakarak, araçlar, limanlar ve depolama tankları gibi birçok farklı nesne türünü kapsar.
  • Yüksek kaliteli etiketlemeler: Uzman etiketleyiciler, nesne şekillerini ve yönlerini açıkça gösteren, hassas bir şekilde yönlendirilmiş sınırlayıcı kutular sağlamıştır.
  • Çok ölçekli görüntüler: Veri kümesi, farklı boyutlarda görüntüler içerir ve modellerin nesneleri hem küçük hem de büyük ölçeklerde nasıl tespit edeceğini öğrenmelerine yardımcı olur.

DOTA-v2'nin birçok güçlü yönü olmasına rağmen, kullanıcıların akılda tutması gereken bazı sınırlamalar şunlardır:

  • Ek indirme adımları: DOTA veri kümesinin tutulma şekli nedeniyle, DOTA-v2.0 ek bir kurulum adımı gerektirir. Öncelikle DOTA-v1.0 görüntülerini indirmeniz ve ardından veri kümesini tamamlamak için DOTA-v2.0 için ek görüntüleri ve güncellenmiş açıklamaları eklemeniz gerekir.
  • Karmaşık açıklamalar: Yönlendirilmiş sınırlayıcı kutular, model eğitimi sırasında ele almak için ekstra çaba gerektirebilir.
  • Sınırlı kapsam: DOTA-v2, hava görüntüleri için tasarlanmıştır, bu da onu bu alanın dışındaki genel nesne tespiti görevleri için daha az kullanışlı hale getirir.

Roboflow 100 veri kümesi 

Roboflow 100 (RF100) veri seti, Roboflow tarafından Intel'in desteğiyle oluşturulmuştur. Nesne tespit modellerinin ne kadar iyi çalıştığını test etmek ve kıyaslamak için kullanılabilir. Bu kıyaslama veri seti, 90.000'den fazla genel veri seti arasından seçilen 100 farklı veri setini içerir. Sağlık hizmetleri, havadan görünümler ve oyun gibi alanlardan 224.000'den fazla görüntüye ve 800 nesne sınıfına sahiptir. 

İşte RF100 kullanmanın bazı temel avantajları:

  • Geniş alan kapsamı: Tıbbi görüntüleme, havadan görünümler ve su altı araştırmaları gibi yedi alandan veri kümeleri içerir.
  • Model iyileştirmesini teşvik eder: RF100'deki değişkenlik ve alana özgü zorluklar, mevcut modellerdeki boşlukları ortaya çıkararak, daha uyarlanabilir ve sağlam nesne algılama çözümlerine yönelik araştırmaları teşvik eder.
  • Tutarlı görüntü formatı: Tüm görüntüler 640x640 piksel boyutuna yeniden boyutlandırılır. Bu, kullanıcıların görüntü boyutlarını ayarlamalarına gerek kalmadan modelleri eğitmelerine yardımcı olur.

Güçlü yönlerine rağmen, RF100'ün de akılda tutulması gereken bazı dezavantajları vardır:

  • Görevler açısından sınırlı: RF100, nesne tespiti için tasarlanmıştır, bu nedenle segmentasyon veya sınıflandırma gibi görevleri barındıramaz.
  • Kıyaslama merkezli odak: RF100 öncelikle gerçek dünya uygulamaları için modelleri eğitmekten ziyade bir kıyaslama aracı olarak tasarlanmıştır, bu nedenle sonuçları pratik dağıtım senaryolarına tam olarak yansımayabilir.
  • Açıklama değişkenliği: RF100, kitlesel kaynaklı veri kümelerini topladığından, açıklama kalitesi ve etiketleme uygulamalarında tutarsızlıklar olabilir ve bu da model değerlendirmesini ve ince ayarını etkileyebilir.

COCO (Bağlam içindeki genel nesneler) veri kümesi

COCO veri seti, detaylı görsel açıklamaları içeren 330.000'den fazla görüntü sunan, bilgisayarlı görü alanında en yaygın kullanılan veri setlerinden biridir. Nesne tespiti, segmentasyonu ve görüntü başlığı oluşturma için tasarlanmıştır ve bu da onu birçok proje için değerli bir kaynak haline getirir. Sınırlayıcı kutular ve segmentasyon maskeleri de dahil olmak üzere ayrıntılı etiketleri, sistemlerin görüntüleri hassas bir şekilde analiz etmeyi öğrenmesine yardımcı olur.

Bu veri seti, esnekliği ile bilinir ve basit projelerden karmaşık projelere kadar çeşitli görevler için kullanışlıdır. Vizyon Yapay Zeka alanında bir standart haline gelmiştir ve model performansını değerlendirmek için sıkça yarışmalarda ve sınavlarda kullanılır.

Güçlü yönlerinden bazıları şunlardır:

  • Çeşitli ve gerçekçi veriler: Veri seti, birden fazla nesne, örtüşme ve çeşitli aydınlatma koşullarına sahip gerçek dünya senaryolarından görüntüler içerir.
  • Güçlü topluluk ve araştırma benimsenmesi: Büyük makine öğrenimi yarışmalarında ve araştırmalarda kullanılan COCO veri kümesi, kapsamlı belgelere, önceden eğitilmiş modellere ve aktif topluluk desteğine sahiptir.
  • Zengin ve ayrıntılı açıklamalar: COCO veri seti, nesne segmentasyonu, anahtar noktalar ve başlıklar dahil olmak üzere son derece ayrıntılı açıklamalar sağlar ve bu da onu hassas görsel anlayış gerektiren projeler için ideal hale getirir.

İşte dikkat edilmesi gereken birkaç sınırlayıcı faktör:

  • Yüksek hesaplama gereksinimleri: Boyutu ve karmaşıklığı nedeniyle, COCO üzerinde model eğitimi, sınırlı donanıma sahip ekipler için zorlu hale getiren önemli miktarda hesaplama kaynağı gerektirebilir.
  • Veri dengesizliği: Bazı nesne kategorilerinde diğerlerinden önemli ölçüde daha fazla görüntü bulunur, bu da model eğitiminde önyargıya yol açabilir.
  • Karmaşık açıklama yapısı: Veri kümesinin ayrıntılı açıklamaları değerli olmakla birlikte, yapılandırılmış Görüntü İşleme (Vision AI) veri kümeleriyle çalışma konusunda deneyimi olmayan yeni başlayanlar veya daha küçük ekipler için bunaltıcı olabilir.

Açık görüntüler V7 veri kümesi

Open Images V7, Google tarafından derlenen, 600 nesne kategorisi için açıklamalar içeren 9 milyondan fazla görüntüye sahip devasa bir açık kaynaklı veri kümesidir. Çeşitli açıklama türlerini içerir ve karmaşık bilgisayarlı görü görevlerinin üstesinden gelmek için idealdir. Ölçeği ve derinliği, bilgisayarlı görü modellerini eğitmek ve test etmek için kapsamlı bir kaynak sağlar.

__wf_reserved_inherit
Şekil 3. Open Images V7 veri kümesine bir bakış. Görsel: yazar.

Ayrıca, Open Images V7 veri setinin araştırmadaki popülaritesi, kullanıcıların öğrenmesi için birçok kaynak ve örnek sunar. Ancak, büyük boyutu, özellikle daha küçük ekipler için indirme ve işleme süresini uzatabilir. Bir diğer sorun ise, bazı etiketlemelerin tutarsız olabilmesi ve verileri temizlemek için ekstra çaba gerektirmesidir ve entegrasyon her zaman sorunsuz olmayabilir, bu da ek hazırlık gerekebileceği anlamına gelir. 

Doğru veri kümesini seçmek 

Doğru veri kümesini seçmek, bilgisayarla görü projenizi başarıya hazırlamanın önemli bir parçasıdır. En iyi seçim, özel görevinize bağlıdır; iyi bir eşleşme bulmak, modelinizin doğru becerileri öğrenmesine yardımcı olur. Ayrıca araçlarınızla kolayca entegre olmalı, böylece modelinizi oluşturmaya daha fazla ve sorun gidermeye daha az odaklanabilirsiniz.

__wf_reserved_inherit
Şekil 4. Doğru veri kümesini seçme faktörleri. Yazarın görseli.

Önemli çıkarımlar

Yüksek kaliteli veri setleri, sistemlerin görüntüleri doğru bir şekilde yorumlamayı öğrenmesine yardımcı olarak herhangi bir bilgisayarlı görü modelinin temelini oluşturur. Çeşitli ve iyi açıklanmış veri setleri özellikle önemlidir, çünkü modellerin gerçek dünya senaryolarında güvenilir bir şekilde performans göstermesini sağlar ve sınırlı veya düşük kaliteli verilerden kaynaklanan hataları azaltır.

Ultralytics, bilgisayarlı görü veri kümelerine erişme ve bunlarla çalışma sürecini basitleştirerek projeniz için doğru verileri bulmayı kolaylaştırır. Doğru veri kümesini seçmek, daha hassas ve etkili sonuçlara yol açan yüksek performanslı bir model oluşturmada çok önemli bir adımdır.

Yapay zeka hakkında daha fazla bilgi edinmek için topluluğumuza katılın ve GitHub depomuzu keşfedin. Çözüm sayfalarımızda sağlık hizmetleri için bilgisayarlı görü ve otonom sürüşlü araçlarda yapay zeka gibi gelişmeleri keşfedin. Lisanslama seçeneklerimize göz atın ve bilgisayarlı görüye başlamak için ilk adımı atın!

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Bağlantı panoya kopyalandı