Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

2025'teki en iyi bilgisayarlı görü veri kümelerini keşfetme

Abirami Vina

5 dakikalık okuma

21 Şubat 2025

2025'in en iyi bilgisayarlı görü veri kümelerine yakından bakarken bize katılın. Çeşitli ve yüksek kaliteli veri kümelerinin daha akıllı Vision AI çözümlerini nasıl desteklediğini öğrenin.

Verilerin günlük olarak yaptığınız neredeyse her şeyde rol oynadığını biliyor muydunuz? Bir video izlemek, fotoğraf çekmek veya Google Haritalar'ı kontrol etmek, 75 milyardan fazla bağlı cihaz tarafından yakalanan sürekli bilgi akışına katkıda bulunur. Bu veri parçaları yapay zekanın (AI) temelini oluşturur. Aslında, aşağıdaki gibi gelişmiş bilgisayarla görme modelleri Ultralytics YOLO11 kalıpları belirlemek, görüntüleri yorumlamak ve çevremizdeki dünyayı anlamlandırmak için görsel verilere güvenir.

İlginç bir şekilde, verinin değeri sadece miktarla ilgili değildir. Ne kadar iyi organize edildiği ve hazırlandığı daha önemlidir. Bir veri kümesi dağınık veya eksikse, hatalara yol açabilir. Ancak, veri kümeleri temiz ve çeşitli olduğunda, kalabalıkta nesneleri tanımak veya karmaşık görselleri analiz etmek gibi bilgisayar görüşü modellerinin daha iyi performans göstermesine yardımcı olurlar. Yüksek kaliteli veri kümeleri her şeyi değiştirir.

Bu makalede, 2025'in en iyi bilgisayarlı görü veri kümelerini inceleyecek ve bunların daha doğru ve verimli bilgisayarlı görü modelleri oluşturmaya nasıl katkıda bulunduğunu göreceğiz. Hadi başlayalım!

Bilgisayarlı görü veri setleri nelerdir?

Bir bilgisayarlı görü veri kümesi, bilgisayarlı görü sistemlerinin görsel bilgileri anlamayı ve tanımayı öğrenmesine yardımcı olan bir resim veya video koleksiyonudur. Bu veri kümeleri, modellerin verilerdeki nesneleri, kişileri, sahneleri ve desenleri tanımasına yardımcı olan etiketler veya açıklamalarla birlikte gelir.

Bilgisayarlı görme modellerini eğitmek için kullanılabilirler ve yüzleri tanımlama, nesneleri algılama veya sahneleri analiz etme gibi görevleri geliştirmelerine yardımcı olurlar. Veri kümesi ne kadar iyi olursa (iyi organize edilmiş, çeşitli ve doğru), Vision AI modeli o kadar iyi performans gösterir ve günlük yaşamda daha akıllı ve daha kullanışlı teknolojiye yol açar.

Bir bilgisayarlı görü veri kümesi nasıl oluşturulur

Bir bilgisayarlı görü veri kümesi oluşturmak, birine dünyayı nasıl göreceğini ve anlayacağını öğretmek için çalışma notları hazırlamaya benzer. Her şey, geliştirmekte olduğunuz belirli uygulamayla eşleşen görüntüleri ve videoları toplamakla başlar. 

İdeal bir veri kümesi, farklı açılardan, çeşitli aydınlatma koşullarında ve birden fazla arka plan ve ortamda yakalanan ilgi nesnelerinin çeşitli örneklerini içerir. Bu çeşitlilik, bilgisayarlı görü modelinin kalıpları doğru bir şekilde öğrenmesini ve gerçek dünya senaryolarında güvenilir bir şekilde performans göstermesini sağlar.

__wf_reserved_inherit
Şekil 1. Mükemmel görüntü veri setini oluşturmak. Yazarın görseli.

İlgili görüntüleri ve videoları topladıktan sonraki adım, veri etiketlemedir. Bu işlem, yapay zekanın her görüntü veya videonun ne içerdiğini anlaması için verilere etiketler, açıklamalar veya tanımlar eklemeyi içerir. 

Etiketler, nesne adlarını, konumlarını, sınırlarını veya modelin görsel bilgileri doğru bir şekilde tanımasına ve yorumlamasına yardımcı olan diğer ilgili ayrıntıları içerebilir. Veri etiketleme, basit bir görüntü koleksiyonunu, bir bilgisayar görüşü modelini eğitmek için kullanılabilecek yapılandırılmış bir veri kümesine dönüştürür.

Model eğitimi yüksek kaliteli veriler gerektirir

Bir veri kümesini yüksek kaliteli yapan şeyin ne olduğunu merak ediyor olabilirsiniz. Doğru etiketleme, çeşitlilik ve tutarlılık gibi birçok faktör söz konusudur. Örneğin, birden fazla etiketleyici bir nesne algılama veri kümesini kedi kulaklarını tanımlamak için etiketliyorsa, biri bunları başın bir parçası olarak etiketleyebilirken, diğeri bunları ayrı olarak kulak olarak etiketleyebilir. Bu tutarsızlık modeli şaşırtabilir ve doğru öğrenme yeteneğini etkileyebilir.

İdeal bir bilgisayarlı görü veri setinin niteliklerine dair hızlı bir genel bakış:

  • Net etiketler: Her görüntü, tutarlı ve kesin etiketlerle doğru bir şekilde açıklanmıştır.
  • Çeşitli veriler: Veri seti, modelin çeşitli durumlarda iyi çalışmasına yardımcı olmak için farklı nesneler, arka planlar, aydınlatma koşulları ve açılar içerir.
  • Yüksek çözünürlüklü görüntüler: Keskin, ayrıntılı görüntüler, modelin özellikleri öğrenmesini ve tanımasını kolaylaştırır.

Ultralytics çeşitli veri kümelerini destekler

YOLO11 gibi Ultralytics YOLO11 modelleri, belirli bir YOLO dosya biçimindeki veri kümeleriyle çalışmak üzere oluşturulmuştur. Kendi verilerinizi bu formata dönüştürmek kolay olsa da, hemen denemeye başlamak isteyenler için sorunsuz bir seçenek de sunuyoruz. 

Ultralytics Python paketi, çok çeşitli bilgisayarla görme veri kümelerini destekler ve nesne algılama, örnek segmentasyonu veya poz tahmini gibi görevleri kullanarak ekstra kurulum yapmadan projelere dalmanıza olanak tanır.  

Kullanıcılar COCO, DOTA-v2.0, Open Images V7 ve ImageNet gibi kullanıma hazır veri kümelerine, veri kümesi adını eğitim işlevindeki parametrelerden biri olarak belirterek kolayca erişebilirler. Bunu yaptığınızda, veri kümesi otomatik olarak indirilir ve önceden yapılandırılır, böylece modellerinizi oluşturmaya ve iyileştirmeye odaklanabilirsiniz.

2025'te en iyi 5 bilgisayar görüşü veri seti

Görme Yapay Zekası alanındaki gelişmeler, inovasyonu teşvik eden ve atılımları mümkün kılan çeşitli, büyük ölçekli veri kümelerine dayanmaktadır. Ultralytics tarafından desteklenen ve bilgisayarla görme modellerini etkileyen en önemli veri kümelerinden bazılarına bir göz atalım.

ImageNet veri kümesi 

ImageNetFei-Fei Li ve ekibi tarafından 2007 yılında Princeton Üniversitesi'nde oluşturulan ve 2009 yılında tanıtılan bu veri seti, 14 milyondan fazla etiketli görüntü içeren büyük bir veri setidir. Farklı nesneleri tanımak ve kategorize etmek için sistemleri eğitmek için yaygın olarak kullanılmaktadır. Yapılandırılmış tasarımı, modelleri görüntüleri doğru bir şekilde classify öğretmek için özellikle yararlı kılmaktadır. İyi belgelenmiş olsa da, öncelikle görüntü sınıflandırmasına odaklanır ve nesne algılama gibi görevler için ayrıntılı ek açıklamalardan yoksundur. 

ImageNet'in güçlü yönlerinden bazılarına bir göz atalım:

  • Çeşitlilik: ImageNet , 20.000'den fazla kategoriye yayılan görüntülerle model eğitimini ve genelleştirmeyi geliştiren geniş ve çeşitli bir veri seti sunar.
  • Yapılandırılmış organizasyon: Görüntüler, WordNet hiyerarşisi kullanılarak titizlikle kategorize edilir, bu da verimli veri alımını ve sistematik model eğitimini kolaylaştırır. 
  • Kapsamlı dokümantasyon: Kapsamlı araştırmalar ve yıllar süren çalışmalar ImageNet 'i hem yeni başlayanlar hem de uzmanlar için erişilebilir hale getirerek bilgisayarla görme projeleri için değerli bilgiler ve rehberlik sağlar.

Ancak, herhangi bir veri kümesi gibi, bunun da sınırlamaları vardır. İşte dikkate alınması gereken bazı zorluklar:

  • Hesaplama talepleri: Büyük boyutu, sınırlı bilgi işlem kaynaklarına sahip daha küçük ekipler için zorluklar oluşturabilir.
  • Zamansal veri eksikliği: Yalnızca statik görüntüler içerdiğinden, video veya zamana dayalı veriler gerektiren uygulamaların ihtiyaçlarını karşılamayabilir.
  • Güncel Olmayan Görüntüler: Veri kümesindeki bazı görüntüler daha eskidir ve mevcut nesneleri, stilleri veya ortamları yansıtmayabilir, bu da modern uygulamalar için alaka düzeyini potansiyel olarak azaltır.

DOTA-v2.0 veri kümesi

DOTA-v2.0 veri seti (DOTA, Hava Görüntülerinde Nesne Tespiti için Veri Seti anlamına gelir), özellikle yönlendirilmiş sınırlayıcı kutu (OBB) nesne tespiti için oluşturulmuş kapsamlı bir hava görüntüleri koleksiyonudur. OBB tespitinde, görüntüdeki nesnelerin gerçek yönelimine daha doğru şekilde hizalamak için döndürülmüş sınırlayıcı kutular kullanılır. Bu yöntem, nesnelerin genellikle çeşitli açılarda göründüğü hava görüntüleri için özellikle iyi sonuç verir ve daha hassas lokalizasyon ve genel olarak daha iyi tespit sağlar.

Bu veri seti, 18 nesne kategorisinde 11.000'den fazla görüntü ve 1,7 milyondan fazla yönlendirilmiş sınırlayıcı kutudan oluşur. Görüntüler 800×800 ile 20.000×20.000 piksel arasında değişir ve uçaklar, gemiler ve binalar gibi nesneleri içerir. 

__wf_reserved_inherit
Şekil 2. DOTA-v2.0 veri setinden görüntüler ve açıklamalar örnekleri. Yazarın görseli.

Ayrıntılı açıklamaları nedeniyle DOTA-v2.0, uzaktan algılama ve hava gözetleme projeleri için popüler bir seçim haline geldi. İşte DOTA-v2.0'ın temel özelliklerinden bazıları:

  • Çeşitli nesne kategorileri: Modelleri çeşitli gerçek dünya nesnelerine maruz bırakarak, araçlar, limanlar ve depolama tankları gibi birçok farklı nesne türünü kapsar.
  • Yüksek kaliteli etiketlemeler: Uzman etiketleyiciler, nesne şekillerini ve yönlerini açıkça gösteren, hassas bir şekilde yönlendirilmiş sınırlayıcı kutular sağlamıştır.
  • Çok ölçekli görüntüler: Veri kümesi farklı boyutlarda görüntüler içerir ve modellerin hem küçük hem de büyük ölçeklerde nesneleri nasıl detect edeceklerini öğrenmelerine yardımcı olur.

DOTA-v2'nin birçok güçlü yönü olmasına rağmen, kullanıcıların akılda tutması gereken bazı sınırlamalar şunlardır:

  • Ek indirme adımları: DOTA veri kümesinin tutulma şekli nedeniyle, DOTA-v2.0 ek bir kurulum adımı gerektirir. Öncelikle DOTA-v1.0 görüntülerini indirmeniz ve ardından veri kümesini tamamlamak için DOTA-v2.0 için ek görüntüleri ve güncellenmiş açıklamaları eklemeniz gerekir.
  • Karmaşık açıklamalar: Yönlendirilmiş sınırlayıcı kutular, model eğitimi sırasında ele almak için ekstra çaba gerektirebilir.
  • Sınırlı kapsam: DOTA-v2, hava görüntüleri için tasarlanmıştır, bu da onu bu alanın dışındaki genel nesne tespiti görevleri için daha az kullanışlı hale getirir.

Roboflow 100 veri kümesi 

Roboflow 100 (RF100) veri seti, Intelin desteğiyle Roboflow tarafından oluşturulmuştur. Nesne algılama modellerinin ne kadar iyi çalıştığını test etmek ve kıyaslamak için kullanılabilir. Bu kıyaslama veri kümesi, 90.000'den fazla genel veri kümesi arasından seçilen 100 farklı veri kümesini içerir. Sağlık hizmetleri, hava görüntüleri ve oyun gibi alanlardan 224.000'den fazla görüntü ve 800 nesne sınıfına sahiptir. 

İşte RF100 kullanmanın bazı temel avantajları:

  • Geniş alan kapsamı: Tıbbi görüntüleme, havadan görünümler ve su altı araştırmaları gibi yedi alandan veri kümeleri içerir.
  • Model iyileştirmesini teşvik eder: RF100'deki değişkenlik ve alana özgü zorluklar, mevcut modellerdeki boşlukları ortaya çıkararak, daha uyarlanabilir ve sağlam nesne algılama çözümlerine yönelik araştırmaları teşvik eder.
  • Tutarlı görüntü formatı: Tüm görüntüler 640x640 piksel boyutuna yeniden boyutlandırılır. Bu, kullanıcıların görüntü boyutlarını ayarlamalarına gerek kalmadan modelleri eğitmelerine yardımcı olur.

Güçlü yönlerine rağmen, RF100'ün de akılda tutulması gereken bazı dezavantajları vardır:

  • Görevler açısından sınırlı: RF100, nesne tespiti için tasarlanmıştır, bu nedenle segmentasyon veya sınıflandırma gibi görevleri barındıramaz.
  • Kıyaslama merkezli odak: RF100 öncelikle gerçek dünya uygulamaları için modelleri eğitmekten ziyade bir kıyaslama aracı olarak tasarlanmıştır, bu nedenle sonuçları pratik dağıtım senaryolarına tam olarak yansımayabilir.
  • Açıklama değişkenliği: RF100, kitlesel kaynaklı veri kümelerini topladığından, açıklama kalitesi ve etiketleme uygulamalarında tutarsızlıklar olabilir ve bu da model değerlendirmesini ve ince ayarını etkileyebilir.

COCO (Common objects in context) veri kümesi

COCO veri küm esi, ayrıntılı görüntü açıklamaları ile 330.000'den fazla görüntü sunan, en yaygın kullanılan bilgisayarla görme veri kümelerinden biridir. Nesne algılama, segmentasyon ve görüntü altyazılama için tasarlanmıştır, bu da onu birçok proje için değerli bir kaynak haline getirir. Sınırlayıcı kutular ve segmentasyon maskeleri de dahil olmak üzere ayrıntılı etiketleri, sistemlerin görüntüleri hassas bir şekilde analiz etmeyi öğrenmelerine yardımcı olur.

Bu veri seti, esnekliği ile bilinir ve basit projelerden karmaşık projelere kadar çeşitli görevler için kullanışlıdır. Vizyon Yapay Zeka alanında bir standart haline gelmiştir ve model performansını değerlendirmek için sıkça yarışmalarda ve sınavlarda kullanılır.

Güçlü yönlerinden bazıları şunlardır:

  • Çeşitli ve gerçekçi veriler: Veri seti, birden fazla nesne, örtüşme ve çeşitli aydınlatma koşullarına sahip gerçek dünya senaryolarından görüntüler içerir.
  • Güçlü topluluk ve araştırma benimsemesi: Büyük makine öğrenimi yarışmalarında ve araştırmalarında kullanılan COCO veri seti kapsamlı belgelere, önceden eğitilmiş modellere ve aktif topluluk desteğine sahiptir.
  • Zengin ve ayrıntılı ek açıklamalar: COCO veri seti, nesne segmentasyonu, kilit noktalar ve başlıklar da dahil olmak üzere son derece ayrıntılı ek açıklamalar sunarak hassas görsel anlayış gerektiren projeler için idealdir.

İşte dikkat edilmesi gereken birkaç sınırlayıcı faktör:

  • Yüksek hesaplama gereksinimleri: Boyutu ve karmaşıklığı nedeniyle, COCO üzerinde eğitim modelleri önemli hesaplama kaynakları gerektirebilir ve bu da sınırlı donanıma sahip ekipler için zorlayıcı olabilir.
  • Veri dengesizliği: Bazı nesne kategorilerinde diğerlerinden önemli ölçüde daha fazla görüntü bulunur, bu da model eğitiminde önyargıya yol açabilir.
  • Karmaşık açıklama yapısı: Veri kümesinin ayrıntılı açıklamaları değerli olmakla birlikte, yapılandırılmış Görüntü İşleme (Vision AI) veri kümeleriyle çalışma konusunda deneyimi olmayan yeni başlayanlar veya daha küçük ekipler için bunaltıcı olabilir.

Açık görüntüler V7 veri kümesi

Open Images V7, 600 nesne kategorisi için ek açıklamalar içeren 9 milyondan fazla görüntü içeren, Google tarafından küratörlüğü yapılan devasa bir açık kaynak veri kümesidir. Çeşitli ek açıklama türleri içerir ve karmaşık bilgisayarla görme görevlerinin üstesinden gelmek için idealdir. Ölçeği ve derinliği, bilgisayarla görme modellerini eğitmek ve test etmek için kapsamlı bir kaynak sağlar.

__wf_reserved_inherit
Şekil 3. Open Images V7 veri kümesine bir bakış. Görsel: yazar.

Ayrıca, Open Images V7 veri setinin araştırmadaki popülaritesi, kullanıcıların öğrenmesi için birçok kaynak ve örnek sunar. Ancak, büyük boyutu, özellikle daha küçük ekipler için indirme ve işleme süresini uzatabilir. Bir diğer sorun ise, bazı etiketlemelerin tutarsız olabilmesi ve verileri temizlemek için ekstra çaba gerektirmesidir ve entegrasyon her zaman sorunsuz olmayabilir, bu da ek hazırlık gerekebileceği anlamına gelir. 

Doğru veri kümesini seçmek 

Doğru veri kümesini seçmek, bilgisayarla görü projenizi başarıya hazırlamanın önemli bir parçasıdır. En iyi seçim, özel görevinize bağlıdır; iyi bir eşleşme bulmak, modelinizin doğru becerileri öğrenmesine yardımcı olur. Ayrıca araçlarınızla kolayca entegre olmalı, böylece modelinizi oluşturmaya daha fazla ve sorun gidermeye daha az odaklanabilirsiniz.

__wf_reserved_inherit
Şekil 4. Doğru veri kümesini seçme faktörleri. Yazarın görseli.

Önemli çıkarımlar

Yüksek kaliteli veri kümeleri, herhangi bir bilgisayarla görme modelinin backbone ve sistemlerin görüntüleri doğru bir şekilde yorumlamayı öğrenmesine yardımcı olur. Modellerin gerçek dünya senaryolarında güvenilir bir şekilde performans göstermesini sağladıkları ve sınırlı veya düşük kaliteli verilerin neden olduğu hataları azalttıkları için çeşitli ve iyi açıklanmış veri kümeleri özellikle önemlidir.

Ultralytics , bilgisayarla görme veri kümelerine erişme ve bunlarla çalışma sürecini basitleştirerek projeniz için doğru verileri bulmanızı kolaylaştırır. Doğru veri kümesini seçmek, yüksek performanslı bir model oluşturmada çok önemli bir adımdır ve daha kesin ve etkili sonuçlara yol açar.

Yapay zeka hakkında daha fazla bilgi edinmek için topluluğumuza katılın ve GitHub depomuzu keşfedin. Çözüm sayfalarımızda sağlık hizmetleri için bilgisayarlı görü ve otonom sürüşlü araçlarda yapay zeka gibi gelişmeleri keşfedin. Lisanslama seçeneklerimize göz atın ve bilgisayarlı görüye başlamak için ilk adımı atın!

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın