2025'in en iyi bilgisayarlı görü veri kümelerine yakından bakarken bize katılın. Çeşitli ve yüksek kaliteli veri kümelerinin daha akıllı Vision AI çözümlerini nasıl desteklediğini öğrenin.

2025'in en iyi bilgisayarlı görü veri kümelerine yakından bakarken bize katılın. Çeşitli ve yüksek kaliteli veri kümelerinin daha akıllı Vision AI çözümlerini nasıl desteklediğini öğrenin.
Verilerin günlük olarak yaptığınız neredeyse her şeyde rol oynadığını biliyor muydunuz? Bir video izlemek, fotoğraf çekmek veya Google Haritalar'ı kontrol etmek, 75 milyardan fazla bağlı cihaz tarafından yakalanan sürekli bilgi akışına katkıda bulunur. Bu veri parçaları, yapay zekanın (AI) temelini oluşturur. Aslında, Ultralytics YOLO11 gibi gelişmiş bilgisayarlı görü modelleri, kalıpları belirlemek, görüntüleri yorumlamak ve etrafımızdaki dünyayı anlamlandırmak için görsel verilere güvenir.
İlginç bir şekilde, verinin değeri sadece miktarla ilgili değildir. Ne kadar iyi organize edildiği ve hazırlandığı daha önemlidir. Bir veri kümesi dağınık veya eksikse, hatalara yol açabilir. Ancak, veri kümeleri temiz ve çeşitli olduğunda, kalabalıkta nesneleri tanımak veya karmaşık görselleri analiz etmek gibi bilgisayar görüşü modellerinin daha iyi performans göstermesine yardımcı olurlar. Yüksek kaliteli veri kümeleri her şeyi değiştirir.
Bu makalede, 2025'in en iyi bilgisayarlı görü veri kümelerini inceleyecek ve bunların daha doğru ve verimli bilgisayarlı görü modelleri oluşturmaya nasıl katkıda bulunduğunu göreceğiz. Hadi başlayalım!
Bir bilgisayarlı görü veri kümesi, bilgisayarlı görü sistemlerinin görsel bilgileri anlamayı ve tanımayı öğrenmesine yardımcı olan bir resim veya video koleksiyonudur. Bu veri kümeleri, modellerin verilerdeki nesneleri, kişileri, sahneleri ve desenleri tanımasına yardımcı olan etiketler veya açıklamalarla birlikte gelir.
Bilgisayarlı görme modellerini eğitmek için kullanılabilirler ve yüzleri tanımlama, nesneleri algılama veya sahneleri analiz etme gibi görevleri geliştirmelerine yardımcı olurlar. Veri kümesi ne kadar iyi olursa (iyi organize edilmiş, çeşitli ve doğru), Vision AI modeli o kadar iyi performans gösterir ve günlük yaşamda daha akıllı ve daha kullanışlı teknolojiye yol açar.
Bir bilgisayarlı görü veri kümesi oluşturmak, birine dünyayı nasıl göreceğini ve anlayacağını öğretmek için çalışma notları hazırlamaya benzer. Her şey, geliştirmekte olduğunuz belirli uygulamayla eşleşen görüntüleri ve videoları toplamakla başlar.
İdeal bir veri kümesi, farklı açılardan, çeşitli aydınlatma koşullarında ve birden fazla arka plan ve ortamda yakalanan ilgi nesnelerinin çeşitli örneklerini içerir. Bu çeşitlilik, bilgisayarlı görü modelinin kalıpları doğru bir şekilde öğrenmesini ve gerçek dünya senaryolarında güvenilir bir şekilde performans göstermesini sağlar.
İlgili görüntüleri ve videoları topladıktan sonraki adım, veri etiketlemedir. Bu işlem, yapay zekanın her görüntü veya videonun ne içerdiğini anlaması için verilere etiketler, açıklamalar veya tanımlar eklemeyi içerir.
Etiketler, nesne adlarını, konumlarını, sınırlarını veya modelin görsel bilgileri doğru bir şekilde tanımasına ve yorumlamasına yardımcı olan diğer ilgili ayrıntıları içerebilir. Veri etiketleme, basit bir görüntü koleksiyonunu, bir bilgisayar görüşü modelini eğitmek için kullanılabilecek yapılandırılmış bir veri kümesine dönüştürür.
Bir veri kümesini yüksek kaliteli yapan şeyin ne olduğunu merak ediyor olabilirsiniz. Doğru etiketleme, çeşitlilik ve tutarlılık gibi birçok faktör söz konusudur. Örneğin, birden fazla etiketleyici bir nesne algılama veri kümesini kedi kulaklarını tanımlamak için etiketliyorsa, biri bunları başın bir parçası olarak etiketleyebilirken, diğeri bunları ayrı olarak kulak olarak etiketleyebilir. Bu tutarsızlık modeli şaşırtabilir ve doğru öğrenme yeteneğini etkileyebilir.
İdeal bir bilgisayarlı görü veri setinin niteliklerine dair hızlı bir genel bakış:
YOLO11 gibi Ultralytics YOLO modelleri, belirli bir YOLO dosya formatındaki veri kümeleriyle çalışmak üzere oluşturulmuştur. Kendi verilerinizi bu formata dönüştürmek kolay olsa da, hemen denemeye başlamak isteyenler için sorunsuz bir seçenek de sunuyoruz.
Ultralytics Python paketi, çok çeşitli bilgisayarlı görü veri setlerini destekler ve nesne tespiti, örnek segmentasyonu veya poz tahmini gibi görevleri kullanarak herhangi bir ek kurulum yapmadan projelere dalmanıza olanak tanır.
Kullanıcılar, eğitim fonksiyonunda parametrelerden biri olarak veri kümesi adını belirterek COCO, DOTA-v2.0, Open Images V7 ve ImageNet gibi kullanıma hazır veri kümelerine kolayca erişebilir. Bunu yaptığınızda, veri kümesi otomatik olarak indirilir ve önceden yapılandırılır, böylece modellerinizi oluşturmaya ve iyileştirmeye odaklanabilirsiniz.
Görüntü Yapay Zekasındaki gelişmeler, inovasyonu yönlendiren ve atılımları mümkün kılan çeşitli, büyük ölçekli veri kümelerine dayanır. Ultralytics tarafından desteklenen ve bilgisayarlı görü modellerini etkileyen en önemli veri kümelerinden bazılarına bir göz atalım.
ImageNet, Fei-Fei Li ve Princeton Üniversitesi'ndeki ekibi tarafından 2007'de oluşturulan ve 2009'da tanıtılan, 14 milyondan fazla etiketli görüntüye sahip büyük bir veri kümesidir. Sistemleri farklı nesneleri tanımak ve kategorize etmek için eğitmek için yaygın olarak kullanılır. Yapılandırılmış tasarımı, modelleri görüntüleri doğru bir şekilde sınıflandırmayı öğretmek için özellikle yararlı kılar. İyi belgelenmiş olmasına rağmen, öncelikle görüntü sınıflandırmasına odaklanır ve nesne tespiti gibi görevler için ayrıntılı açıklamalardan yoksundur.
İşte ImageNet'in bazı temel güçlü yönlerine bir bakış:
Ancak, herhangi bir veri kümesi gibi, bunun da sınırlamaları vardır. İşte dikkate alınması gereken bazı zorluklar:
DOTA-v2.0 veri seti (DOTA, Hava Görüntülerinde Nesne Tespiti için Veri Seti anlamına gelir), özellikle yönlendirilmiş sınırlayıcı kutu (OBB) nesne tespiti için oluşturulmuş kapsamlı bir hava görüntüleri koleksiyonudur. OBB tespitinde, görüntüdeki nesnelerin gerçek yönelimine daha doğru şekilde hizalamak için döndürülmüş sınırlayıcı kutular kullanılır. Bu yöntem, nesnelerin genellikle çeşitli açılarda göründüğü hava görüntüleri için özellikle iyi sonuç verir ve daha hassas lokalizasyon ve genel olarak daha iyi tespit sağlar.
Bu veri seti, 18 nesne kategorisinde 11.000'den fazla görüntü ve 1,7 milyondan fazla yönlendirilmiş sınırlayıcı kutudan oluşur. Görüntüler 800×800 ile 20.000×20.000 piksel arasında değişir ve uçaklar, gemiler ve binalar gibi nesneleri içerir.
Ayrıntılı açıklamaları nedeniyle DOTA-v2.0, uzaktan algılama ve hava gözetleme projeleri için popüler bir seçim haline geldi. İşte DOTA-v2.0'ın temel özelliklerinden bazıları:
DOTA-v2'nin birçok güçlü yönü olmasına rağmen, kullanıcıların akılda tutması gereken bazı sınırlamalar şunlardır:
Roboflow 100 (RF100) veri seti, Roboflow tarafından Intel'in desteğiyle oluşturulmuştur. Nesne tespit modellerinin ne kadar iyi çalıştığını test etmek ve kıyaslamak için kullanılabilir. Bu kıyaslama veri seti, 90.000'den fazla genel veri seti arasından seçilen 100 farklı veri setini içerir. Sağlık hizmetleri, havadan görünümler ve oyun gibi alanlardan 224.000'den fazla görüntüye ve 800 nesne sınıfına sahiptir.
İşte RF100 kullanmanın bazı temel avantajları:
Güçlü yönlerine rağmen, RF100'ün de akılda tutulması gereken bazı dezavantajları vardır:
COCO veri seti, detaylı görsel açıklamaları içeren 330.000'den fazla görüntü sunan, bilgisayarlı görü alanında en yaygın kullanılan veri setlerinden biridir. Nesne tespiti, segmentasyonu ve görüntü başlığı oluşturma için tasarlanmıştır ve bu da onu birçok proje için değerli bir kaynak haline getirir. Sınırlayıcı kutular ve segmentasyon maskeleri de dahil olmak üzere ayrıntılı etiketleri, sistemlerin görüntüleri hassas bir şekilde analiz etmeyi öğrenmesine yardımcı olur.
Bu veri seti, esnekliği ile bilinir ve basit projelerden karmaşık projelere kadar çeşitli görevler için kullanışlıdır. Vizyon Yapay Zeka alanında bir standart haline gelmiştir ve model performansını değerlendirmek için sıkça yarışmalarda ve sınavlarda kullanılır.
Güçlü yönlerinden bazıları şunlardır:
İşte dikkat edilmesi gereken birkaç sınırlayıcı faktör:
Open Images V7, Google tarafından derlenen, 600 nesne kategorisi için açıklamalar içeren 9 milyondan fazla görüntüye sahip devasa bir açık kaynaklı veri kümesidir. Çeşitli açıklama türlerini içerir ve karmaşık bilgisayarlı görü görevlerinin üstesinden gelmek için idealdir. Ölçeği ve derinliği, bilgisayarlı görü modellerini eğitmek ve test etmek için kapsamlı bir kaynak sağlar.
Ayrıca, Open Images V7 veri setinin araştırmadaki popülaritesi, kullanıcıların öğrenmesi için birçok kaynak ve örnek sunar. Ancak, büyük boyutu, özellikle daha küçük ekipler için indirme ve işleme süresini uzatabilir. Bir diğer sorun ise, bazı etiketlemelerin tutarsız olabilmesi ve verileri temizlemek için ekstra çaba gerektirmesidir ve entegrasyon her zaman sorunsuz olmayabilir, bu da ek hazırlık gerekebileceği anlamına gelir.
Doğru veri kümesini seçmek, bilgisayarla görü projenizi başarıya hazırlamanın önemli bir parçasıdır. En iyi seçim, özel görevinize bağlıdır; iyi bir eşleşme bulmak, modelinizin doğru becerileri öğrenmesine yardımcı olur. Ayrıca araçlarınızla kolayca entegre olmalı, böylece modelinizi oluşturmaya daha fazla ve sorun gidermeye daha az odaklanabilirsiniz.
Yüksek kaliteli veri setleri, sistemlerin görüntüleri doğru bir şekilde yorumlamayı öğrenmesine yardımcı olarak herhangi bir bilgisayarlı görü modelinin temelini oluşturur. Çeşitli ve iyi açıklanmış veri setleri özellikle önemlidir, çünkü modellerin gerçek dünya senaryolarında güvenilir bir şekilde performans göstermesini sağlar ve sınırlı veya düşük kaliteli verilerden kaynaklanan hataları azaltır.
Ultralytics, bilgisayarlı görü veri kümelerine erişme ve bunlarla çalışma sürecini basitleştirerek projeniz için doğru verileri bulmayı kolaylaştırır. Doğru veri kümesini seçmek, daha hassas ve etkili sonuçlara yol açan yüksek performanslı bir model oluşturmada çok önemli bir adımdır.
Yapay zeka hakkında daha fazla bilgi edinmek için topluluğumuza katılın ve GitHub depomuzu keşfedin. Çözüm sayfalarımızda sağlık hizmetleri için bilgisayarlı görü ve otonom sürüşlü araçlarda yapay zeka gibi gelişmeleri keşfedin. Lisanslama seçeneklerimize göz atın ve bilgisayarlı görüye başlamak için ilk adımı atın!