Kılavuzlar

2025'teki en iyi bilgisayarlı görü veri kümelerini keşfetme

2025'in en iyi bilgisayarlı görü veri kümelerine daha yakından bakarken bize katıl. Çeşitli ve yüksek kaliteli veri kümelerinin nasıl daha akıllı görsel yapay zeka çözümlerini yönlendirdiğini öğren.

ABAbirami Vina

5 min readFebruary 21, 2025

Modelleri eğitmek için bilgisayarlı görü veri kümeleri

Verinin günlük hayatta yaptığın hemen hemen her şeyde bir rol oynadığını biliyor muydun? Bir video izlemek, fotoğraf çekmek veya Google Haritalar'a bakmak, 75 milyardan fazla bağlı cihaz tarafından yakalanan sürekli bilgi akışına katkıda bulunur. Bu veri parçaları yapay zekanın (AI) temelini oluşturur. Aslında, Ultralytics YOLO11 gibi gelişmiş bilgisayarlı görü modelleri, örüntüleri tanımlamak, görüntüleri yorumlamak ve çevremizdeki dünyayı anlamlandırmak için görsel verilere güvenir.

İlginç bir şekilde, verinin değeri sadece miktarıyla ilgili değildir. Ne kadar iyi düzenlendiği ve hazırlandığı daha önemlidir. Eğer bir veri kümesi dağınık veya eksikse, hatalara yol açabilir. Ancak, veri kümeleri temiz ve çeşitli olduğunda, ister kalabalıktaki nesneleri tanımak ister karmaşık görselleri analiz etmek olsun, bilgisayarlı görü modellerinin daha iyi performans göstermesine yardımcı olurlar. Yüksek kaliteli veri kümeleri tüm farkı yaratır.

Bu makalede, 2025'in en iyi bilgisayarlı görü veri kümelerini inceleyecek ve bunların nasıl daha doğru ve verimli bilgisayarlı görü modelleri oluşturmaya katkıda bulunduğunu göreceğiz. Hadi başlayalım!

Link to this sectionBilgisayarlı görü veri kümeleri nelerdir?#

Bilgisayarlı görü veri kümesi, bilgisayarlı görü sistemlerinin görsel bilgileri anlamayı ve tanımayı öğrenmesine yardımcı olan bir görüntü veya video koleksiyonudur. Bu veri kümeleri, modellerin veriler içindeki nesneleri, insanları, sahneleri ve örüntüleri tanımasına yardımcı olan etiketler veya açıklamalarla birlikte gelir.

Bunlar, yüzleri tanımlama, nesneleri algılama veya sahneleri analiz etme gibi görevleri geliştirmelerine yardımcı olarak bilgisayarlı görü modellerini eğitmek için kullanılabilir. Veri kümesi ne kadar iyiyse -iyi düzenlenmiş, çeşitli ve doğru- yapay zeka modeli o kadar iyi performans gösterir, bu da günlük hayatta daha akıllı ve daha kullanışlı teknolojilere yol açar.

Link to this sectionBir bilgisayarlı görü veri kümesi nasıl oluşturulur#

Bir bilgisayarlı görü veri kümesi oluşturmak, birine dünyayı nasıl görüp anlayacağını öğretmek için çalışma notları hazırlamak gibidir. Her şey, geliştirdiğin belirli uygulamayla eşleşen görüntüleri ve videoları toplamakla başlar.

İdeal bir veri kümesi, farklı açılardan, çeşitli ışık koşullarında ve birden fazla arka plan ve ortamda çekilmiş, ilgi çekici nesnelerin çeşitli örneklerini içerir. Bu çeşitlilik, bilgisayarlı görü modelinin örüntüleri doğru bir şekilde tanımayı öğrenmesini ve gerçek dünya senaryolarında güvenilir bir şekilde performans göstermesini sağlar.

Mükemmel bir görüntü veri kümesi oluşturma diyagramı

Şekil 1. Mükemmel görü veri kümesini oluşturmak. Yazarın görseli.

İlgili görüntüleri ve videoları topladıktan sonra bir sonraki adım veri etiketlemedir. Bu süreç, yapay zekanın her bir görüntü veya videonun ne içerdiğini anlayabilmesi için verilere etiketler, açıklamalar veya tanımlar eklemeyi içerir.

Etiketler; nesne adlarını, konumlarını, sınırlarını veya modelin görsel bilgileri doğru bir şekilde tanımasına ve yorumlamasına yardımcı olan diğer ilgili detayları içerebilir. Veri etiketleme, basit bir görüntü koleksiyonunu bir bilgisayarlı görü modelini eğitmek için kullanılabilecek yapılandırılmış bir veri kümesine dönüştürür.

Link to this sectionModel eğitimi yüksek kaliteli veri gerektirir#

Bir veri kümesini neyin yüksek kaliteli yaptığını merak ediyor olabilirsin. Doğru etiketleme, çeşitlilik ve tutarlılık gibi birçok faktör vardır. Örneğin, birden fazla etiketleyici bir nesne algılama veri kümesini kedi kulaklarını tanımlamak için etiketliyorsa, biri bunları başın bir parçası olarak etiketleyebilirken diğeri ayrı olarak kulak şeklinde etiketleyebilir. Bu tutarsızlık modeli karıştırabilir ve doğru öğrenme yeteneğini etkileyebilir.

İşte ideal bir bilgisayarlı görü veri kümesinin niteliklerine kısa bir genel bakış:

Net etiketler: Her görüntü, tutarlı ve kesin etiketlerle doğru bir şekilde açıklanmıştır.
Çeşitli veriler: Veri kümesi, modelin çeşitli durumlarda iyi çalışmasına yardımcı olmak için farklı nesneler, arka planlar, ışık koşulları ve açılar içerir.
Yüksek çözünürlüklü görüntüler: Keskin, ayrıntılı görüntüler, modelin özellikleri öğrenmesini ve tanımasını kolaylaştırır.

Link to this sectionUltralytics çeşitli veri kümelerini destekler#

YOLO11 gibi Ultralytics YOLO modelleri, belirli bir YOLO dosya formatındaki veri kümeleriyle çalışacak şekilde oluşturulmuştur. Kendi verilerini bu formata dönüştürmek kolay olsa da, hemen denemeye başlamak isteyenler için zahmetsiz bir seçenek de sunuyoruz.

Ultralytics Python paketi, çok çeşitli bilgisayarlı görü veri kümelerini destekler ve herhangi bir ekstra kurulum yapmadan nesne algılama, örnek bölümleme veya poz tahmini gibi görevleri kullanarak projelerin içine dalmanı sağlar.

Kullanıcılar; eğitim fonksiyonunda parametrelerden biri olarak veri kümesi adını belirterek COCO, DOTA-v2.0, Open Images V7 ve ImageNet gibi kullanıma hazır veri kümelerine kolayca erişebilirler. Bunu yaptığında veri kümesi otomatik olarak indirilir ve önceden yapılandırılır, böylece modellerini oluşturmaya ve iyileştirmeye odaklanabilirsin.

Link to this section2025'teki en iyi 5 bilgisayarlı görü veri kümesi#

Görü tabanlı yapay zekadaki ilerlemeler, inovasyonu yönlendiren ve çığır açan gelişmelere olanak tanıyan çeşitli, büyük ölçekli veri kümelerine dayanır. Ultralytics tarafından desteklenen ve bilgisayarlı görü modellerini etkileyen en önemli veri kümelerinden bazılarına göz atalım.

Link to this sectionImageNet veri kümesi#

ImageNet, 2007 yılında Fei-Fei Li ve Princeton Üniversitesi'ndeki ekibi tarafından oluşturulan ve 2009'da tanıtılan, 14 milyondan fazla etiketli görüntü içeren büyük bir veri kümesidir. Sistemleri farklı nesneleri tanımaları ve kategorize etmeleri için eğitmek amacıyla yaygın olarak kullanılır. Yapılandırılmış tasarımı, modellerin görüntüleri doğru bir şekilde sınıflandırmasını öğretmek için onu özellikle yararlı kılar. İyi belgelenmiş olsa da, öncelikle görüntü sınıflandırmaya odaklanır ve nesne algılama gibi görevler için ayrıntılı açıklamalardan yoksundur.

İşte ImageNet'in temel güçlü yönlerinden bazılarına bir bakış:

Çeşitlilik: 20.000'den fazla kategoriyi kapsayan görüntüleriyle ImageNet, model eğitimini ve genellemesini geliştiren geniş ve çeşitli bir veri kümesi sunar.
Yapılandırılmış organizasyon: Görüntüler, WordNet hiyerarşisi kullanılarak titizlikle kategorize edilir ve bu da verimli veri alımını ve sistematik model eğitimini kolaylaştırır.
Kapsamlı belgeleme: Kapsamlı araştırmalar ve yıllarca süren çalışmalar, ImageNet'i hem yeni başlayanlar hem de uzmanlar için erişilebilir kılarak bilgisayarlı görü projeleri için değerli içgörüler ve rehberlik sağlar.

Ancak, her veri kümesi gibi onun da sınırlamaları vardır. İşte dikkate alınması gereken zorluklardan bazıları:

Hesaplamalı talepler: Muazzam boyutu, sınırlı hesaplama kaynaklarına sahip küçük ekipler için zorluklar yaratabilir.
Zamansal veri eksikliği: Yalnızca statik görüntüler içerdiğinden, video veya zamana dayalı veri gerektiren uygulamaların ihtiyaçlarını karşılamayabilir.
Eski görüntüler: Veri kümesindeki bazı görüntüler daha eskidir ve güncel nesneleri, stilleri veya ortamları yansıtmayabilir, bu da modern uygulamalar için uygunluğu potansiyel olarak azaltabilir.

Link to this sectionDOTA-v2.0 veri kümesi#

DOTA'nın Hava Görüntülerinde Nesne Algılama Veri Kümesi (Dataset for Object Detection in Aerial Images) anlamına geldiği DOTA-v2.0 veri kümesi, özellikle yönlendirilmiş sınırlayıcı kutu (OBB) nesne algılama için oluşturulmuş kapsamlı bir hava görüntüsü koleksiyonudur. OBB algılamada, görüntüdeki nesnelerin gerçek yönelimiyle daha doğru bir şekilde hizalanması için döndürülmüş sınırlayıcı kutular kullanılır. Bu yöntem, özellikle nesnelerin genellikle çeşitli açılarda göründüğü hava görüntüleri için iyi çalışır ve daha hassas konumlandırma ile genel olarak daha iyi algılama sağlar.

Bu veri kümesi, 18 nesne kategorisinde 11.000'den fazla görüntü ve 1,7 milyondan fazla yönlendirilmiş sınırlayıcı kutudan oluşur. Görüntüler 800×800'den 20.000×20.000 piksele kadar değişir ve uçaklar, gemiler ve binalar gibi nesneleri içerir.

DOTA-v2.0 veri kümesinden örnek görüntüler ve açıklamalar

Şekil 2. DOTA-v2.0 veri kümesinden görüntü ve açıklama örnekleri. Yazarın görseli.

Ayrıntılı açıklamaları nedeniyle DOTA-v2.0, uzaktan algılama ve hava gözetleme projeleri için popüler bir seçenek haline gelmiştir. İşte DOTA-v2.0'ın temel özelliklerinden bazıları:

Çeşitli nesne kategorileri: Araçlar, limanlar ve depolama tankları gibi birçok farklı nesne türünü kapsar ve modellere çeşitli gerçek dünya nesnelerine maruz kalma imkanı tanır.
Yüksek kaliteli açıklamalar: Uzman etiketleyiciler, nesne şekillerini ve yönlerini net bir şekilde gösteren hassas bir şekilde yönlendirilmiş sınırlayıcı kutular sağlamıştır.
Çok ölçekli görüntüler: Veri kümesi, farklı boyutlardaki görüntüleri içerir ve modellerin nesneleri hem küçük hem de büyük ölçeklerde nasıl algılayacağını öğrenmesine yardımcı olur.

DOTA-v2'nin birçok güçlü yönü olsa da, kullanıcıların aklında bulundurması gereken bazı sınırlamalar şunlardır:

Ek indirme adımları: DOTA veri kümesinin korunma biçimi nedeniyle, DOTA-v2.0 ekstra bir kurulum adımı gerektirir. Veri kümesini tamamlamak için önce DOTA-v1.0 görüntülerini indirmeniz ve ardından DOTA-v2.0 için ekstra görüntüleri ve güncellenmiş açıklamaları eklemeniz gerekir.
Karmaşık açıklamalar: Yönlendirilmiş sınırlayıcı kutular, model eğitimi sırasında ele alınması için ekstra çaba gerektirebilir.
Sınırlı kapsam: DOTA-v2 hava görüntüleri için tasarlanmıştır, bu da onu bu alanın dışındaki genel nesne algılama görevleri için daha az yararlı kılar.

Link to this sectionRoboflow 100 veri kümesi#

Roboflow 100 (RF100) veri kümesi, Intel'in desteğiyle Roboflow tarafından oluşturulmuştur. Nesne algılama modellerinin ne kadar iyi çalıştığını test etmek ve karşılaştırmak için kullanılabilir. Bu kıyaslama veri kümesi, 90.000'den fazla halka açık veri kümesinden seçilen 100 farklı veri kümesini içerir. Sağlık hizmetleri, hava görüntüleri ve oyun gibi alanlardan 224.000'den fazla görüntü ve 800 nesne sınıfına sahiptir.

İşte RF100 kullanmanın temel avantajlarından bazıları:

Geniş alan kapsamı: Tıbbi görüntüleme, hava görüntüleri ve su altı keşfi gibi yedi alandan veri kümeleri içerir.
Model gelişimini teşvik eder: RF100'deki değişkenlik ve alana özgü zorluklar, mevcut modellerdeki boşlukları ortaya çıkararak araştırmaları daha uyarlanabilir ve sağlam nesne algılama çözümlerine doğru yönlendirir.
Tutarlı görüntü formatı: Tüm görüntüler 640x640 piksele yeniden boyutlandırılır. Bu, kullanıcıların görüntü boyutlarını ayarlamaya gerek kalmadan modelleri eğitmesine yardımcı olur.

Güçlü yönlerine rağmen RF100, akılda tutulması gereken bazı dezavantajlarla da gelir:

Görevler açısından sınırlı: RF100 nesne algılama için tasarlanmıştır, bu nedenle bölümleme veya sınıflandırma gibi görevleri karşılayamaz.
Kıyaslama odaklı: RF100, gerçek dünya uygulamaları için modelleri eğitmekten ziyade bir kıyaslama aracı olarak tasarlanmıştır, bu nedenle sonuçları pratik dağıtım senaryolarına tam olarak yansımayabilir.
Açıklama değişkenliği: RF100, kitle kaynaklı veri kümelerini topladığından, açıklama kalitesinde ve etiketleme uygulamalarında tutarsızlıklar olabilir; bu da model değerlendirmesini ve ince ayarını etkileyebilir.

Link to this sectionCOCO (Common Objects in Context) veri kümesi#

COCO veri kümesi, 330.000'den fazla görüntü ve ayrıntılı görüntü açıklaması sunan, en yaygın kullanılan bilgisayarlı görü veri kümelerinden biridir. Nesne algılama, bölümleme ve görüntü altyazılama için tasarlanmıştır ve birçok proje için değerli bir kaynaktır. Sınırlayıcı kutular ve bölümleme maskeleri dahil olmak üzere ayrıntılı etiketleri, sistemlerin görüntüleri hassas bir şekilde analiz etmeyi öğrenmesine yardımcı olur.

Bu veri kümesi, esnekliğiyle bilinir ve basit projelerden karmaşık projelere kadar çeşitli görevler için yararlıdır. Görüntü tabanlı yapay zeka alanında bir standart haline gelmiş olup, model performansını değerlendirmek için zorluklarda ve yarışmalarda sıklıkla kullanılır.

Güçlü yönlerinden bazıları şunlardır:

Çeşitli ve gerçekçi veriler: Veri kümesi, birden fazla nesne, tıkanıklık ve çeşitli ışık koşullarına sahip gerçek dünya senaryolarından görüntüler içerir.
Güçlü topluluk ve araştırma kabulü: Büyük makine öğrenimi yarışmalarında ve araştırmalarında kullanılan COCO veri kümesi, kapsamlı belgelere, önceden eğitilmiş modellere ve aktif topluluk desteğine sahiptir.
Zengin ve ayrıntılı açıklamalar: COCO veri kümesi; nesne bölümleme, anahtar noktalar ve altyazılar dahil olmak üzere son derece ayrıntılı açıklamalar sağlar, bu da onu hassas görsel anlayış gerektiren projeler için ideal kılar.

Ayrıca dikkat etmeniz gereken birkaç sınırlayıcı faktör şunlardır:

Yüksek hesaplama gereksinimleri: Boyutu ve karmaşıklığı nedeniyle, COCO üzerinde modelleri eğitmek önemli hesaplama kaynakları gerektirebilir, bu da sınırlı donanıma sahip ekipler için zorlayıcı olabilir.
Veri dengesizliği: Bazı nesne kategorileri diğerlerinden önemli ölçüde daha fazla görüntüye sahiptir, bu da model eğitiminde yanlılığa yol açabilir.
Karmaşık açıklama yapısı: Veri kümesinin ayrıntılı açıklamaları değerli olsa da, yapılandırılmış görüntü tabanlı yapay zeka veri kümeleriyle çalışma konusunda deneyimi olmayan yeni başlayanlar veya daha küçük ekipler için bunaltıcı olabilir.

Link to this sectionOpen Images V7 veri kümesi#

Open Images V7, Google tarafından derlenen ve 600 nesne kategorisi için açıklamalar içeren 9 milyondan fazla görüntüye sahip devasa bir açık kaynak veri kümesidir. Çeşitli açıklama türleri içerir ve karmaşık bilgisayarlı görü görevlerini ele almak için idealdir. Ölçeği ve derinliği, bilgisayarlı görü modellerini eğitmek ve test etmek için kapsamlı bir kaynak sağlar.

Open Images V7 veri kümesinden örnek görüntüler

Şekil 3. Open Images V7 veri kümesine bir bakış. Yazarın görseli.

Ayrıca, Open Images V7 veri kümesinin araştırmadaki popülaritesi, kullanıcıların öğrenmesi için bol miktarda kaynak ve örnek sağlar. Ancak, devasa boyutu, özellikle küçük ekipler için indirmeyi ve işlemeyi zaman alıcı hale getirebilir. Bir başka sorun da, bazı açıklamaların tutarsız olabilmesi, verileri temizlemek için ekstra çaba gerektirmesi ve entegrasyonun her zaman sorunsuz olmamasıdır; bu da ek hazırlık gerekebileceği anlamına gelir.

Link to this sectionDoğru veri kümesini seçmek#

Doğru veri kümesini seçmek, bilgisayarlı görü projenizi başarıya hazırlamanın büyük bir parçasıdır. En iyi seçim, özel görevinize bağlıdır; iyi bir eşleşme bulmak, modelinizin doğru becerileri öğrenmesine yardımcı olur. Ayrıca araçlarınızla kolayca entegre olmalıdır, böylece modelinizi oluşturmaya daha fazla, sorun gidermeye daha az odaklanabilirsiniz.

Doğru veri kümesini seçmek için faktörlerin diyagramı

Şekil 4. Doğru veri kümesini seçmek için faktörler. Yazarın görseli.

Link to this sectionÖne çıkanlar#

Yüksek kaliteli veri kümeleri, herhangi bir bilgisayarlı görü modelinin bel kemiğidir ve sistemlerin görüntüleri doğru bir şekilde yorumlamayı öğrenmesine yardımcı olur. Çeşitli ve iyi açıklanmış veri kümeleri özellikle önemlidir, çünkü modellerin gerçek dünya senaryolarında güvenilir bir şekilde performans göstermesini sağlar ve sınırlı veya düşük kaliteli verilerden kaynaklanan hataları azaltır.

Ultralytics, bilgisayarlı görü veri kümelerine erişme ve bunlarla çalışma sürecini basitleştirerek projeniz için doğru verileri bulmanızı kolaylaştırır. Doğru veri kümesini seçmek, yüksek performanslı bir model oluşturmada çok önemli bir adımdır ve daha hassas ve etkili sonuçlara yol açar.

Topluluğumuza katıl ve yapay zeka hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfet. Sağlık hizmetleri için bilgisayarlı görü ve kendi kendine giden araçlarda yapay zeka gibi gelişmeleri çözümler sayfalarımızda keşfet. Lisanslama seçeneklerimize göz at ve bugün bilgisayarlı görü ile çalışmaya başlamak için ilk adımı at!

Explore solutions

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

2025'teki en iyi bilgisayarlı görü veri kümelerini keşfetme

Link to this sectionBilgisayarlı görü veri kümeleri nelerdir?#

Link to this sectionBir bilgisayarlı görü veri kümesi nasıl oluşturulur#

Link to this sectionModel eğitimi yüksek kaliteli veri gerektirir#

Link to this sectionUltralytics çeşitli veri kümelerini destekler#

Link to this section2025'teki en iyi 5 bilgisayarlı görü veri kümesi#

Link to this sectionImageNet veri kümesi#

Link to this sectionDOTA-v2.0 veri kümesi#

Link to this sectionRoboflow 100 veri kümesi#

Link to this sectionCOCO (Common Objects in Context) veri kümesi#

Link to this sectionOpen Images V7 veri kümesi#

Link to this sectionDoğru veri kümesini seçmek#

Link to this sectionÖne çıkanlar#

Explore solutions

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Yapay zekanın geleceğini birlikte inşa edelim!