Yeşil çek
Panoya kopyalanan bağlantı

YOLOE nedir? Bilgisayarla görme modellerini daha da ileri götürmek

YOLOE'nin basit bir komut veya fotoğraf kullanarak nesneleri bulmanızı nasıl sağladığını öğrenin. Modelleri yeniden eğitmeden veya ince ayar yapmadan daha akıllı, daha hızlı bilgisayarla görmeyi mümkün kılar.

Nesne algılama, görüntülerdeki veya videolardaki nesneleri tanımlamayı ve konumlandırmayı amaçlayan önemli bir bilgisayarla görme görevidir. Makinelerin görsel verileri anlamasını ve yorumlamasını sağlayan bir yapay zeka (AI) alanı olan bilgisayarla görmenin çok önemli bir parçasıdır. Örneğin, nesne algılama, bir resimdeki arabayı tanımlamaya veya bir video akışındaki bir kişiyi tespit etmeye yardımcı olabilir.

Nesne algılama gibi bilgisayarla görme görevlerini destekleyen en iyi bilinen model serilerinden biri YOLO (You Only Look Once) model serisidir. Hız ve doğruluk için tasarlanan YOLO modelleri zaman içinde sürekli olarak geliştirilmiştir. Örneğin, en son sürümlerden biri, Ultralytics YOLO11gerçek dünya koşullarında iyi performans gösterir ve daha karmaşık ortamlarda bile doğru sonuçlar sağlar.

Bu ilerlemeyi daha da ileri götüren YOLOE adlı yeni bir model, YOLO modellerinin yeteneklerini genişletmeyi amaçlıyor. Yeni nesneleri tanımak için yeniden eğitim gerektiren geleneksel modellerin aksine, YOLOE daha önce görmediği nesneleri tespit etmek için basit metin veya görüntü istemlerini takip edebilir ve bu da onu değişen ortamlara çok daha uyarlanabilir hale getirir.

Bu makalede, YOLOE'yi benzersiz kılan özelliklere, önceki YOLO modelleriyle karşılaştırmasına ve bugün kullanmaya nasıl başlayabileceğinize daha yakından bakacağız. Hadi başlayalım!

YOLOE'ye genel bir bakış

YOLOE, nesne algılamayı bir adım öteye taşıyan bir bilgisayarla görme modelidir. Mart 2025'te Tsinghua Üniversitesi'ndeki araştırmacılar tarafından tanıtılmıştır. YOLOE'yi geleneksel modellerden ayıran şey, açık kelime tespitini kullanmasıdır. 

Çoğu model sabit bir nesne listesini tanımak üzere eğitilirken, YOLOE kısa bir açıklama veya örnek bir görüntü kullanarak neyi arayacağınızı belirtmenize olanak tanır. Örneğin, "yeşil bir sırt çantası" arıyorsanız, bu açıklamayı yazabilir veya modele bir fotoğraf gösterebilirsiniz ve YOLOE sahnenin içinde onu bulacaktır.

Ayrıca, herhangi bir uyarı olmadan bile YOLOE birçok günlük nesneyi kendi başına tespit edebilir. Daha önce hiç görmediği nesneleri tanıma yeteneğine sıfır çekim algılama denir. Özellikle görevin veya ilgilenilen nesnelerin beklenmedik şekilde değişebileceği dinamik ortamlarda kullanışlıdır.

Şekil 1. YOLOE'nin yeteneklerine bir bakış.

YOLOE'nin temel özellikleri

YOLOE, gerçek dünya uygulamalarındaki performansını artırmak için tasarlanmış çok çeşitli özellikleri destekler. Hem yapılandırılmış hem de yapılandırılmamış girdiyi işleme yeteneği ile YOLOE, nesne algılama ve segmentasyon için yeni olanaklar sunar. 

İşte modelin masaya getirdiği bazı temel özellikler:

  • Komut tabanlı algılama: YOLOE, kısa bir metin istemine veya örnek bir resme dayalı olarak nesneleri arayabilir. Bu, göreviniz her değiştiğinde modeli yeniden eğitmeniz gerekmediği anlamına gelir; sadece ne aradığınızı modele açıklayın veya gösterin.
  • Örnek segmentasyonu: YOLOE, nesnelerin etrafına sınırlayıcı kutular çizmenin yanı sıra, örnek segmentasyonunu kullanarak nesnelerin tam şeklini de belirleyebilir. Bu özellikle nesneler üst üste bindiğinde veya bir nesnenin kesin sınırlarını bilmeniz gerektiğinde yararlıdır.
  • İstemsiz nesne tanıma: YOLOE, özel talimatlar olmadan da nesneleri tanıyabilir. Nesneleri hızlı bir şekilde tanımlamak için önceden öğrenilmiş bir dizi açıklama kullanır, bu da süreci daha hızlı ve daha verimli hale getirir.

YOLOE'nin diğer YOLO modelleri ile karşılaştırılması

Artık YOLOE'nin ne olduğunu daha iyi anladığımıza göre, YOLO ailesindeki benzer modellerden bazılarına bir göz atalım. 

Bilgisayarla görme geliştikçe YOLO modelleri de gelişmiştir. Mesela, Ultralytics YOLOv8 segmentasyon ve sınıflandırma gibi yeni görevler için destek getirirken, Ultralytics YOLO11 gibi sonraki sürümler daha geniş bir görev yelpazesi için doğruluk ve performansı artırmaya odaklanmıştır.

Ayrıca, YOLO Ocak 2024'te piyasaya sürüldü ve kullanıcıların bulmak istedikleri nesneleri tanımlamalarına izin veren yazılı istemleri kullanma yeteneğini tanıttı. YOLO sıfır atış tespiti için harika bir seçenek olsa da, örnek segmentasyonu ve görsel istem desteği gibi özelliklerden yoksundu. 

YOLOE, bu yetenekleri ekleyerek, esnekliği ve performansı artırarak ve gerçek dünya bilgisayarla görme uygulamaları için daha etkili bir araç sunarak YOLO'ü temel alır.

Şekil 2. YOLO ve YOLOE'nin her ikisi de sıfır atış algılamayı destekler.

YOLOE'yi Ultralytics Python paketi ile kullanma

İster belirli nesneleri tespit etmek ister bir görüntüdeki her şeyi keşfetmek isteyin, YOLOE ile başlamak kolaydır. Bu model Ultralytics Python paketi tarafından desteklenir ve projelerinize entegre edilmesini kolaylaştırır. Şimdi, nasıl kullanılacağını inceleyelim.

Ultralytics paketini yükleme

İlk adım, 'pip' gibi bir paket yöneticisi kullanarak Ultralytics Python paketini yüklemektir. Bunu terminalinizde veya komut isteminde "pip install ultralytics" komutunu çalıştırarak yapabilirsiniz.

Paket yüklendikten sonra, modeli yüklemek, tahminler yapmak ve farklı algılama modlarını denemek için ihtiyacınız olan her şeye sahip olacaksınız. Yükleme sırasında herhangi bir sorunla karşılaşırsanız, resmi Ultralytics belgeleri yararlı bir sorun giderme bölümü sunar. 

Tahminleri çalıştırmak için YOLOE'yi kullanmanın birkaç farklı yolu vardır. Tahminleri çalıştırmak, görüntü veya videolardaki nesneleri tanımlamak ve bulmak için eğitilmiş modeli kullanmak anlamına gelir. Bu farklı yöntemler, özel ihtiyaçlarınıza göre modelle nasıl etkileşim kuracağınızı özelleştirmenize olanak tanır.

Şimdi bu yöntemlerin her birini teker teker ele alalım.

Metin veya görüntü istemleriyle belirli nesneleri algılama

YOLOE nesneleri kısa bir metin açıklamasına göre algılayabilir. Örneğin, hareket halindeki bir atı arıyorsanız, "yürüyen at" gibi bir komut istemi kullanabilirsiniz.

Başlamak için, öncelikle önceden eğitilmiş YOLOE modelini yükleyin ve aşağıdaki kod parçasında gösterildiği gibi isteminizi (modelin neyi aramasını istediğinize ilişkin açıklama) ayarlayın.

from ultralytics import YOLOE

model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))

Modeliniz ve isteminiz ayarlandıktan sonra, modeli bir resim veya video üzerinde çalıştırabilirsiniz. Koddaki dosya yolunu resim veya video dosyanızın yolu ile değiştirin:

results = model.predict("path/to/your/image.jpg")
results[0].show()

Bu, isteminize göre algılanan nesnenin açıkça işaretlendiği görüntüyü gösterecektir. Ne aradığınıza bağlı olarak "kırmızı bavul", "bisiklet" veya "zebra" gibi farklı nesneleri aramak için komut istemini değiştirebilirsiniz.

Şekil 3. Bir metin istemi kullanarak belirli nesneleri tespit etmek için YOLOE kullanımına bir örnek.

Benzer şekilde, Ultralytics Python paketi ile YOLOE'yi sorgulamak için bir görüntü kullanabilirsiniz. Görsel komut modunda, model başka bir sahnedeki benzer görünümlü öğeleri bulmak için görüntüyü kullanır. Bu, özellikle tanımlanması zor olan veya net etiketleri olmayan nesneler için kullanışlıdır. 

Bunun kodunu daha ayrıntılı olarak keşfetmek için Ultralytics belgelerine göz atabilirsiniz.

YOLOE kullanarak genel nesne algılama

Bazı durumlarda, tam olarak ne arayacağınızı bilemeyebilirsiniz veya belirli bir nesneyi aramıyor olabilirsiniz. İşte bu noktada komut istemsiz mod kullanışlı hale gelir. 

Bu seçenekle, bir açıklama yazmanıza veya örnek bir görüntü sağlamanıza gerek yoktur. YOLOE görüntüleri kendi başına analiz eder ve insanlar, hayvanlar, mobilyalar veya günlük nesneler gibi tanıyabildiği her şeyi algılar.

Modele herhangi bir özel talimat vermeden bir sahneyi keşfetmenin yararlı bir yoludur. İster kalabalık bir odayı tarıyor olun, ister çok sayıda etkinlik içeren görüntüleri inceliyor olun, istemsiz mod size bir görüntüde nelerin mevcut olduğuna hızlı bir bakış sağlar. 

YOLOE'yi komut istemsiz modda çalıştırmak için aşağıdaki kodu kullanabilirsiniz. Önce model yüklenir, ardından görüntüyü işler ve içindeki nesneleri otomatik olarak algılar. Son olarak, sonuçlar görüntülenir ve algılanan nesneler vurgulanır. 

Dosya yolunu resminizin gerçek yolu ile değiştirdiğinizden emin olun.

from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()

Aşağıda gösterilen görüntü, YOLOE'nin istemsiz modda tespit edebileceklerine bir örnektir.

Şekil 4. YOLOE'nin istemsiz modda kullanılması.

YOLOE'nin gerçek zamanlı uygulamaları

YOLOE'nin hem metin hem de görüntü istemlerine yanıt verme yeteneği, onu gerçek zamanlı uygulamalar için güvenilir bir araç haline getirir. Esnekliği, özellikle zamanlama ve doğruluğun önemli olduğu hızlı tempolu ortamlarda kullanışlıdır. 

YOLOE'nin nasıl kullanılabileceğine dair bazı gerçek dünya örneklerini inceleyelim.

Bagaj işlemlerinin iyileştirilmesi: Gerçek zamanlı bagaj tespiti

Yoğun havaalanlarında, özellikle kayıp çantalarla uğraşırken belirli bagajların yerini tespit etmek zor olabilir. YOLOE, canlı videoların taranmasına yardımcı olarak ve "kırmızı çanta" gibi basit istemlere dayalı olarak öğeleri hızlı bir şekilde tanımlayarak bu süreci kolaylaştırabilir. 

Bir çanta kayıpsa veya yanlış yerleştirilmişse, personel "siyah bavul" gibi farklı bir öğeyi aramak için istemi kolayca değiştirebilir. Bu anında uyum sağlama yeteneği, havaalanı personelinin uzun saatler süren görüntüleri incelemeden veya modeli yeniden eğitmeden doğru bagajı hızlı bir şekilde bulmasına yardımcı olarak bagaj işlemlerini ve kayıp bagaj sorunlarının çözümünü çok daha hızlı ve verimli hale getirebilir.

YOLOE ile kamusal alanların izlenmesi

Kalabalık pazarlar ve kafeler gibi kamusal alanların gözetim görüntüleri genellikle gün boyunca değişen insan, nesne ve faaliyetlerin bir karışımını içerir. YOLOE, istemsiz modu kullanarak bu görüntüleri gerçek zamanlı olarak analiz edebilir ve özel talimatlara ihtiyaç duymadan çanta, masa veya bisiklet gibi öğeleri otomatik olarak algılayabilir.

Şekil 5. YOLOE, yoğun bir kamusal alandaki çeşitli nesneleri tespit edebilir.

Bu özellikle güvenlik ekiplerinin gözetimsiz eşyaları tespit etmesi veya kalabalık hareketlerini izlemesi için kullanışlıdır. YOLOE'nin aynı anda birden fazla nesneyi tespit etme yeteneği, etkinlikler veya yoğun dönemlerde kamusal alanların yönetimini kolaylaştırarak ekiplerin bilgi sahibi ve duyarlı kalmasına yardımcı olur.

YOLOE'nin artıları ve eksileri

Bilgisayarla görme uygulamaları için YOLOE kullanmanın bazı temel faydaları şunlardır:

  • Gerçek zamanlı performans: YOLOE hızlı ve verimli işleme için optimize edilmiştir ve canlı video akışları veya yoğun kamusal alanlar gibi dinamik ortamlarda bile gerçek zamanlı algılama sağlar.
  • Ölçeklenebilirlik: YOLOE ölçeklenebilirdir ve güvenlik ve gözetimden perakende, sağlık ve otonom araçlara kadar çok çeşitli uygulamalar için iyi çalışır.
  • Kullanımı kolay: YOLOE, Ultralytics Python paketi tarafından desteklendiğinden, mevcut bilgisayarla görme projelerinize entegre edilmesi kolaydır.

Bununla birlikte, YOLOE kullanırken akılda tutulması gereken birkaç sınırlama vardır. İşte dikkate alınması gereken birkaç faktör:

  • Yeterli eğitim verisi gerektirir: YOLOE sıfır atış algılamayı desteklese de, görünmeyen nesneler üzerindeki performansı eğitim verilerinden ne kadar iyi genelleme yaptığına bağlıdır. Bazı durumlarda, son derece uzmanlaşmış görevlerde iyi performans göstermesi için ek verilere veya ince ayarlara ihtiyaç duyabilir.
  • Giriş kalitesine duyarlıdır: Modelin doğruluğu düşük kaliteli görüntü veya videolardan etkilenebilir. Bulanık veya zayıf aydınlatılmış girdi, modelin nesneleri doğru bir şekilde algılama yeteneğini azaltabilir, bu nedenle optimum performans için yüksek kaliteli girdi önemlidir.

Önemli çıkarımlar

YOLOE, kullanıcıların metin veya görüntü istemleriyle algılamayı yönlendirmesine olanak tanıyarak bilgisayarla görmeye daha fazla esneklik getirir. Sahnelerin hızla değiştiği ve yeniden eğitimin bir seçenek olmadığı gerçek dünya koşullarında iyi çalışır.

YOLOE, bagaj taşımadan kamusal alan takibine kadar yeni görevlere kolaylıkla uyum sağlıyor. Yapay zeka daha erişilebilir hale geldikçe, YOLOE gibi modeller daha fazla sektörün görüş teknolojisini pratik ve verimli yollarla kullanmasına yardımcı oluyor.

Topluluğumuza katılın ve yapay zeka yenilikleri hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfedin. Çözüm sayfalarımızda perakendede yapay zeka ve sağlık hizmetlerinde bilgisayarla görme gibi alanlardaki en son gelişmeleri keşfedin. Lisanslama seçeneklerimize göz atın ve bilgisayarla görmeye bugün başlayın!

LinkedIn logosuTwitter logosuFacebook logosuKopya-bağlantı sembolü

Bu kategoride daha fazlasını okuyun

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın