Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

YOLOE nedir? Bilgisayarlı görü modellerini daha ileriye taşımak

Abirami Vina

5 dakikalık okuma

8 Mayıs 2025

YOLOE'nin basit bir istem veya fotoğraf kullanarak nesneleri nasıl bulmanızı sağladığını öğrenin. Modelleri yeniden eğitmeden veya ince ayar yapmadan daha akıllı, daha hızlı bilgisayarlı görü sağlar.

Nesne tespiti, görüntü veya videolardaki nesneleri tanımlamayı ve konumlandırmayı amaçlayan önemli bir bilgisayarlı görü görevidir. Makinelerin görsel verileri anlamasını ve yorumlamasını sağlayan bir yapay zeka (AI) alanı olan bilgisayarlı görünün önemli bir parçasıdır. Örneğin, nesne tespiti bir resimdeki bir arabayı tanımlamaya veya bir video akışında bir kişiyi tespit etmeye yardımcı olabilir.

Nesne algılama gibi bilgisayarla görme görevlerini destekleyen en iyi bilinen model serilerinden biri YOLO (You Only Look Once) model serisidir. Hız ve doğruluk için tasarlanan YOLO modelleri zaman içinde sürekli olarak geliştirilmiştir. Örneğin, en son sürümlerden biri, Ultralytics YOLO11gerçek dünya koşullarında iyi performans gösterir ve daha karmaşık ortamlarda bile doğru sonuçlar sağlar.

Bu ilerlemeyi daha da ileri götüren YOLOE adlı yeni bir model, YOLO modellerinin yeteneklerini genişletmeyi amaçlıyor. Yeni nesneleri tanımak için yeniden eğitim gerektiren geleneksel modellerin aksine, YOLOE daha önce görmediği nesneleri detect etmek için basit metin veya görüntü istemlerini takip edebilir ve bu da onu değişen ortamlara çok daha uyarlanabilir hale getirir.

Bu makalede, YOLOE'yi benzersiz kılan özelliklere, önceki YOLO modelleriyle karşılaştırmasına ve bugün kullanmaya nasıl başlayabileceğinize daha yakından bakacağız. Hadi başlayalım!

YOLOE'ye genel bakış

YOLOE, nesne tespitini bir adım öteye taşıyan bir bilgisayarlı görü modelidir. Mart 2025'te Tsinghua Üniversitesi'ndeki araştırmacılar tarafından tanıtıldı. YOLOE'yi geleneksel modellerden ayıran şey, açık kelime dağarcığı tespitini kullanmasıdır. 

Çoğu model sabit bir nesne listesini tanımak için eğitilmiş olsa da, YOLOE kısa bir açıklama veya örnek bir resim kullanarak ne aranacağını belirtmenize olanak tanır. Örneğin, “yeşil bir sırt çantası” arıyorsanız, bu açıklamayı yazabilir veya modele bir fotoğraf gösterebilirsiniz ve YOLOE bunu sahne içinde bulacaktır.

Ayrıca, herhangi bir uyarı olmadan bile YOLOE birçok günlük nesneyi kendi başına detect edebilir. Daha önce hiç görmediği nesneleri tanıma yeteneğine sıfır çekim algılama denir. Özellikle görevin veya ilgilenilen nesnelerin beklenmedik şekilde değişebileceği dinamik ortamlarda kullanışlıdır.

Şekil 1. YOLOE'nin yeteneklerine bir bakış.

YOLOE'nin temel özellikleri

YOLOE, gerçek dünya uygulamalarındaki performansını artırmak için tasarlanmış çok çeşitli özellikleri destekler. Hem yapılandırılmış hem de yapılandırılmamış girdiyi işleme yeteneği ile YOLOE, nesne algılama ve segmentasyon için yeni olanaklar sunar. 

İşte modelin sunduğu temel özelliklerden bazıları:

  • İstem tabanlı algılama: YOLOE, kısa bir metin istemine veya örnek bir görüntüye göre nesneleri arayabilir. Bu, göreviniz her değiştiğinde modeli yeniden eğitmeniz gerekmediği anlamına gelir; sadece modele ne aradığınızı açıklayın veya gösterin.
  • Örnek bölütleme: Nesnelerin etrafına sınırlayıcı kutular çizmenin yanı sıra, YOLOE, örnek bölütleme kullanarak tam şekillerini ana hatlarıyla belirleyebilir. Bu, özellikle nesneler örtüştüğünde veya bir nesnenin kesin sınırlarını bilmeniz gerektiğinde yararlıdır.
  • İstemsiz nesne tanıma: YOLOE, belirli talimatlar olmadan bile nesneleri tanıyabilir. Nesneleri hızlı bir şekilde tanımlamak için önceden öğrenilmiş bir dizi açıklama kullanır, bu da süreci daha hızlı ve daha verimli hale getirir.

YOLOE'nin diğer YOLO modelleri ile karşılaştırılması

Artık YOLOE'nin ne olduğunu daha iyi anladığımıza göre, YOLO ailesindeki benzer modellerden bazılarına bir göz atalım. 

Bilgisayarla görme geliştikçe YOLO modelleri de gelişmiştir. Mesela, Ultralytics YOLOv8 segmentasyon ve sınıflandırma gibi yeni görevler için destek getirirken, Ultralytics YOLO11 gibi sonraki sürümler daha geniş bir görev yelpazesi için doğruluk ve performansı artırmaya odaklanmıştır.

Ayrıca, YOLO Ocak 2024'te piyasaya sürüldü ve kullanıcıların bulmak istedikleri nesneleri tanımlamalarına izin veren yazılı istemleri kullanma yeteneğini tanıttı. YOLO sıfır atış tespiti için harika bir seçenek olsa da, örnek segmentasyonu ve görsel istem desteği gibi özelliklerden yoksundu. 

YOLOE, bu yetenekleri ekleyerek, esnekliği ve performansı artırarak ve gerçek dünya bilgisayarla görme uygulamaları için daha etkili bir araç sunarak YOLO'ü temel alır.

Şekil 2. YOLO ve YOLOE'nin her ikisi de sıfır atış algılamayı destekler.

YOLOE'yi Ultralytics Python paketi ile kullanma

İster belirli nesneleri detect etmek ister bir görüntüdeki her şeyi keşfetmek isteyin, YOLOE ile başlamak kolaydır. Bu model Ultralytics Python paketi tarafından desteklenir ve projelerinize entegre edilmesini kolaylaştırır. Şimdi, nasıl kullanılacağını inceleyelim.

Ultralytics paketini yükleme

İlk adım, 'pip' gibi bir paket yöneticisi kullanarak Ultralytics Python paketini yüklemektir. Bunu terminalinizde veya komut isteminde "pip install ultralytics" komutunu çalıştırarak yapabilirsiniz.

Paket yüklendikten sonra, modeli yüklemek, tahminler yapmak ve farklı algılama modlarını denemek için ihtiyacınız olan her şeye sahip olacaksınız. Yükleme sırasında herhangi bir sorunla karşılaşırsanız, resmi Ultralytics belgeleri yararlı bir sorun giderme bölümü sunar. 

YOLOE'yi tahminleri çalıştırmak için kullanmanın birkaç farklı yolu vardır. Tahminleri çalıştırmak, eğitilmiş modeli görüntüler veya videolar içindeki nesneleri tanımlamak ve konumlandırmak için kullanmak anlamına gelir. Bu farklı yöntemler, modelle nasıl etkileşim kurduğunuzu özel ihtiyaçlarınıza göre özelleştirmenize olanak tanır.

Şimdi bu yöntemlerin her birini teker teker ele alalım.

Metin veya resim istemleriyle belirli nesneleri tespit etme

YOLOE nesneleri kısa bir metin açıklamasına göre detect . Örneğin, hareket halindeki bir atı arıyorsanız, "yürüyen at" gibi bir komut istemi kullanabilirsiniz.

Başlamak için, öncelikle önceden eğitilmiş YOLOE modelini yükleyin ve isteminizi (modelin aramasını istediğiniz şeyin açıklaması) aşağıdaki kod parçasında gösterildiği gibi ayarlayın.

from ultralytics import YOLOE

model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))

Modeliniz ve isteminiz ayarlandıktan sonra, modeli bir resim veya video üzerinde çalıştırabilirsiniz. Koddaki dosya yolunu, resminizin veya video dosyanızın yoluyla değiştirin:

results = model.predict("path/to/your/image.jpg")
results[0].show()

Bu, isteminize göre algılanan nesnenin açıkça işaretlendiği görüntüyü gösterecektir. Aradığınız şeye bağlı olarak, "kırmızı bavul", "bisiklet" veya "zebra" gibi farklı nesneleri aramak için istemi değiştirebilirsiniz.

Şekil 3. Bir metin istemi kullanarak belirli nesneleri detect etmek için YOLOE kullanımına bir örnek.

Benzer şekilde, Ultralytics Python paketi ile YOLOE'yi sorgulamak için bir görüntü kullanabilirsiniz. Görsel komut modunda model, başka bir sahnedeki benzer görünümlü öğeleri bulmak için görüntüyü kullanır. Bu, özellikle tanımlanması zor olan veya net etiketleri olmayan nesneler için kullanışlıdır. 

Bunun kodunu daha ayrıntılı olarak keşfetmek için Ultralytics belgelerine göz atabilirsiniz.

YOLOE kullanarak genel nesne tespiti

Bazı durumlarda, tam olarak ne aradığınızı bilemeyebilirsiniz veya belirli bir nesne aramıyor olabilirsiniz. İşte bu noktada istem içermeyen mod devreye girer. 

Bu seçenekle, bir açıklama yazmanıza veya örnek bir resim sağlamanıza gerek yoktur. YOLOE, görüntüleri kendi başına analiz eder ve insanlar, hayvanlar, mobilyalar veya günlük nesneler gibi tanıyabildiği her şeyi tespit eder.

Modele herhangi bir özel talimat vermeden bir sahneyi keşfetmek için yararlı bir yoldur. İster kalabalık bir odayı tarıyor ister çok sayıda aktivite içeren görüntüleri inceliyor olun, istem içermeyen mod, bir görüntüde neyin mevcut olduğuna hızlı bir bakış sağlar. 

YOLOE'yi istem içermeyen modda çalıştırmak için aşağıdaki kodu kullanabilirsiniz. Öncelikle model yüklenir, ardından görüntüyü işler ve içindeki nesneleri otomatik olarak algılar. Son olarak, sonuçlar görüntülenir ve algılanan nesneler vurgulanır. 

Dosya yolunu, resminizin gerçek yoluyla değiştirdiğinizden emin olun.

from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()

Aşağıda gösterilen görüntü, YOLOE'nin istemsiz modda detect edebileceklerine bir örnektir.

Şekil 4. YOLOE'yi istem içermeyen modda kullanma.

YOLOE'nin gerçek zamanlı uygulamaları

YOLOE'nin hem metin hem de görüntü istemlerine yanıt verebilme özelliği, onu gerçek zamanlı uygulamalar için güvenilir bir araç haline getirir. Esnekliği, özellikle zamanlama ve doğruluğun önemli olduğu hızlı tempolu ortamlarda kullanışlıdır. 

YOLOE'nin nasıl kullanılabileceğine dair bazı gerçek dünya örneklerini inceleyelim.

Bagaj taşıma işlemlerini iyileştirme: Gerçek zamanlı bagaj algılama

Yoğun havaalanlarında, özellikle kayıp çantalarla uğraşırken, belirli bir bagajı bulmak zor olabilir. YOLOE, canlı videoları tarayarak ve "kırmızı çanta" gibi basit istemlere göre öğeleri hızlı bir şekilde tanımlayarak bu süreci kolaylaştırabilir. 

Bir çanta kaybolursa veya yanlış yere konulursa, personel istemi kolayca değiştirerek "siyah bavul" gibi farklı bir öğe arayabilir. Bu anında uyum sağlama yeteneği, havaalanı personelinin uzun saatler süren görüntüleri incelemeden veya modeli yeniden eğitmeden doğru bagajı hızlı bir şekilde bulmasına yardımcı olabilir, bu da bagaj işlemlerini ve kayıp bagaj sorunlarının çözümünü çok daha hızlı ve verimli hale getirir.

YOLOE ile kamusal alanların izlenmesi

Kalabalık pazarlar ve kafeler gibi halka açık alanların gözetim görüntüleri genellikle gün boyunca değişen insanları, nesneleri ve etkinlikleri içerir. YOLOE, bu görüntüleri istem gerektirmeyen modu kullanarak gerçek zamanlı olarak analiz edebilir ve belirli talimatlara ihtiyaç duymadan çantalar, masalar veya bisikletler gibi öğeleri otomatik olarak algılayabilir.

Şekil 5. YOLOE, yoğun bir kamusal alandaki çeşitli nesneleri detect edebilir.

Bu özellikle güvenlik ekiplerinin gözetimsiz eşyaları tespit etmesi veya kalabalık hareketlerini track için kullanışlıdır. YOLOE'nin aynı anda birden fazla nesneyi detect etme yeteneği, etkinlikler veya yoğun dönemlerde kamusal alanların yönetimini kolaylaştırarak ekiplerin bilgi sahibi ve duyarlı kalmasına yardımcı olur.

YOLOE'nin avantajları ve dezavantajları

İşte bilgisayarlı görü uygulamaları için YOLOE kullanmanın temel faydalarından bazıları:

  • Gerçek zamanlı performans: YOLOE, hızlı ve verimli işleme için optimize edilmiştir ve canlı video akışları veya yoğun kamusal alanlar gibi dinamik ortamlarda bile gerçek zamanlı algılama sağlar.
  • Ölçeklenebilirlik: YOLOE ölçeklenebilir ve güvenlik ve gözetimden perakende, sağlık ve otonom araçlara kadar çok çeşitli uygulamalar için iyi çalışır.
  • Kullanımı kolay: YOLOE, Ultralytics Python paketi tarafından desteklendiğinden, mevcut bilgisayarla görme projelerinize entegre edilmesi kolaydır.

Ancak, YOLOE'yi kullanırken akılda tutulması gereken birkaç sınırlama vardır. İşte dikkate alınması gereken birkaç faktör:

  • Yeterli eğitim verisi gerektirir: YOLOE sıfır atışlı algılamayı desteklese de, görülmeyen nesneler üzerindeki performansı, eğitim verilerinden ne kadar iyi genelleme yaptığına bağlıdır. Bazı durumlarda, son derece özel görevlerde iyi performans göstermesi için ek verilere veya ince ayara ihtiyacı olabilir.
  • Giriş kalitesine duyarlıdır: Modelin doğruluğu düşük kaliteli görüntü veya videolardan etkilenebilir. Bulanık veya zayıf aydınlatılmış girdi, modelin nesneleri doğru bir şekilde detect yeteneğini azaltabilir, bu nedenle optimum performans için yüksek kaliteli girdi önemlidir.

Önemli çıkarımlar

YOLOE, kullanıcıların algılamayı metin veya görüntü istemleriyle yönlendirmesine olanak tanıyarak bilgisayarlı görüye daha fazla esneklik getirir. Sahnelerin hızla değiştiği ve yeniden eğitimin bir seçenek olmadığı gerçek dünya durumlarında iyi çalışır.

Bagaj taşımadan kamusal alan izlemeye kadar YOLOE, yeni görevlere kolaylıkla uyum sağlar. YZ daha erişilebilir hale geldikçe, YOLOE gibi modeller daha fazla sektörün görüntü teknolojisini pratik ve verimli bir şekilde kullanmasına yardımcı oluyor.

Yapay zeka yenilikleri hakkında daha fazla bilgi edinmek için topluluğumuza katılın ve GitHub depomuza göz atın. Çözüm sayfalarımızda perakende sektöründe yapay zeka ve sağlık hizmetlerinde bilgisayarlı görü gibi alanlardaki en son gelişmeleri keşfedin. Lisanslama seçeneklerimize göz atın ve bilgisayarlı görüye bugün başlayın!

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın