Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

YOLOE nedir? Bilgisayarlı görü modellerini daha ileriye taşımak

Abirami Vina

5 dakikalık okuma

8 Mayıs 2025

YOLOE'nin basit bir istem veya fotoğraf kullanarak nesneleri nasıl bulmanızı sağladığını öğrenin. Modelleri yeniden eğitmeden veya ince ayar yapmadan daha akıllı, daha hızlı bilgisayarlı görü sağlar.

Nesne tespiti, görüntü veya videolardaki nesneleri tanımlamayı ve konumlandırmayı amaçlayan önemli bir bilgisayarlı görü görevidir. Makinelerin görsel verileri anlamasını ve yorumlamasını sağlayan bir yapay zeka (AI) alanı olan bilgisayarlı görünün önemli bir parçasıdır. Örneğin, nesne tespiti bir resimdeki bir arabayı tanımlamaya veya bir video akışında bir kişiyi tespit etmeye yardımcı olabilir.

Nesne tespiti gibi bilgisayarla görme görevlerini destekleyen en bilinen model serilerinden biri, YOLO (You Only Look Once) model serisidir. Hız ve doğruluk için tasarlanan YOLO modelleri zaman içinde sürekli olarak gelişmiştir. Örneğin, en son sürümlerden biri olan Ultralytics YOLO11, gerçek dünya koşullarında iyi performans göstererek daha karmaşık ortamlarda bile doğru sonuçlar vermektedir.

Bu ilerlemeyi daha da ileriye taşıyan YOLOE adlı yeni bir model, YOLO modellerinin yeteneklerini genişletmeyi amaçlıyor. Yeni nesneleri tanımak için yeniden eğitilmeyi gerektiren geleneksel modellerin aksine, YOLOE daha önce görmediği nesneleri tespit etmek için basit metin veya resim istemlerini takip edebilir, bu da onu değişen ortamlara çok daha uyarlanabilir hale getirir.

Bu makalede, YOLOE'yi benzersiz kılan şeyin ne olduğuna, önceki YOLO modelleriyle nasıl karşılaştırıldığına ve bugün onu nasıl kullanmaya başlayabileceğinize daha yakından bakacağız. Hadi başlayalım!

YOLOE'ye genel bakış

YOLOE, nesne tespitini bir adım öteye taşıyan bir bilgisayarlı görü modelidir. Mart 2025'te Tsinghua Üniversitesi'ndeki araştırmacılar tarafından tanıtıldı. YOLOE'yi geleneksel modellerden ayıran şey, açık kelime dağarcığı tespitini kullanmasıdır. 

Çoğu model sabit bir nesne listesini tanımak için eğitilmiş olsa da, YOLOE kısa bir açıklama veya örnek bir resim kullanarak ne aranacağını belirtmenize olanak tanır. Örneğin, “yeşil bir sırt çantası” arıyorsanız, bu açıklamayı yazabilir veya modele bir fotoğraf gösterebilirsiniz ve YOLOE bunu sahne içinde bulacaktır.

Ek olarak, YOLOE herhangi bir istem olmaksızın bile birçok günlük nesneyi kendi başına algılayabilir. Daha önce hiç görmediği nesneleri tanıma yeteneğine sıfır atışlı algılama denir. Özellikle görevin veya ilgi nesnelerinin beklenmedik şekilde değişebileceği dinamik ortamlarda kullanışlıdır.

Şekil 1. YOLOE'nin yeteneklerine bir bakış.

YOLOE'nin temel özellikleri

YOLOE, gerçek dünya uygulamalarındaki performansını artırmak için tasarlanmış çok çeşitli özellikleri destekler. Hem yapılandırılmış hem de yapılandırılmamış girdiyi işleme yeteneği ile YOLOE, nesne algılama ve segmentasyon için yeni olanaklar sunar. 

İşte modelin sunduğu temel özelliklerden bazıları:

  • İstem tabanlı algılama: YOLOE, kısa bir metin istemine veya örnek bir görüntüye göre nesneleri arayabilir. Bu, göreviniz her değiştiğinde modeli yeniden eğitmeniz gerekmediği anlamına gelir; sadece modele ne aradığınızı açıklayın veya gösterin.
  • Örnek bölütleme: Nesnelerin etrafına sınırlayıcı kutular çizmenin yanı sıra, YOLOE, örnek bölütleme kullanarak tam şekillerini ana hatlarıyla belirleyebilir. Bu, özellikle nesneler örtüştüğünde veya bir nesnenin kesin sınırlarını bilmeniz gerektiğinde yararlıdır.
  • İstemsiz nesne tanıma: YOLOE, belirli talimatlar olmadan bile nesneleri tanıyabilir. Nesneleri hızlı bir şekilde tanımlamak için önceden öğrenilmiş bir dizi açıklama kullanır, bu da süreci daha hızlı ve daha verimli hale getirir.

YOLOE'yi diğer YOLO modelleriyle karşılaştırma

YOLOE'nin ne olduğunu daha iyi anladığımıza göre, YOLO ailesindeki benzer modellere bir göz atalım. 

Bilgisayarlı görü ilerledikçe, YOLO modelleri de ilerledi. Örneğin, Ultralytics YOLOv8, segmentasyon ve sınıflandırma gibi yeni görevler için destek getirirken, Ultralytics YOLO11 gibi sonraki sürümler, daha geniş bir görev yelpazesi için doğruluğu ve performansı iyileştirmeye odaklandı.

Ayrıca, Ocak 2024'te YOLO-World piyasaya sürüldü ve yazılı istemler kullanma yeteneği getirerek kullanıcıların bulmak istedikleri nesneleri tanımlamalarına olanak tanıdı. YOLO-World, sıfır atışlı algılama için harika bir seçenek olsa da, örnek segmentasyonu ve görsel istem desteği gibi özelliklerden yoksundu. 

YOLOE, YOLO-World üzerine inşa edilerek bu yetenekleri ekler, esnekliği ve performansı artırır ve gerçek dünya bilgisayarlı görü uygulamaları için daha etkili bir araç sunar.

Şekil 2. YOLO-World ve YOLOE, sıfır atışlı (zero-shot) algılamayı destekler.

Ultralytics Python paketi ile YOLOE kullanımı

İster belirli nesneleri tespit etmek, ister bir görüntüdeki her şeyi keşfetmek isteyin, YOLOE'ye başlamak basittir. Bu model, projelerinize entegre etmeyi kolaylaştıran Ultralytics Python paketi tarafından desteklenmektedir. Ardından, nasıl kullanılacağını adım adım inceleyelim.

Ultralytics paketinin kurulumu

İlk adım, ‘pip’ gibi bir paket yöneticisi kullanarak Ultralytics Python paketini kurmaktır. Bunu, terminalinizde veya komut isteminizde “pip install ultralytics” komutunu çalıştırarak yapabilirsiniz.

Paket yüklendikten sonra, modeli yüklemek, tahminlerde bulunmak ve farklı algılama modlarıyla denemeler yapmak için ihtiyacınız olan her şeye sahip olacaksınız. Kurulum sırasında herhangi bir sorunla karşılaşırsanız, resmi Ultralytics belgeleri yardımcı bir sorun giderme bölümü sunar. 

YOLOE'yi tahminleri çalıştırmak için kullanmanın birkaç farklı yolu vardır. Tahminleri çalıştırmak, eğitilmiş modeli görüntüler veya videolar içindeki nesneleri tanımlamak ve konumlandırmak için kullanmak anlamına gelir. Bu farklı yöntemler, modelle nasıl etkileşim kurduğunuzu özel ihtiyaçlarınıza göre özelleştirmenize olanak tanır.

Şimdi bu yöntemlerin her birini teker teker ele alalım.

Metin veya resim istemleriyle belirli nesneleri tespit etme

YOLOE, kısa bir metin açıklamasına dayanarak nesneleri tespit edebilir. Örneğin, hareket halindeki bir at arıyorsanız, "yürüyen at" gibi bir komut kullanabilirsiniz.

Başlamak için, öncelikle önceden eğitilmiş YOLOE modelini yükleyin ve isteminizi (modelin aramasını istediğiniz şeyin açıklaması) aşağıdaki kod parçasında gösterildiği gibi ayarlayın.

from ultralytics import YOLOE

model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))

Modeliniz ve isteminiz ayarlandıktan sonra, modeli bir resim veya video üzerinde çalıştırabilirsiniz. Koddaki dosya yolunu, resminizin veya video dosyanızın yoluyla değiştirin:

results = model.predict("path/to/your/image.jpg")
results[0].show()

Bu, isteminize göre algılanan nesnenin açıkça işaretlendiği görüntüyü gösterecektir. Aradığınız şeye bağlı olarak, "kırmızı bavul", "bisiklet" veya "zebra" gibi farklı nesneleri aramak için istemi değiştirebilirsiniz.

Şekil 3. Bir metin istemi kullanarak belirli nesneleri tespit etmek için YOLOE kullanımına bir örnek.

Benzer şekilde, Ultralytics Python paketi ile YOLOE'ye bir görüntü istemi gönderebilirsiniz. Görsel istem modunda, model başka bir sahnede benzer görünümlü öğeler bulmak için görüntüyü kullanır. Bu, özellikle tanımlanması zor veya net etiketleri olmayan nesneler için kullanışlıdır. 

Bunun kodunu daha ayrıntılı olarak incelemek için Ultralytics belgelerine göz atabilirsiniz.

YOLOE kullanarak genel nesne tespiti

Bazı durumlarda, tam olarak ne aradığınızı bilemeyebilirsiniz veya belirli bir nesne aramıyor olabilirsiniz. İşte bu noktada istem içermeyen mod devreye girer. 

Bu seçenekle, bir açıklama yazmanıza veya örnek bir resim sağlamanıza gerek yoktur. YOLOE, görüntüleri kendi başına analiz eder ve insanlar, hayvanlar, mobilyalar veya günlük nesneler gibi tanıyabildiği her şeyi tespit eder.

Modele herhangi bir özel talimat vermeden bir sahneyi keşfetmek için yararlı bir yoldur. İster kalabalık bir odayı tarıyor ister çok sayıda aktivite içeren görüntüleri inceliyor olun, istem içermeyen mod, bir görüntüde neyin mevcut olduğuna hızlı bir bakış sağlar. 

YOLOE'yi istem içermeyen modda çalıştırmak için aşağıdaki kodu kullanabilirsiniz. Öncelikle model yüklenir, ardından görüntüyü işler ve içindeki nesneleri otomatik olarak algılar. Son olarak, sonuçlar görüntülenir ve algılanan nesneler vurgulanır. 

Dosya yolunu, resminizin gerçek yoluyla değiştirdiğinizden emin olun.

from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()

Aşağıda gösterilen resim, YOLOE'nin istem içermeyen modda neler algılayabileceğine bir örnektir.

Şekil 4. YOLOE'yi istem içermeyen modda kullanma.

YOLOE'nin gerçek zamanlı uygulamaları

YOLOE'nin hem metin hem de görüntü istemlerine yanıt verebilme özelliği, onu gerçek zamanlı uygulamalar için güvenilir bir araç haline getirir. Esnekliği, özellikle zamanlama ve doğruluğun önemli olduğu hızlı tempolu ortamlarda kullanışlıdır. 

YOLOE'nin nasıl kullanılabileceğine dair bazı gerçek dünya örneklerini inceleyelim.

Bagaj taşıma işlemlerini iyileştirme: Gerçek zamanlı bagaj algılama

Yoğun havaalanlarında, özellikle kayıp çantalarla uğraşırken, belirli bir bagajı bulmak zor olabilir. YOLOE, canlı videoları tarayarak ve "kırmızı çanta" gibi basit istemlere göre öğeleri hızlı bir şekilde tanımlayarak bu süreci kolaylaştırabilir. 

Bir çanta kaybolursa veya yanlış yere konulursa, personel istemi kolayca değiştirerek "siyah bavul" gibi farklı bir öğe arayabilir. Bu anında uyum sağlama yeteneği, havaalanı personelinin uzun saatler süren görüntüleri incelemeden veya modeli yeniden eğitmeden doğru bagajı hızlı bir şekilde bulmasına yardımcı olabilir, bu da bagaj işlemlerini ve kayıp bagaj sorunlarının çözümünü çok daha hızlı ve verimli hale getirir.

YOLOE ile kamusal alanların izlenmesi

Kalabalık pazarlar ve kafeler gibi halka açık alanların gözetim görüntüleri genellikle gün boyunca değişen insanları, nesneleri ve etkinlikleri içerir. YOLOE, bu görüntüleri istem gerektirmeyen modu kullanarak gerçek zamanlı olarak analiz edebilir ve belirli talimatlara ihtiyaç duymadan çantalar, masalar veya bisikletler gibi öğeleri otomatik olarak algılayabilir.

Şekil 5. YOLOE, kalabalık bir kamusal alanda çeşitli nesneleri tespit edebilir.

Bu, özellikle güvenlik ekiplerinin gözetimsiz eşyaları tespit etmesi veya kalabalık hareketini izlemesi için kullanışlıdır. YOLOE'nin aynı anda birden fazla nesneyi algılama yeteneği, ekiplerin olaylar veya yoğun dönemlerde kamusal alanları yönetmesini kolaylaştırır ve ekiplerin bilgili ve duyarlı kalmasına yardımcı olur.

YOLOE'nin avantajları ve dezavantajları

İşte bilgisayarlı görü uygulamaları için YOLOE kullanmanın temel faydalarından bazıları:

  • Gerçek zamanlı performans: YOLOE, hızlı ve verimli işleme için optimize edilmiştir ve canlı video akışları veya yoğun kamusal alanlar gibi dinamik ortamlarda bile gerçek zamanlı algılama sağlar.
  • Ölçeklenebilirlik: YOLOE ölçeklenebilir ve güvenlik ve gözetimden perakende, sağlık ve otonom araçlara kadar çok çeşitli uygulamalar için iyi çalışır.
  • Kullanımı kolay: YOLOE, Ultralytics Python paketi tarafından desteklendiğinden, mevcut bilgisayarlı görü projelerinize entegre etmek kolaydır.

Ancak, YOLOE'yi kullanırken akılda tutulması gereken birkaç sınırlama vardır. İşte dikkate alınması gereken birkaç faktör:

  • Yeterli eğitim verisi gerektirir: YOLOE sıfır atışlı algılamayı desteklese de, görülmeyen nesneler üzerindeki performansı, eğitim verilerinden ne kadar iyi genelleme yaptığına bağlıdır. Bazı durumlarda, son derece özel görevlerde iyi performans göstermesi için ek verilere veya ince ayara ihtiyacı olabilir.
  • Girdi kalitesine duyarlı: Modelin doğruluğu, düşük kaliteli resimlerden veya videolardan etkilenebilir. Bulanık veya kötü aydınlatılmış girdi, modelin nesneleri doğru bir şekilde algılama yeteneğini azaltabilir, bu nedenle optimum performans için yüksek kaliteli girdi önemlidir.

Önemli çıkarımlar

YOLOE, kullanıcıların algılamayı metin veya görüntü istemleriyle yönlendirmesine olanak tanıyarak bilgisayarlı görüye daha fazla esneklik getirir. Sahnelerin hızla değiştiği ve yeniden eğitimin bir seçenek olmadığı gerçek dünya durumlarında iyi çalışır.

Bagaj taşımadan kamusal alan izlemeye kadar YOLOE, yeni görevlere kolaylıkla uyum sağlar. YZ daha erişilebilir hale geldikçe, YOLOE gibi modeller daha fazla sektörün görüntü teknolojisini pratik ve verimli bir şekilde kullanmasına yardımcı oluyor.

Yapay zeka yenilikleri hakkında daha fazla bilgi edinmek için topluluğumuza katılın ve GitHub depomuza göz atın. Çözüm sayfalarımızda perakende sektöründe yapay zeka ve sağlık hizmetlerinde bilgisayarlı görü gibi alanlardaki en son gelişmeleri keşfedin. Lisanslama seçeneklerimize göz atın ve bilgisayarlı görüye bugün başlayın!

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Bağlantı panoya kopyalandı