YOLOE nedir? Bilgisayarlı görü modellerini daha ileriye taşımak
YOLOE'nun basit bir komut veya fotoğraf kullanarak nesneleri bulmanı nasıl sağladığını öğren. Modelleri yeniden eğitmeden veya ince ayar yapmadan daha akıllı, daha hızlı bilgisayarlı görü sağlar.

Nesne tespiti, temel bir bilgisayarlı görü görevidir ve amacı görüntülerdeki veya videolardaki nesneleri tanımlamak ve konumlandırmaktır. Bu, makinelerin görsel verileri anlamasını ve yorumlamasını sağlayan bir yapay zeka (AI) alanı olan bilgisayarlı görü dalının kritik bir parçasıdır. Örneğin, nesne tespiti bir resimdeki arabayı tanımlamaya veya video akışındaki bir kişiyi tespit etmeye yardımcı olabilir.
Nesne tespiti gibi bilgisayarlı görü görevlerini destekleyen en bilinen model serilerinden biri YOLO (You Only Look Once) model serisidir. Hız ve doğruluk için tasarlanan YOLO modelleri zaman içinde sürekli olarak geliştirilmiştir. Örneğin, en son sürümlerden biri olan Ultralytics YOLO11, daha karmaşık ortamlarda bile doğru sonuçlar vererek gerçek dünya durumlarında iyi performans gösterir.
Bu ilerlemeyi daha da ileriye taşıyan YOLOE adlı yeni bir model, YOLO modellerinin yeteneklerini genişletmeyi amaçlıyor. Yeni nesneleri tanımak için yeniden eğitilmeleri gereken geleneksel modellerin aksine YOLOE, daha önce görmediği nesneleri tespit etmek için basit metin veya görsel komutlarını (prompt) takip edebilir, bu da onu değişen ortamlara çok daha uyumlu hale getirir.
Bu makalede, YOLOE'yu benzersiz kılan özelliklere, önceki YOLO modelleriyle nasıl karşılaştırıldığına ve onu bugün nasıl kullanmaya başlayabileceğine daha yakından bakacağız. Hadi başlayalım!
Link to this sectionYOLOE'ya genel bir bakış#
YOLOE, nesne tespitini bir adım öteye taşıyan bir bilgisayarlı görü modelidir. Mart 2025'te Tsinghua Üniversitesi'ndeki araştırmacılar tarafından tanıtılmıştır. YOLOE'yu geleneksel modellerden ayıran özellik, açık kelime dağarcıklı (open-vocabulary) tespit kullanmasıdır.
Çoğu model sabit bir nesne listesini tanımak üzere eğitilirken, YOLOE kısa bir açıklama veya örnek bir görsel kullanarak ne aranacağını belirtmene olanak tanır. Örneğin, bir “yeşil sırt çantası” arıyorsan, bu açıklamayı yazabilir veya modele bir fotoğraf gösterebilirsin; YOLOE onu sahnede bulacaktır.
Ayrıca, herhangi bir komut (prompt) olmasa bile, YOLOE birçok günlük nesneyi kendi başına tespit edebilir. Daha önce hiç görmediği nesneleri tanıma yeteneğine sıfır örnekli tespit (zero-shot detection) denir. Bu, özellikle görevin veya ilgilenilen nesnelerin beklenmedik bir şekilde değişebileceği dinamik ortamlarda oldukça kullanışlıdır.

Şekil 1. YOLOE’nun yeteneklerine bir bakış.
Link to this sectionYOLOE'nun temel özellikleri#
YOLOE, gerçek dünya uygulamalarındaki performansını artırmak için tasarlanmış çok çeşitli özellikleri destekler. Yapılandırılmış ve yapılandırılmamış girdileri işleme yeteneği ile YOLOE, nesne tespiti ve segmentasyonu için yeni olanaklar sunar.
İşte modelin sunduğu temel özelliklerden bazıları:
- Komut tabanlı tespit: YOLOE, kısa bir metin komutuna veya örnek bir görsele dayalı olarak nesneleri arayabilir. Bu, görevin her değiştiğinde modeli yeniden eğitmen gerekmediği anlamına gelir; sadece ne aradığını betimle veya modele göster.
- Örnek segmentasyonu: Nesnelerin etrafına sınırlayıcı kutular (bbox) çizmenin yanı sıra YOLOE, örnek segmentasyonu kullanarak tam şekillerini ana hatlarıyla belirleyebilir. Bu, özellikle nesneler üst üste bindiğinde veya bir nesnenin kesin sınırlarını bilmen gerektiğinde oldukça faydalıdır.
- Komutsuz nesne tanıma: YOLOE, özel talimatlar olmasa bile nesneleri tanıyabilir. Nesneleri hızlı bir şekilde tanımlamak için önceden öğrenilmiş bir açıklama seti kullanır, bu da süreci daha hızlı ve verimli hale getirir.
Link to this sectionYOLOE'yu diğer YOLO modelleriyle karşılaştırma#
Artık YOLOE'nun ne olduğuna dair daha iyi bir anlayışa sahip olduğumuza göre, YOLO ailesindeki benzer modellere bir göz atalım.
Bilgisayarlı görü ilerledikçe YOLO modelleri de ilerledi. Örneğin, Ultralytics YOLOv8 segmentasyon ve sınıflandırma gibi yeni görevler için destek getirirken, Ultralytics YOLO11 gibi daha sonraki sürümler daha geniş bir görev yelpazesi için doğruluğu ve performansı artırmaya odaklandı.
Ayrıca, Ocak 2024'te yayınlanan YOLO-World, yazılı komutları kullanma yeteneğini tanıttı ve kullanıcıların bulmak istedikleri nesneleri tanımlamalarına olanak sağladı. YOLO-World sıfır örnekli (zero-shot) tespit için harika bir seçenek olsa da, örnek segmentasyonu ve görsel komut desteği gibi özelliklerden yoksundu.
YOLOE, bu yetenekleri ekleyerek YOLO-World üzerine inşa edilir, esnekliği ve performansı artırır ve gerçek dünya bilgisayarlı görü uygulamaları için daha etkili bir araç sunar.

Şekil 2. YOLO-World ve YOLOE her ikisi de sıfır örnekli tespiti destekler.
Link to this sectionYOLOE'yu Ultralytics Python paketi ile kullanma#
İster belirli nesneleri tespit etmek ister bir görüntüdeki her şeyi keşfetmek iste, YOLOE ile başlamak basittir. Bu model, Ultralytics Python paketi tarafından desteklenir ve projelerine entegrasyonu kolaylaştırır. Şimdi, nasıl kullanılacağına adım adım bakalım.
Link to this sectionUltralytics paketini yükleme#
İlk adım, ‘pip’ gibi bir paket yöneticisi kullanarak Ultralytics Python paketini yüklemektir. Bunu terminalinizde veya komut isteminizde “pip install ultralytics” komutunu çalıştırarak yapabilirsin.
Paket yüklendiğinde, modeli yüklemek, tahminler yapmak ve farklı tespit modlarını denemek için ihtiyacın olan her şeye sahip olacaksın. Kurulum sırasında herhangi bir sorunla karşılaşırsan, resmi Ultralytics dokümantasyonu yardımcı bir sorun giderme bölümü sunar.
YOLOE ile tahminleri çalıştırmanın birkaç farklı yolu vardır. Tahminleri çalıştırmak, eğitilmiş modeli kullanarak görüntüler veya videolar içindeki nesneleri tanımlamak ve konumlandırmak anlamına gelir. Bu farklı yöntemler, modelle nasıl etkileşime gireceğini özel ihtiyaçlarına göre özelleştirmeni sağlar.
Şimdi bu yöntemlerin her birini sırayla inceleyelim.
Link to this sectionMetin veya görsel komutlarıyla belirli nesneleri tespit etme#
YOLOE, kısa bir metin açıklamasına dayanarak nesneleri tespit edebilir. Örneğin, hareket halindeki bir at arıyorsan, "yürüyen at" gibi bir komut kullanabilirsin.
Başlamak için önce önceden eğitilmiş YOLOE modelini yükle ve aşağıdaki kod parçacığında gösterildiği gibi komutunu (modelin aramasını istediğin şeyin açıklaması) ayarla.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))Modelin ve komutun ayarlandıktan sonra, modeli bir görüntü veya video üzerinde çalıştırabilirsin. Kod içindeki dosya yolunu kendi görüntü veya video dosyanın yoluyla değiştir:
results = model.predict("path/to/your/image.jpg")
results[0].show()Bu, komutuna göre tespit edilen nesnenin açıkça işaretlendiği görüntüyü gösterecektir. Ne aradığına bağlı olarak "kırmızı bavul", "bisiklet" veya "zebra" gibi farklı nesneleri aramak için komutu değiştirebilirsin.

Şekil 3. YOLOE'yu bir metin komutu kullanarak belirli nesneleri tespit etmek için kullanmaya bir örnek.
Benzer şekilde, Ultralytics Python paketi ile YOLOE'yu komutlandırmak için bir görsel kullanabilirsin. Görsel komut modunda model, başka bir sahnede benzer görünen öğeleri bulmak için görüntüyü kullanır. Bu, özellikle tanımlanması zor olan veya net etiketleri olmayan nesneler için kullanışlıdır.
Bununla ilgili kodu daha detaylı incelemek için Ultralytics dokümantasyonuna göz atabilirsin.
Link to this sectionYOLOE kullanarak genel nesne tespiti#
Bazı durumlarda tam olarak ne arayacağını bilemeyebilirsin veya belirli bir nesneyi aramıyor olabilirsin. İşte komutsuz mod (prompt-free mode) burada devreye girer.
Bu seçenekle bir açıklama yazmana veya örnek bir görsel sağlamana gerek yoktur. YOLOE, görüntüleri kendi başına analiz eder ve insanlar, hayvanlar, mobilyalar veya günlük nesneler gibi tanıyabildiği her şeyi tespit eder.
Modele herhangi bir özel talimat vermeden bir sahneyi keşfetmenin yararlı bir yoludur. İster kalabalık bir odayı tarıyor ol ister çok fazla hareketin olduğu görüntüleri inceliyor ol, komutsuz mod sana görüntüde nelerin olduğu konusunda hızlı bir bakış sunar.
YOLOE'yu komutsuz modda çalıştırmak için aşağıdaki kodu kullanabilirsin. İlk önce model yüklenir, ardından görüntüyü işler ve içindeki nesneleri otomatik olarak tespit eder. Son olarak, sonuçlar görüntülenir ve tespit edilen nesneler vurgulanır.
Dosya yolunu görüntünün gerçek yoluyla değiştirdiğinden emin ol.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()Aşağıda gösterilen görüntü, YOLOE'nun komutsuz modda neleri tespit edebileceğine dair bir örnektir.

Şekil 4. YOLOE'yu komutsuz modda kullanma.
Link to this sectionYOLOE'nun gerçek zamanlı uygulamaları#
YOLOE'nun hem metin hem de görsel komutlarına yanıt verme yeteneği, onu gerçek zamanlı uygulamalar için güvenilir bir araç haline getirir. Esnekliği, zamanlama ve doğruluğun kritik olduğu hızlı ortamlarda özellikle faydalıdır.
YOLOE'nun nasıl kullanılabileceğine dair bazı gerçek dünya örneklerini keşfedelim.
Link to this sectionBagaj taşımanın iyileştirilmesi: Gerçek zamanlı bagaj tespiti#
Yoğun havaalanlarında, özellikle kayıp çantalarla uğraşırken belirli bagajları bulmak zor olabilir. YOLOE, canlı videoları taramaya yardımcı olarak ve “kırmızı çanta” gibi basit komutlarla öğeleri hızlıca tanımlayarak bu süreci kolaylaştırabilir.
Bir çanta kayıpsa veya yanlış yere konulmuşsa, personel komutu “siyah bavul” gibi farklı bir öğeyi arayacak şekilde kolayca değiştirebilir. Bu anında uyum sağlama yeteneği, havaalanı personelinin saatlerce süren görüntüleri incelemeden veya modeli yeniden eğitmeden doğru bagajı hızlıca bulmasına yardımcı olabilir; böylece bagaj taşıma ve kayıp bagaj sorunlarının çözümü çok daha hızlı ve verimli hale gelir.
Link to this sectionHalka açık alanları YOLOE ile izleme#
Kalabalık pazarlar ve kafeler gibi halka açık alanların güvenlik görüntüleri, gün boyunca değişen insan, nesne ve aktivite karışımını sıklıkla içerir. YOLOE, bu görüntüleri gerçek zamanlı olarak komutsuz modda analiz ederek, özel talimatlara ihtiyaç duymadan çantalar, masalar veya bisikletler gibi öğeleri otomatik olarak tespit edebilir.

Şekil 5. YOLOE, yoğun bir kamusal alanda çeşitli nesneleri tespit edebilir.
Bu, güvenlik ekiplerinin sahipsiz öğeleri fark etmesi veya kalabalık hareketini takip etmesi için özellikle kullanışlıdır. YOLOE'nun aynı anda birden fazla nesneyi tespit etme yeteneği, etkinlikler veya yoğun dönemlerde halka açık alanları yönetmeyi kolaylaştırarak ekiplerin bilgili ve duyarlı kalmalarına yardımcı olur.
Link to this sectionYOLOE'nun avantajları ve dezavantajları#
Bilgisayarlı görü uygulamaları için YOLOE kullanmanın temel faydalarından bazıları şunlardır:
- Gerçek zamanlı performans: YOLOE hızlı ve verimli işleme için optimize edilmiştir; bu da canlı video akışları veya yoğun kamusal alanlar gibi dinamik ortamlarda bile gerçek zamanlı tespite olanak tanır.
- Ölçeklenebilirlik: YOLOE ölçeklenebilirdir ve güvenlik ve gözetimden perakende, sağlık ve otonom araçlara kadar çok çeşitli uygulamalar için iyi çalışır.
- Kullanımı kolay: YOLOE, Ultralytics Python paketi tarafından desteklendiğinden mevcut bilgisayarlı görü projelerine entegrasyonu kolaydır.
Ancak, YOLOE'yu kullanırken akılda tutulması gereken birkaç sınırlama vardır. İşte dikkate alman gereken birkaç faktör:
- Yeterli eğitim verisi gerektirir: YOLOE sıfır örnekli tespiti desteklese de, görülmemiş nesneler üzerindeki performansı eğitim verilerinden ne kadar iyi genelleme yaptığına bağlıdır. Bazı durumlarda, oldukça özelleşmiş görevlerde iyi performans göstermesi için ek verilere veya ince ayarlara (fine-tuning) ihtiyaç duyabilir.
- Girdi kalitesine duyarlı: Modelin doğruluğu düşük kaliteli görüntülerden veya videolardan etkilenebilir. Bulanık veya kötü aydınlatılmış girdiler, modelin nesneleri doğru bir şekilde tespit etme yeteneğini azaltabilir, bu nedenle optimal performans için yüksek kaliteli girdi önemlidir.
Link to this sectionÖne çıkanlar#
YOLOE, kullanıcıların tespiti metin veya görsel komutlarıyla yönlendirmesine izin vererek bilgisayarlı görüye daha fazla esneklik getirir. Sahnelerin hızla değiştiği ve yeniden eğitmenin bir seçenek olmadığı gerçek dünya durumlarında iyi çalışır.
Bagaj taşımadan kamusal alan izlemeye kadar YOLOE, yeni görevlere kolaylıkla uyum sağlar. Yapay zeka daha erişilebilir hale geldikçe, YOLOE gibi modeller daha fazla sektörün görüntü teknolojisini pratik ve verimli yollarla kullanmasına yardımcı oluyor.
Topluluğumuza katıl ve yapay zeka yenilikleri hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfet. Perakendede yapay zeka ve sağlıkta bilgisayarlı görü gibi alanlardaki en son gelişmeleri çözüm sayfalarımızda keşfet. Lisanslama seçeneklerimize göz at ve bilgisayarlı görü ile bugün çalışmaya başla!






