YOLOE'nin basit bir istem veya fotoğraf kullanarak nesneleri nasıl bulmanızı sağladığını öğrenin. Modelleri yeniden eğitmeden veya ince ayar yapmadan daha akıllı, daha hızlı bilgisayarlı görü sağlar.
YOLOE'nin basit bir istem veya fotoğraf kullanarak nesneleri nasıl bulmanızı sağladığını öğrenin. Modelleri yeniden eğitmeden veya ince ayar yapmadan daha akıllı, daha hızlı bilgisayarlı görü sağlar.
Nesne tespiti, görüntü veya videolardaki nesneleri tanımlamayı ve konumlandırmayı amaçlayan önemli bir bilgisayarlı görü görevidir. Makinelerin görsel verileri anlamasını ve yorumlamasını sağlayan bir yapay zeka (AI) alanı olan bilgisayarlı görünün önemli bir parçasıdır. Örneğin, nesne tespiti bir resimdeki bir arabayı tanımlamaya veya bir video akışında bir kişiyi tespit etmeye yardımcı olabilir.
Nesne algılama gibi bilgisayarla görme görevlerini destekleyen en iyi bilinen model serilerinden biri YOLO (You Only Look Once) model serisidir. Hız ve doğruluk için tasarlanan YOLO modelleri zaman içinde sürekli olarak geliştirilmiştir. Örneğin, en son sürümlerden biri, Ultralytics YOLO11gerçek dünya koşullarında iyi performans gösterir ve daha karmaşık ortamlarda bile doğru sonuçlar sağlar.
Bu ilerlemeyi daha da ileri götüren YOLOE adlı yeni bir model, YOLO modellerinin yeteneklerini genişletmeyi amaçlıyor. Yeni nesneleri tanımak için yeniden eğitim gerektiren geleneksel modellerin aksine, YOLOE daha önce görmediği nesneleri detect etmek için basit metin veya görüntü istemlerini takip edebilir ve bu da onu değişen ortamlara çok daha uyarlanabilir hale getirir.
Bu makalede, YOLOE'yi benzersiz kılan özelliklere, önceki YOLO modelleriyle karşılaştırmasına ve bugün kullanmaya nasıl başlayabileceğinize daha yakından bakacağız. Hadi başlayalım!
YOLOE, nesne tespitini bir adım öteye taşıyan bir bilgisayarlı görü modelidir. Mart 2025'te Tsinghua Üniversitesi'ndeki araştırmacılar tarafından tanıtıldı. YOLOE'yi geleneksel modellerden ayıran şey, açık kelime dağarcığı tespitini kullanmasıdır.
Çoğu model sabit bir nesne listesini tanımak için eğitilmiş olsa da, YOLOE kısa bir açıklama veya örnek bir resim kullanarak ne aranacağını belirtmenize olanak tanır. Örneğin, “yeşil bir sırt çantası” arıyorsanız, bu açıklamayı yazabilir veya modele bir fotoğraf gösterebilirsiniz ve YOLOE bunu sahne içinde bulacaktır.
Ayrıca, herhangi bir uyarı olmadan bile YOLOE birçok günlük nesneyi kendi başına detect edebilir. Daha önce hiç görmediği nesneleri tanıma yeteneğine sıfır çekim algılama denir. Özellikle görevin veya ilgilenilen nesnelerin beklenmedik şekilde değişebileceği dinamik ortamlarda kullanışlıdır.

YOLOE, gerçek dünya uygulamalarındaki performansını artırmak için tasarlanmış çok çeşitli özellikleri destekler. Hem yapılandırılmış hem de yapılandırılmamış girdiyi işleme yeteneği ile YOLOE, nesne algılama ve segmentasyon için yeni olanaklar sunar.
İşte modelin sunduğu temel özelliklerden bazıları:
Artık YOLOE'nin ne olduğunu daha iyi anladığımıza göre, YOLO ailesindeki benzer modellerden bazılarına bir göz atalım.
Bilgisayarla görme geliştikçe YOLO modelleri de gelişmiştir. Mesela, Ultralytics YOLOv8 segmentasyon ve sınıflandırma gibi yeni görevler için destek getirirken, Ultralytics YOLO11 gibi sonraki sürümler daha geniş bir görev yelpazesi için doğruluk ve performansı artırmaya odaklanmıştır.
Ayrıca, YOLO Ocak 2024'te piyasaya sürüldü ve kullanıcıların bulmak istedikleri nesneleri tanımlamalarına izin veren yazılı istemleri kullanma yeteneğini tanıttı. YOLO sıfır atış tespiti için harika bir seçenek olsa da, örnek segmentasyonu ve görsel istem desteği gibi özelliklerden yoksundu.
YOLOE, bu yetenekleri ekleyerek, esnekliği ve performansı artırarak ve gerçek dünya bilgisayarla görme uygulamaları için daha etkili bir araç sunarak YOLO'ü temel alır.

İster belirli nesneleri detect etmek ister bir görüntüdeki her şeyi keşfetmek isteyin, YOLOE ile başlamak kolaydır. Bu model Ultralytics Python paketi tarafından desteklenir ve projelerinize entegre edilmesini kolaylaştırır. Şimdi, nasıl kullanılacağını inceleyelim.
İlk adım, 'pip' gibi bir paket yöneticisi kullanarak Ultralytics Python paketini yüklemektir. Bunu terminalinizde veya komut isteminde "pip install ultralytics" komutunu çalıştırarak yapabilirsiniz.
Paket yüklendikten sonra, modeli yüklemek, tahminler yapmak ve farklı algılama modlarını denemek için ihtiyacınız olan her şeye sahip olacaksınız. Yükleme sırasında herhangi bir sorunla karşılaşırsanız, resmi Ultralytics belgeleri yararlı bir sorun giderme bölümü sunar.
YOLOE'yi tahminleri çalıştırmak için kullanmanın birkaç farklı yolu vardır. Tahminleri çalıştırmak, eğitilmiş modeli görüntüler veya videolar içindeki nesneleri tanımlamak ve konumlandırmak için kullanmak anlamına gelir. Bu farklı yöntemler, modelle nasıl etkileşim kurduğunuzu özel ihtiyaçlarınıza göre özelleştirmenize olanak tanır.
Şimdi bu yöntemlerin her birini teker teker ele alalım.
YOLOE nesneleri kısa bir metin açıklamasına göre detect . Örneğin, hareket halindeki bir atı arıyorsanız, "yürüyen at" gibi bir komut istemi kullanabilirsiniz.
Başlamak için, öncelikle önceden eğitilmiş YOLOE modelini yükleyin ve isteminizi (modelin aramasını istediğiniz şeyin açıklaması) aşağıdaki kod parçasında gösterildiği gibi ayarlayın.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))Modeliniz ve isteminiz ayarlandıktan sonra, modeli bir resim veya video üzerinde çalıştırabilirsiniz. Koddaki dosya yolunu, resminizin veya video dosyanızın yoluyla değiştirin:
results = model.predict("path/to/your/image.jpg")
results[0].show()Bu, isteminize göre algılanan nesnenin açıkça işaretlendiği görüntüyü gösterecektir. Aradığınız şeye bağlı olarak, "kırmızı bavul", "bisiklet" veya "zebra" gibi farklı nesneleri aramak için istemi değiştirebilirsiniz.

Benzer şekilde, Ultralytics Python paketi ile YOLOE'yi sorgulamak için bir görüntü kullanabilirsiniz. Görsel komut modunda model, başka bir sahnedeki benzer görünümlü öğeleri bulmak için görüntüyü kullanır. Bu, özellikle tanımlanması zor olan veya net etiketleri olmayan nesneler için kullanışlıdır.
Bunun kodunu daha ayrıntılı olarak keşfetmek için Ultralytics belgelerine göz atabilirsiniz.
Bazı durumlarda, tam olarak ne aradığınızı bilemeyebilirsiniz veya belirli bir nesne aramıyor olabilirsiniz. İşte bu noktada istem içermeyen mod devreye girer.
Bu seçenekle, bir açıklama yazmanıza veya örnek bir resim sağlamanıza gerek yoktur. YOLOE, görüntüleri kendi başına analiz eder ve insanlar, hayvanlar, mobilyalar veya günlük nesneler gibi tanıyabildiği her şeyi tespit eder.
Modele herhangi bir özel talimat vermeden bir sahneyi keşfetmek için yararlı bir yoldur. İster kalabalık bir odayı tarıyor ister çok sayıda aktivite içeren görüntüleri inceliyor olun, istem içermeyen mod, bir görüntüde neyin mevcut olduğuna hızlı bir bakış sağlar.
YOLOE'yi istem içermeyen modda çalıştırmak için aşağıdaki kodu kullanabilirsiniz. Öncelikle model yüklenir, ardından görüntüyü işler ve içindeki nesneleri otomatik olarak algılar. Son olarak, sonuçlar görüntülenir ve algılanan nesneler vurgulanır.
Dosya yolunu, resminizin gerçek yoluyla değiştirdiğinizden emin olun.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()Aşağıda gösterilen görüntü, YOLOE'nin istemsiz modda detect edebileceklerine bir örnektir.

YOLOE'nin hem metin hem de görüntü istemlerine yanıt verebilme özelliği, onu gerçek zamanlı uygulamalar için güvenilir bir araç haline getirir. Esnekliği, özellikle zamanlama ve doğruluğun önemli olduğu hızlı tempolu ortamlarda kullanışlıdır.
YOLOE'nin nasıl kullanılabileceğine dair bazı gerçek dünya örneklerini inceleyelim.
Yoğun havaalanlarında, özellikle kayıp çantalarla uğraşırken, belirli bir bagajı bulmak zor olabilir. YOLOE, canlı videoları tarayarak ve "kırmızı çanta" gibi basit istemlere göre öğeleri hızlı bir şekilde tanımlayarak bu süreci kolaylaştırabilir.
Bir çanta kaybolursa veya yanlış yere konulursa, personel istemi kolayca değiştirerek "siyah bavul" gibi farklı bir öğe arayabilir. Bu anında uyum sağlama yeteneği, havaalanı personelinin uzun saatler süren görüntüleri incelemeden veya modeli yeniden eğitmeden doğru bagajı hızlı bir şekilde bulmasına yardımcı olabilir, bu da bagaj işlemlerini ve kayıp bagaj sorunlarının çözümünü çok daha hızlı ve verimli hale getirir.
Kalabalık pazarlar ve kafeler gibi halka açık alanların gözetim görüntüleri genellikle gün boyunca değişen insanları, nesneleri ve etkinlikleri içerir. YOLOE, bu görüntüleri istem gerektirmeyen modu kullanarak gerçek zamanlı olarak analiz edebilir ve belirli talimatlara ihtiyaç duymadan çantalar, masalar veya bisikletler gibi öğeleri otomatik olarak algılayabilir.

Bu özellikle güvenlik ekiplerinin gözetimsiz eşyaları tespit etmesi veya kalabalık hareketlerini track için kullanışlıdır. YOLOE'nin aynı anda birden fazla nesneyi detect etme yeteneği, etkinlikler veya yoğun dönemlerde kamusal alanların yönetimini kolaylaştırarak ekiplerin bilgi sahibi ve duyarlı kalmasına yardımcı olur.
İşte bilgisayarlı görü uygulamaları için YOLOE kullanmanın temel faydalarından bazıları:
Ancak, YOLOE'yi kullanırken akılda tutulması gereken birkaç sınırlama vardır. İşte dikkate alınması gereken birkaç faktör:
YOLOE, kullanıcıların algılamayı metin veya görüntü istemleriyle yönlendirmesine olanak tanıyarak bilgisayarlı görüye daha fazla esneklik getirir. Sahnelerin hızla değiştiği ve yeniden eğitimin bir seçenek olmadığı gerçek dünya durumlarında iyi çalışır.
Bagaj taşımadan kamusal alan izlemeye kadar YOLOE, yeni görevlere kolaylıkla uyum sağlar. YZ daha erişilebilir hale geldikçe, YOLOE gibi modeller daha fazla sektörün görüntü teknolojisini pratik ve verimli bir şekilde kullanmasına yardımcı oluyor.
Yapay zeka yenilikleri hakkında daha fazla bilgi edinmek için topluluğumuza katılın ve GitHub depomuza göz atın. Çözüm sayfalarımızda perakende sektöründe yapay zeka ve sağlık hizmetlerinde bilgisayarlı görü gibi alanlardaki en son gelişmeleri keşfedin. Lisanslama seçeneklerimize göz atın ve bilgisayarlı görüye bugün başlayın!