YOLOE'nin basit bir komut veya fotoğraf kullanarak nesneleri bulmanızı nasıl sağladığını öğrenin. Modelleri yeniden eğitmeden veya ince ayar yapmadan daha akıllı, daha hızlı bilgisayarla görmeyi mümkün kılar.
Nesne algılama, görüntülerdeki veya videolardaki nesneleri tanımlamayı ve konumlandırmayı amaçlayan önemli bir bilgisayarla görme görevidir. Makinelerin görsel verileri anlamasını ve yorumlamasını sağlayan bir yapay zeka (AI) alanı olan bilgisayarla görmenin çok önemli bir parçasıdır. Örneğin, nesne algılama, bir resimdeki arabayı tanımlamaya veya bir video akışındaki bir kişiyi tespit etmeye yardımcı olabilir.
Nesne algılama gibi bilgisayarla görme görevlerini destekleyen en iyi bilinen model serilerinden biri YOLO (You Only Look Once) model serisidir. Hız ve doğruluk için tasarlanan YOLO modelleri zaman içinde sürekli olarak geliştirilmiştir. Örneğin, en son sürümlerden biri, Ultralytics YOLO11gerçek dünya koşullarında iyi performans gösterir ve daha karmaşık ortamlarda bile doğru sonuçlar sağlar.
Bu ilerlemeyi daha da ileri götüren YOLOE adlı yeni bir model, YOLO modellerinin yeteneklerini genişletmeyi amaçlıyor. Yeni nesneleri tanımak için yeniden eğitim gerektiren geleneksel modellerin aksine, YOLOE daha önce görmediği nesneleri tespit etmek için basit metin veya görüntü istemlerini takip edebilir ve bu da onu değişen ortamlara çok daha uyarlanabilir hale getirir.
Bu makalede, YOLOE'yi benzersiz kılan özelliklere, önceki YOLO modelleriyle karşılaştırmasına ve bugün kullanmaya nasıl başlayabileceğinize daha yakından bakacağız. Hadi başlayalım!
YOLOE, nesne algılamayı bir adım öteye taşıyan bir bilgisayarla görme modelidir. Mart 2025'te Tsinghua Üniversitesi'ndeki araştırmacılar tarafından tanıtılmıştır. YOLOE'yi geleneksel modellerden ayıran şey, açık kelime tespitini kullanmasıdır.
Çoğu model sabit bir nesne listesini tanımak üzere eğitilirken, YOLOE kısa bir açıklama veya örnek bir görüntü kullanarak neyi arayacağınızı belirtmenize olanak tanır. Örneğin, "yeşil bir sırt çantası" arıyorsanız, bu açıklamayı yazabilir veya modele bir fotoğraf gösterebilirsiniz ve YOLOE sahnenin içinde onu bulacaktır.
Ayrıca, herhangi bir uyarı olmadan bile YOLOE birçok günlük nesneyi kendi başına tespit edebilir. Daha önce hiç görmediği nesneleri tanıma yeteneğine sıfır çekim algılama denir. Özellikle görevin veya ilgilenilen nesnelerin beklenmedik şekilde değişebileceği dinamik ortamlarda kullanışlıdır.
YOLOE, gerçek dünya uygulamalarındaki performansını artırmak için tasarlanmış çok çeşitli özellikleri destekler. Hem yapılandırılmış hem de yapılandırılmamış girdiyi işleme yeteneği ile YOLOE, nesne algılama ve segmentasyon için yeni olanaklar sunar.
İşte modelin masaya getirdiği bazı temel özellikler:
Artık YOLOE'nin ne olduğunu daha iyi anladığımıza göre, YOLO ailesindeki benzer modellerden bazılarına bir göz atalım.
Bilgisayarla görme geliştikçe YOLO modelleri de gelişmiştir. Mesela, Ultralytics YOLOv8 segmentasyon ve sınıflandırma gibi yeni görevler için destek getirirken, Ultralytics YOLO11 gibi sonraki sürümler daha geniş bir görev yelpazesi için doğruluk ve performansı artırmaya odaklanmıştır.
Ayrıca, YOLO Ocak 2024'te piyasaya sürüldü ve kullanıcıların bulmak istedikleri nesneleri tanımlamalarına izin veren yazılı istemleri kullanma yeteneğini tanıttı. YOLO sıfır atış tespiti için harika bir seçenek olsa da, örnek segmentasyonu ve görsel istem desteği gibi özelliklerden yoksundu.
YOLOE, bu yetenekleri ekleyerek, esnekliği ve performansı artırarak ve gerçek dünya bilgisayarla görme uygulamaları için daha etkili bir araç sunarak YOLO'ü temel alır.
İster belirli nesneleri tespit etmek ister bir görüntüdeki her şeyi keşfetmek isteyin, YOLOE ile başlamak kolaydır. Bu model Ultralytics Python paketi tarafından desteklenir ve projelerinize entegre edilmesini kolaylaştırır. Şimdi, nasıl kullanılacağını inceleyelim.
İlk adım, 'pip' gibi bir paket yöneticisi kullanarak Ultralytics Python paketini yüklemektir. Bunu terminalinizde veya komut isteminde "pip install ultralytics" komutunu çalıştırarak yapabilirsiniz.
Paket yüklendikten sonra, modeli yüklemek, tahminler yapmak ve farklı algılama modlarını denemek için ihtiyacınız olan her şeye sahip olacaksınız. Yükleme sırasında herhangi bir sorunla karşılaşırsanız, resmi Ultralytics belgeleri yararlı bir sorun giderme bölümü sunar.
Tahminleri çalıştırmak için YOLOE'yi kullanmanın birkaç farklı yolu vardır. Tahminleri çalıştırmak, görüntü veya videolardaki nesneleri tanımlamak ve bulmak için eğitilmiş modeli kullanmak anlamına gelir. Bu farklı yöntemler, özel ihtiyaçlarınıza göre modelle nasıl etkileşim kuracağınızı özelleştirmenize olanak tanır.
Şimdi bu yöntemlerin her birini teker teker ele alalım.
YOLOE nesneleri kısa bir metin açıklamasına göre algılayabilir. Örneğin, hareket halindeki bir atı arıyorsanız, "yürüyen at" gibi bir komut istemi kullanabilirsiniz.
Başlamak için, öncelikle önceden eğitilmiş YOLOE modelini yükleyin ve aşağıdaki kod parçasında gösterildiği gibi isteminizi (modelin neyi aramasını istediğinize ilişkin açıklama) ayarlayın.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))
Modeliniz ve isteminiz ayarlandıktan sonra, modeli bir resim veya video üzerinde çalıştırabilirsiniz. Koddaki dosya yolunu resim veya video dosyanızın yolu ile değiştirin:
results = model.predict("path/to/your/image.jpg")
results[0].show()
Bu, isteminize göre algılanan nesnenin açıkça işaretlendiği görüntüyü gösterecektir. Ne aradığınıza bağlı olarak "kırmızı bavul", "bisiklet" veya "zebra" gibi farklı nesneleri aramak için komut istemini değiştirebilirsiniz.
Benzer şekilde, Ultralytics Python paketi ile YOLOE'yi sorgulamak için bir görüntü kullanabilirsiniz. Görsel komut modunda, model başka bir sahnedeki benzer görünümlü öğeleri bulmak için görüntüyü kullanır. Bu, özellikle tanımlanması zor olan veya net etiketleri olmayan nesneler için kullanışlıdır.
Bunun kodunu daha ayrıntılı olarak keşfetmek için Ultralytics belgelerine göz atabilirsiniz.
Bazı durumlarda, tam olarak ne arayacağınızı bilemeyebilirsiniz veya belirli bir nesneyi aramıyor olabilirsiniz. İşte bu noktada komut istemsiz mod kullanışlı hale gelir.
Bu seçenekle, bir açıklama yazmanıza veya örnek bir görüntü sağlamanıza gerek yoktur. YOLOE görüntüleri kendi başına analiz eder ve insanlar, hayvanlar, mobilyalar veya günlük nesneler gibi tanıyabildiği her şeyi algılar.
Modele herhangi bir özel talimat vermeden bir sahneyi keşfetmenin yararlı bir yoludur. İster kalabalık bir odayı tarıyor olun, ister çok sayıda etkinlik içeren görüntüleri inceliyor olun, istemsiz mod size bir görüntüde nelerin mevcut olduğuna hızlı bir bakış sağlar.
YOLOE'yi komut istemsiz modda çalıştırmak için aşağıdaki kodu kullanabilirsiniz. Önce model yüklenir, ardından görüntüyü işler ve içindeki nesneleri otomatik olarak algılar. Son olarak, sonuçlar görüntülenir ve algılanan nesneler vurgulanır.
Dosya yolunu resminizin gerçek yolu ile değiştirdiğinizden emin olun.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()
Aşağıda gösterilen görüntü, YOLOE'nin istemsiz modda tespit edebileceklerine bir örnektir.
YOLOE'nin hem metin hem de görüntü istemlerine yanıt verme yeteneği, onu gerçek zamanlı uygulamalar için güvenilir bir araç haline getirir. Esnekliği, özellikle zamanlama ve doğruluğun önemli olduğu hızlı tempolu ortamlarda kullanışlıdır.
YOLOE'nin nasıl kullanılabileceğine dair bazı gerçek dünya örneklerini inceleyelim.
Yoğun havaalanlarında, özellikle kayıp çantalarla uğraşırken belirli bagajların yerini tespit etmek zor olabilir. YOLOE, canlı videoların taranmasına yardımcı olarak ve "kırmızı çanta" gibi basit istemlere dayalı olarak öğeleri hızlı bir şekilde tanımlayarak bu süreci kolaylaştırabilir.
Bir çanta kayıpsa veya yanlış yerleştirilmişse, personel "siyah bavul" gibi farklı bir öğeyi aramak için istemi kolayca değiştirebilir. Bu anında uyum sağlama yeteneği, havaalanı personelinin uzun saatler süren görüntüleri incelemeden veya modeli yeniden eğitmeden doğru bagajı hızlı bir şekilde bulmasına yardımcı olarak bagaj işlemlerini ve kayıp bagaj sorunlarının çözümünü çok daha hızlı ve verimli hale getirebilir.
Kalabalık pazarlar ve kafeler gibi kamusal alanların gözetim görüntüleri genellikle gün boyunca değişen insan, nesne ve faaliyetlerin bir karışımını içerir. YOLOE, istemsiz modu kullanarak bu görüntüleri gerçek zamanlı olarak analiz edebilir ve özel talimatlara ihtiyaç duymadan çanta, masa veya bisiklet gibi öğeleri otomatik olarak algılayabilir.
Bu özellikle güvenlik ekiplerinin gözetimsiz eşyaları tespit etmesi veya kalabalık hareketlerini izlemesi için kullanışlıdır. YOLOE'nin aynı anda birden fazla nesneyi tespit etme yeteneği, etkinlikler veya yoğun dönemlerde kamusal alanların yönetimini kolaylaştırarak ekiplerin bilgi sahibi ve duyarlı kalmasına yardımcı olur.
Bilgisayarla görme uygulamaları için YOLOE kullanmanın bazı temel faydaları şunlardır:
Bununla birlikte, YOLOE kullanırken akılda tutulması gereken birkaç sınırlama vardır. İşte dikkate alınması gereken birkaç faktör:
YOLOE, kullanıcıların metin veya görüntü istemleriyle algılamayı yönlendirmesine olanak tanıyarak bilgisayarla görmeye daha fazla esneklik getirir. Sahnelerin hızla değiştiği ve yeniden eğitimin bir seçenek olmadığı gerçek dünya koşullarında iyi çalışır.
YOLOE, bagaj taşımadan kamusal alan takibine kadar yeni görevlere kolaylıkla uyum sağlıyor. Yapay zeka daha erişilebilir hale geldikçe, YOLOE gibi modeller daha fazla sektörün görüş teknolojisini pratik ve verimli yollarla kullanmasına yardımcı oluyor.
Topluluğumuza katılın ve yapay zeka yenilikleri hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfedin. Çözüm sayfalarımızda perakendede yapay zeka ve sağlık hizmetlerinde bilgisayarla görme gibi alanlardaki en son gelişmeleri keşfedin. Lisanslama seçeneklerimize göz atın ve bilgisayarla görmeye bugün başlayın!
Makine öğreniminin geleceği ile yolculuğunuza başlayın