Nesne algılama için Ultralytics YOLO11 nasıl kullanılır?

Abirami Vina

3 dakika okuma

29 Kasım 2024

Yeni Ultralytics YOLO11 modelinin, çeşitli endüstrilerdeki çeşitli uygulamalarda daha yüksek hassasiyet elde etmek için nesne algılamada nasıl kullanılabileceğini keşfedin.

Bilgisayarla görme, makinelerin görsel bilgileri yorumlamasına ve anlamasına yardımcı olarak nesne algılama gibi temel görevleri yerine getirmesini sağlayan bir yapay zeka (AI) alanıdır. Görüntü sınıflandırmanın aksine, nesne algılama yalnızca bir görüntüde hangi nesnelerin olduğunu tanımlamakla kalmaz, aynı zamanda tam konumlarını da belirler. Bu da onu sürücüsüz arabalar, gerçek zamanlı güvenlik sistemleri ve depo otomasyonu gibi vizyon yapay zeka uygulamaları için kritik bir araç haline getirir.

Zaman içinde nesne algılama teknolojisi daha gelişmiş ve kullanımı daha kolay hale geldi. Ultralytics'in yıllık hibrit etkinliği YOLO Vision 2024'te (YV24) Ultralytics YOLO11 modelinin piyasaya sürülmesiyle ileriye doğru büyük bir adım atıldığı duyuruldu. YOLO11, YOLOv8 ile aynı görevleri desteklerken doğruluğu ve performansı artırarak önceki modellerin kullanıcılarının sorunsuz bir şekilde geçiş yapmasını kolaylaştırıyor.

Şekil 1. Nesne algılama için Ultralytics YOLO11 modelinin kullanımına bir örnek.

Bu makalede, nesne algılamanın ne olduğunu, diğer bilgisayarla görme görevlerinden nasıl farklı olduğunu ve gerçek dünyadaki uygulamalarını inceleyeceğiz. Ayrıca YOLO11 modelini Ultralytics Python paketi ve Ultralytics HUB platformu ile nasıl kullanacağınız konusunda size yol göstereceğiz. Haydi başlayalım!

Nesne algılama nedir?

Nesne alg ılama, bilgisayarla görmede bir görüntüdeki nesneleri tanımlamaktan daha fazlasını yapan temel bir görevdir. Yalnızca belirli bir nesnenin mevcut olup olmadığını belirleyen görüntü sınıflandırmanın aksine, nesne algılama birden fazla nesneyi tanır ve sınırlayıcı kutular kullanarak tam konumlarını belirler. 

Örneğin, bir grup fotoğrafındaki yüzleri, işlek bir caddedeki arabaları veya bir mağaza rafındaki ürünleri tanımlayabilir ve yerini belirleyebilir. Nesne tanıma ve lokalizasyonu bir araya getirmesi onu özellikle gözetim, kalabalık izleme ve otomatik envanter yönetimi gibi uygulamalar için kullanışlı hale getiriyor.

Şekil 2. Yüzleri tespit etmek için YOLO11 kullanımı.

Nesne algılamayı semantik veya örnek segmentasyonu gibi diğer görevlerden ayıran şey, odak noktası ve verimliliğidir. 

Anlamsal segmentasyon bir görüntüdeki her pikseli etiketler ancak aynı türdeki nesneler arasında ayrım yapmaz (örneğin, bir fotoğraftaki tüm yüzler "yüz" olarak gruplandırılır). Örnek segmentasyonu, her nesneyi ayırarak ve aynı sınıftaki nesneler için bile tam şeklini ana hatlarıyla belirleyerek bunu daha da ileri götürür. 

Ancak nesne algılama, nesneleri tanımlayıp sınıflandırırken konumlarını da işaretleyerek daha akıcı bir yaklaşım sunar. Bu da onu güvenlik görüntülerindeki yüzleri tespit etmek veya otonom araçlar için engelleri belirlemek gibi gerçek zamanlı görevler için ideal hale getirir.

YOLO11 ve nesne algılama uygulamaları

YOLO11'in gelişmiş nesne algılama özellikleri, onu birçok sektörde kullanışlı kılıyor. Bazı örneklere bir göz atalım.

Perakende analitiği için YOLO11'i kullanma

YOLO11 ve nesne algılama, envanter yönetimi ve raf izlemeyi daha verimli ve doğru hale getirerek perakende analitiğini yeniden tanımlıyor. Modelin nesneleri hızlı ve güvenilir bir şekilde tespit etme yeteneği, perakendecilerin stok seviyelerini takip etmelerine, rafları düzenlemelerine ve envanter sayımlarındaki hataları azaltmalarına yardımcı oluyor.

Örneğin, YOLO11 bir mağaza rafındaki güneş gözlüğü gibi belirli ürünleri tespit edebilir. Peki bir perakendeci neden bir rafı izlemek ister? Rafları stoklu ve düzenli tutmak, müşterilerin ihtiyaç duyduklarını bulabilmelerini sağlamak için hayati önem taşır ve bu da satışları doğrudan etkiler. Perakendeciler rafları gerçek zamanlı olarak izleyerek, ürünlerin azaldığını, yanlış yerleştirildiğini veya aşırı kalabalık olduğunu hızla tespit edebilir ve alışveriş deneyimini geliştiren düzenli ve çekici bir teşhir sağlamalarına yardımcı olabilir.

Şekil 3. Raflardaki ürünleri tespit etmek için YOLO11 kullanımına bir örnek.

Akıllı şehir uygulamalarında YOLO11

Hareketli bir şehir, verimli bir şekilde çalışmak için düzgün trafik akışına ve güvenli sokaklara ihtiyaç duyar ve YOLO11 bunu mümkün kılmaya yardımcı olabilir. Aslında, birçok akıllı şehir uygulaması YOLO11 ile entegre edilebilir. 

İlginç bir durum, hareket halindeki araçların plakalarını tanımlamak için nesne algılamayı kullanmayı içerir. Bu sayede YOLO11 daha hızlı geçiş ücreti toplama, daha iyi trafik yönetimi ve daha hızlı düzenleme uygulamasını destekleyebilir. 

Şekil 4. Plakaları tespit etmek için nesne algılama ve YOLO11 kullanımı.

Yolları izleyen Vision AI sistemlerinden elde edilen bilgiler, daha büyük sorunlara dönüşmeden önce yetkilileri trafik ihlalleri veya tıkanıklık konusunda uyarabilir. YOLO11 yayaları ve bisikletlileri de tespit ederek sokakları herkes için daha güvenli ve verimli hale getirebilir. 

Aslında, YOLO11'in görsel verileri işleme yeteneği, onu şehir altyapısını iyileştirmek için güçlü bir araç haline getiriyor. Örneğin, araç ve yaya hareketlerini analiz ederek trafik ışığı zamanlamasını optimize etmeye yardımcı olabilir. Ayrıca çocukları tespit ederek ve sürücüleri yavaşlamaları için uyararak okul bölgelerindeki güvenliği artırabilir. YOLO11 ile şehirler, zorlukları ele almak ve herkes için daha verimli bir ortam yaratmak için proaktif önlemler alabilir.

YOLO11 ile gerçek zamanlı video algılama: Erişilebilirliği artırma

Gerçek zamanlı nesne algılama, bir sistemin canlı bir video akışındaki nesneleri göründükleri anda tanımlama ve sınıflandırma yeteneğini ifade eder. YOLO11 üstün gerçek zamanlı performans için tasarlanmıştır ve bu özelliği destekleme konusunda mükemmeldir. Uygulamaları sadece süreçleri kolaylaştırmanın ötesine geçerek daha kapsayıcı ve erişilebilir bir dünya yaratmaya da yardımcı olabilir.

Örneğin, YOLO11 nesneleri gerçek zamanlı olarak tanımlayarak görme engelli bireylere yardımcı olabilir. Tespitlere dayanarak, kullanıcıların çevrelerinde daha bağımsız bir şekilde gezinmelerine yardımcı olan sesli açıklamalar sağlanabilir.

Görme engelli bir kişinin market alışverişi yaptığını düşünün. Doğru ürünleri seçmek zor olabilir, ancak YOLO11 yardımcı olabilir. Alışveriş sepetine ürün yerleştirirken, YOLO11 ile entegre bir sistem muz, avokado veya bir kutu süt gibi her bir ürünü tanımlamak ve gerçek zamanlı sesli açıklamalar sağlamak için kullanılabilir. Bu sayede kullanıcılar seçimlerini onaylayabilir ve ihtiyaç duydukları her şeyi aldıklarından emin olabilirler. YOLO11 günlük eşyaları tanıyarak alışverişi kolaylaştırabilir.

Şekil 5. Nesne algılama, görme engelliler için dünyayı daha erişilebilir hale getirmeye yardımcı olabilir.

YOLO11 ile nesne algılama için adım adım kılavuz 

Nesne algılamanın temellerini ve çeşitli uygulamalarını ele aldığımıza göre, nesne algılama gibi görevler için Ultralytics YOLO11 modelini nasıl kullanmaya başlayabileceğinizi inceleyelim.

YOLO11'i kullanmanın iki basit yolu vardır: Ultralytics Python paketi veya Ultralytics HUB aracılığıyla. Python paketi ile başlayarak her iki yöntemi de inceleyelim.

YOLO11 kullanarak çıkarımları çalıştırma

Çıkarım, bir yapay zeka modelinin eğitim sırasında öğrendiklerine dayanarak tahminlerde bulunmak, bilgileri sınıflandırmak veya içgörüler sağlamak için yeni, görülmemiş verileri analiz etmesidir. Nesne algılama ile ilgili olarak bu, bir görüntü veya video içindeki belirli nesneleri tanımlamak ve konumlandırmak, etraflarına sınırlayıcı kutular çizmek ve modelin eğitimine göre onları etiketlemek anlamına gelir.

YOLO11 nesne algılama modelini kullanarak çıkarım yapmak için öncelikle Ultralytics Python paketini pip, conda veya Docker aracılığıyla yüklemeniz gerekir. Herhangi bir kurulum sorunuyla karşılaşırsanız, bunları çözmenize yardımcı olacak ipuçları ve püf noktaları için sorun giderme kılavuzuna göz atın. Yüklendikten sonra, YOLO11 nesne algılama modelini yüklemek ve bir görüntü üzerinde tahminler yapmak için aşağıdaki kodu kullanabilirsiniz.

Şekil 6. YOLO11n kullanarak bir görüntü üzerinde çıkarım çalıştırma.

Özel bir YOLO11 modelinin eğitimi

YOLO11, özel kullanım durumlarınıza daha iyi uyması için özel eğitimi de destekler. Modele ince ayar yaparak, projenizle ilgili nesneleri tespit edecek şekilde uyarlayabilirsiniz. Örneğin, sağlık hizmetlerinde bilgisayarla görmeyi kullanırken, MRI taramalarındaki tümörler veya X-ışınlarındaki kırıklar gibi tıbbi görüntülerdeki belirli anormallikleri tespit etmek için özel olarak eğitilmiş bir YOLO11 modeli kullanılabilir ve doktorların daha hızlı ve daha doğru teşhisler koymasına yardımcı olabilir.

Aşağıdaki kod parçacığı, nesne algılama için bir YOLO11 modelinin nasıl yükleneceğini ve eğitileceğini göstermektedir. Bir YAML yapılandırma dosyasından veya önceden eğitilmiş bir modelden başlayabilir, ağırlıkları aktarabilir ve daha rafine nesne algılama yetenekleri için COCO gibi veri kümeleri üzerinde eğitebilirsiniz.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Bir modeli eğittikten sonra, eğitilen modeli farklı ortamlarda dağıtmak için çeşitli biçimlerde dışa aktarabilirsiniz.

Ultralytics HUB üzerinde YOLO11 nesne algılama

Kodsuz bir alternatif arayanlar için Ultralytics HUB, YOLO11 de dahil olmak üzere YOLO modellerini eğitmek ve dağıtmak için kullanımı kolay bir Vision AI platformu sağlar.

Görüntüler üzerinde nesne algılamayı çalıştırmak için bir hesap oluşturmanız, 'Modeller' bölümüne gitmeniz ve YOLO11 nesne algılama modeli varyantını seçmeniz yeterlidir. Görüntünüzü yükleyin ve platform tespit edilen nesneleri bir önizleme bölümünde gösterecektir.

Şekil 7. Ultralytics HUB üzerinde çıkarımların çalıştırılması.

Python paketinin esnekliğini HUB'ın kolaylığıyla birleştiren YOLO11, hem geliştiricilerin hem de işletmelerin gelişmiş nesne algılama teknolojisinin gücünden yararlanmasını kolaylaştırıyor.

Önemli çıkarımlar

YOLO11, çeşitli sektörlerin ihtiyaçlarını karşılamak için yüksek doğruluğu çok yönlülükle birleştirerek nesne algılamada yeni bir standart belirliyor. Perakende analitiğini geliştirmekten akıllı şehir altyapısını yönetmeye kadar, YOLO11 sayısız uygulamada gerçek zamanlı, güvenilir performans için üretilmiştir.

Özel eğitim seçenekleri ve Ultralytics HUB aracılığıyla kullanımı kolay bir arayüz ile YOLO11'i iş akışlarınıza entegre etmek hiç bu kadar kolay olmamıştı. İster bilgisayarla görmeyi keşfeden bir geliştirici ister yapay zeka ile yenilik yapmak isteyen bir işletme olun, YOLO11 başarılı olmak için ihtiyacınız olan araçları sunar.

Daha fazla bilgi edinmek için GitHub depomuza göz atın ve topluluğumuzla etkileşime geçin. Çözüm sayfalarımızda sürücüsüz otomobillerdeki yapay zeka uygulamalarını ve tarım için bilgisayarla görmeyi keşfedin. 🚀

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Panoya kopyalanan bağlantı