Nesne izleme, örnek segmentasyonu ve görüntü sınıflandırma gibi bilgisayarla görme görevlerinin nasıl çalıştığını ve Ultralytics YOLO11 'in bunları nasıl desteklediğini öğrenin.

Nesne izleme, örnek segmentasyonu ve görüntü sınıflandırma gibi bilgisayarla görme görevlerinin nasıl çalıştığını ve Ultralytics YOLO11 'in bunları nasıl desteklediğini öğrenin.

Kameralar ve yapay zeka (AI) alanındaki gelişmeler sayesinde, bilgisayarlar ve makineler artık dünyayı insanların gördüğüne benzer bir şekilde görebiliyor. Örneğin, insanları tanıyabiliyor, nesneleri track edebiliyor ve hatta bir videoda neler olup bittiğini anlayabiliyorlar.
Özellikle, bilgisayarlı görü, makinelerin çevrelerindeki dünyadan gelen görsel bilgileri anlamalarını ve yorumlamalarını sağlayan yapay zeka dalıdır. Bilgisayarlı görü, her biri görüntülerden veya videolardan belirli bir türde içgörü elde etmek için tasarlanmış çeşitli görevleri içerir. Örneğin, nesne tespiti bir resimdeki farklı öğeleri tanımlamaya ve konumlandırmaya yardımcı olurken, izleme, segmentasyon ve poz tahmini gibi diğer görevler makinelerin hareketi, şekilleri ve konumları daha doğru bir şekilde anlamalarına yardımcı olur.
Belirli bir uygulama için kullanılan bilgisayarla görme görevi, ihtiyaç duyduğunuz içgörü türüne bağlıdır. Bilgisayarla görme modelleri gibi Ultralytics YOLO11 çeşitli bilgisayarla görme görevlerini destekleyerek gerçek dünyada Görme Yapay Zeka sistemleri oluşturmak için güvenilir bir seçim haline getirir.
Bu kılavuzda, YOLO11 gibi modeller tarafından desteklenen bilgisayarla görme görevlerine daha yakından bakacağız. Her bir görevin nasıl çalıştığını ve farklı sektörlerde nasıl kullanıldığını keşfedeceğiz. Hadi başlayalım!
Bilgisayarla görme görevleri, insan görme yeteneklerini farklı şekillerde taklit etmeyi amaçlar. Bu görevler makinelerin nesneleri detect , hareketlerini track , pozları tahmin etmesine ve hatta görüntü ve videolardaki tek tek öğelerin ana hatlarını detect yardımcı olabilir. Genellikle bilgisayarla görme görevleri, görsel verileri daha küçük parçalara ayıran modeller tarafından etkinleştirilir, böylece neler olup bittiğini daha net bir şekilde yorumlayabilirler.
Ultralytics YOLO modelleri gibi Vision AI modelleri, algılama, izleme ve segmentasyon gibi birden fazla görevi tek bir çerçevede destekler. Bu çok yönlülük nedeniyle, YOLO11 modellerinin çok çeşitli kullanım durumları için benimsenmesi kolaydır.

Bunun iyi bir örneği spor analitiğidir. YOLO11 , nesne algılamayı kullanarak sahadaki her oyuncuyu detect etmek için kullanılabilir, ardından nesne izleme ile maç boyunca onları takip edebilir. Bu arada, YOLO11'in poz tahmini yetenekleri oyuncu hareketlerini ve tekniklerini analiz etmeye yardımcı olabilir ve örnek segmentasyonu her oyuncuyu arka plandan ayırarak analize hassasiyet katabilir.
YOLO11 bu bilgisayarla görme görevleri birlikte, oyun sırasında neler olup bittiğine dair eksiksiz bir resim oluşturarak ekiplere oyuncu performansı, taktikler ve genel strateji hakkında daha derin içgörüler sağlar.
Şimdi bilgisayarla görme görevlerinin neler olduğuna bir göz attığımıza göre, gerçek dünya örneklerini kullanarak YOLO11 tarafından desteklenen her birini daha ayrıntılı olarak anlamaya çalışalım.
Bir fotoğrafa baktığınızda, çoğu insan bir köpeği mi, bir dağı mı yoksa bir trafik işaretini mi gösterdiğini kolayca anlayabilir çünkü hepimiz bu şeylerin tipik olarak neye benzediğini öğrendik. Görüntü sınıflandırma, makinelere bir görüntüyü ana nesnesine göre nasıl classify ve etiketleyeceklerini öğreterek aynı şeyi yapmalarına yardımcı olur - bu bir "araba", "muz" veya "kırıklı röntgen" olabilir. Bu etiket, bilgisayarla görme sistemlerinin görsel içeriği anlamasına yardımcı olur, böylece buna göre yanıt verebilir veya karar verebilirler.
Bu bilgisayarla görme görevinin ilginç bir uygulaması vahşi yaşamın izlenmesidir. Görüntü sınıflandırma, vahşi doğada çekilen fotoğraflardan farklı hayvan türlerini tanımlamak için kullanılabilir. Görüntüleri otomatik olarak etiketleyen araştırmacılar, koruma çabalarını desteklemek için popülasyonları track edebilir, göç modellerini izleyebilir ve nesli tükenmekte olan türleri daha kolay belirleyebilir.

Görüntü sınıflandırması, bir görüntünün ne içerdiğine dair genel bir fikir edinmek için yardımcı olsa da, tüm görüntüye yalnızca bir etiket atar. Birden çok nesnenin kesin konumu ve kimliği gibi ayrıntılı bilgilerin gerekli olduğu durumlarda, nesne tespiti şart hale gelir.
Nesne algılama, genellikle etraflarına sınırlayıcı kutular çizerek bir görüntü içindeki tek tek nesneleri tanımlama ve bulma işlemidir. Ultralytics YOLO11 , gerçek zamanlı nesne algılamada özellikle iyi performans gösterir ve bu da onu çok çeşitli uygulamalar için ideal hale getirir.
Örneğin, perakende mağazalarında rafları stoklamak için kullanılan bilgisayarlı görü çözümlerini ele alalım. Nesne algılama, meyve, sebze ve diğer ürünleri saymaya yardımcı olarak doğru bir envanter sağlar. Tarım alanlarında ise aynı teknoloji, çiftçilerin hasat için en iyi zamanı belirlemesine yardımcı olmak için ürün olgunluğunu izleyebilir, hatta olgun ve olgunlaşmamış ürünleri ayırt edebilir.
.webp)
Nesne tespiti, bir görüntüdeki nesneleri tanımlamak ve konumlandırmak için sınırlayıcı kutular kullanır, ancak bunların tam şekillerini yakalamaz. Örnek segmentasyonu burada devreye giriyor. Örnek segmentasyonu, bir nesnenin etrafına bir kutu çizmek yerine, tam hatlarını izler.
Bunu şöyle düşünebilirsiniz: sadece "bu alanda bir elma var" demek yerine, elmanın tam şeklini dikkatlice ana hatlarıyla belirtir ve içini doldurur. Bu detaylı süreç, yapay zeka sistemlerinin bir nesnenin sınırlarını, özellikle nesneler birbirine yakın olduğunda, net bir şekilde anlamasına yardımcı olur.
Örnek segmentasyonu, altyapı denetimlerinden jeolojik araştırmalara kadar birçok uygulamaya uygulanabilir. Örneğin, jeolojik araştırmalardan elde edilen veriler, hem büyük hem de küçük yüzey çatlaklarını veya anormalliklerini segment ayırmak için YOLO11 kullanılarak analiz edilebilir. Mühendisler, bu anormalliklerin etrafına kesin sınırlar çizerek sorunları belirleyebilir ve bir proje başlamadan önce bunları ele alabilir.

Şimdiye kadar baktığımız bilgisayarlı görü görevleri, tek bir görüntüde ne olduğuna odaklanıyor. Ancak, videolar söz konusu olduğunda, tek bir karenin ötesine geçen içgörülere ihtiyacımız var. Nesne takibi görevi bunun için kullanılabilir.
YOLO11'in nesne izleme özelliği, bir dizi video karesi boyunca hareket ederken bir kişi veya araba gibi belirli bir nesneyi takip edebilir. Kamera açısı değişse veya başka nesneler görünse bile sistem aynı hedefi takip etmeye devam eder.
Bu, trafikteki arabaları takip etmek gibi zaman içinde izleme gerektiren uygulamalar için çok önemlidir. Aslında, YOLO11 araçları doğru bir şekilde track , hızlarını gerçek zamanlı olarak tahmin etmeye yardımcı olmak için her arabayı takip edebilir. Bu da nesne takibini trafik izleme gibi sistemlerde önemli bir bileşen haline getiriyor.

Gerçek dünyadaki nesneler her zaman mükemmel şekilde hizalanmaz; eğimli, yan veya garip açılarda konumlandırılmış olabilirler. Örneğin, uydu görüntülerinde gemiler ve binalar genellikle dönmüş görünür.
Geleneksel nesne algılama yöntemleri, bir nesnenin yönüne göre ayarlanmayan sabit dikdörtgen kutular kullanır ve bu da döndürülmüş şekilleri doğru bir şekilde yakalamayı zorlaştırır. Yönlendirilmiş sınırlayıcı kutu (OBB) algılama, bir nesnenin etrafına sıkıca oturacak şekilde dönen ve daha hassas algılama için açısıyla hizalanan kutular kullanarak bu sorunu çözer.
Liman izleme ile ilgili olarak, YOLO11'in OBB algılama desteği, yönlerinden bağımsız olarak gemilerin doğru bir şekilde tanımlanmasına ve track yardımcı olarak limana giren veya çıkan her geminin uygun şekilde izlenmesini sağlayabilir. Bu hassas tespit, yoğun limanları yönetmek ve çarpışmaları önlemek için kritik öneme sahip olan gemi konumları ve hareketleri hakkında gerçek zamanlı bilgi sağlar.

Poz tahmini, bir nesnenin nasıl hareket ettiğini anlamak için eklemler, uzuvlar veya diğer işaretler gibi kilit noktaları izleyen bir bilgisayarlı görü tekniğidir. Bu yöntem, tüm bir nesneyi veya vücudu tek bir bütün birim olarak ele almak yerine, onu temel parçalarına ayırır. Bu, hareketleri, jestleri ve etkileşimleri ayrıntılı olarak analiz etmeyi mümkün kılar.
Bu teknolojinin yaygın bir uygulaması, insan poz tahmini yapmaktır. Çeşitli vücut parçalarının konumlarını gerçek zamanlı olarak izleyerek, bir kişinin nasıl hareket ettiğine dair net bir resim sunar. Bu bilgi, jest tanıma ve aktivite izlemeden, sporda performans analizine kadar çeşitli amaçlar için kullanılabilir.
Benzer şekilde, fiziksel rehabilitasyonda terapistler egzersizler sırasında hastaların hareketlerini izlemek için insan duruşu tahmini ve YOLO11 kullanabilir. Bu, zaman içindeki ilerlemeyi takip ederken her hareketin doğru yapıldığından emin olunmasına yardımcı olur.

YOLO11 tarafından desteklenen tüm bilgisayarla görme görevlerini ayrıntılı olarak incelediğimize göre, şimdi YOLO11 'in bunları nasıl desteklediğini inceleyelim.
YOLO11 sadece bir model değildir - her biri belirli bir bilgisayarla görme görevi için tasarlanmış özel model varyantlarından oluşan bir pakettir. Bu, YOLO11 'i çok çeşitli uygulamalara uyarlanabilen çok yönlü bir araç haline getirir. Ayrıca, projelerinizin benzersiz zorluklarının üstesinden gelmek için bu modellere özel veri kümeleri üzerinde ince ayar yapabilirsiniz.
İşte belirli görme görevleri için önceden eğitilmiş YOLO11 model varyantları:
Her varyant farklı boyutlarda mevcuttur ve kullanıcıların özel ihtiyaçları için hız ve doğruluk arasında doğru dengeyi seçmelerine olanak tanır.
Bilgisayarla görü görevleri, makinelerin dünyayı anlama ve etkileşim kurma biçimini değiştiriyor. Görüntüleri ve videoları temel öğelere ayırarak, bu teknolojiler nesneleri, hareketleri ve etkileşimleri ayrıntılı olarak analiz etmeyi kolaylaştırır.
YOLO11 gibi modeller, trafik güvenliğini ve spor performansını iyileştirmekten endüstriyel süreçleri düzenlemeye kadar, inovasyonu teşvik eden gerçek zamanlı içgörüler sağlayabilir. Vision AI gelişmeye devam ettikçe, her gün görsel verileri nasıl yorumladığımız ve kullandığımız konusunda giderek daha önemli bir rol oynayacaktır.
Topluluğumuza katılın ve yapay zekayı iş başında görmek için GitHub depomuzu ziyaret edin. Lisanslama seçeneklerimizi keşfedin ve çözüm sayfalarımızda tarımda yapay zeka ve üretimde bilgisayarlı görü hakkında daha fazla bilgi edinin.