Nesne izleme, örnek segmentasyonu ve görüntü sınıflandırma gibi bilgisayarla görme görevlerinin nasıl çalıştığını ve Ultralytics YOLO11 'in bunları nasıl desteklediğini öğrenin.
Kameralar ve yapay zeka (AI) alanındaki gelişmeler sayesinde, bilgisayarlar ve makineler artık dünyayı insanların gördüğüne benzer bir şekilde görebiliyor. Örneğin, insanları tanıyabiliyor, nesneleri takip edebiliyor ve hatta bir videoda neler olup bittiğini anlayabiliyorlar.
Özellikle bilgisayarla görme, makinelerin çevrelerindeki dünyadan görsel bilgileri anlamalarını ve yorumlamalarını sağlayan yapay zeka dalıdır. Bilgisayarla görme, her biri görüntülerden veya videolardan belirli bir tür içgörü elde etmek için tasarlanmış çeşitli görevleri içerir. Örneğin, nesne algılama bir resimdeki farklı öğelerin tanımlanmasına ve bulunmasına yardımcı olurken, izleme, segmentasyon ve poz tahmini gibi diğer görevler makinelerin hareketleri, şekilleri ve konumları daha doğru bir şekilde anlamasına yardımcı olur.
Belirli bir uygulama için kullanılan bilgisayarla görme görevi, ihtiyaç duyduğunuz içgörü türüne bağlıdır. Bilgisayarla görme modelleri gibi Ultralytics YOLO11 çeşitli bilgisayarla görme görevlerini destekleyerek gerçek dünyada Görme Yapay Zeka sistemleri oluşturmak için güvenilir bir seçim haline getirir.
Bu kılavuzda, YOLO11 gibi modeller tarafından desteklenen bilgisayarla görme görevlerine daha yakından bakacağız. Her bir görevin nasıl çalıştığını ve farklı sektörlerde nasıl kullanıldığını keşfedeceğiz. Hadi başlayalım!
Bilgisayarla görme görevleri, insan görme yeteneklerini farklı şekillerde taklit etmeyi amaçlar. Bu görevler makinelerin nesneleri algılamasına, hareketlerini izlemesine, pozları tahmin etmesine ve hatta görüntü ve videolardaki tek tek öğelerin ana hatlarını belirlemesine yardımcı olabilir. Genellikle bilgisayarla görme görevleri, görsel verileri daha küçük parçalara ayıran modeller tarafından etkinleştirilir, böylece neler olup bittiğini daha net bir şekilde yorumlayabilirler.
Ultralytics YOLO modelleri gibi Vision AI modelleri, algılama, izleme ve segmentasyon gibi birden fazla görevi tek bir çerçevede destekler. Bu çok yönlülük nedeniyle, YOLO11 modellerinin çok çeşitli kullanım durumları için benimsenmesi kolaydır.
Bunun iyi bir örneği spor analitiğidir. YOLO11 , nesne algılamayı kullanarak sahadaki her oyuncuyu tespit etmek için kullanılabilir, ardından nesne izleme ile maç boyunca onları takip edebilir. Bu arada, YOLO11'in poz tahmini yetenekleri oyuncu hareketlerini ve tekniklerini analiz etmeye yardımcı olabilir ve örnek segmentasyonu her oyuncuyu arka plandan ayırarak analize hassasiyet katabilir.
YOLO11 bu bilgisayarla görme görevleri birlikte, oyun sırasında neler olup bittiğine dair eksiksiz bir resim oluşturarak ekiplere oyuncu performansı, taktikler ve genel strateji hakkında daha derin içgörüler sağlar.
Şimdi bilgisayarla görme görevlerinin neler olduğuna bir göz attığımıza göre, gerçek dünya örneklerini kullanarak YOLO11 tarafından desteklenen her birini daha ayrıntılı olarak anlamaya çalışalım.
Bir fotoğrafa baktığınızda, çoğu insan bir köpeği mi, bir dağı mı yoksa bir trafik işaretini mi gösterdiğini kolayca anlayabilir çünkü hepimiz bu şeylerin tipik olarak neye benzediğini öğrendik. Görüntü sınıflandırma, makinelere bir görüntüyü ana nesnesine göre nasıl sınıflandıracaklarını ve etiketleyeceklerini öğreterek aynı şeyi yapmalarına yardımcı olur - bu bir "araba", "muz" veya "kırıklı röntgen" olabilir. Bu etiket, bilgisayarla görme sistemlerinin görsel içeriği anlamasına yardımcı olur, böylece buna göre yanıt verebilir veya karar verebilirler.
Bu bilgisayarla görme görevinin ilginç bir uygulaması vahşi yaşamın izlenmesidir. Görüntü sınıflandırma, vahşi doğada çekilen fotoğraflardan farklı hayvan türlerini tanımlamak için kullanılabilir. Görüntüleri otomatik olarak etiketleyen araştırmacılar, koruma çabalarını desteklemek için popülasyonları takip edebilir, göç modellerini izleyebilir ve nesli tükenmekte olan türleri daha kolay belirleyebilir.
Görüntü sınıflandırma, bir görüntünün ne içerdiği hakkında genel bir fikir edinmek için yararlı olsa da, tüm görüntüye yalnızca bir etiket atar. Birden fazla nesnenin kesin konumu ve kimliği gibi ayrıntılı bilgilerin gerekli olduğu durumlarda, nesne algılama önemli hale gelir.
Nesne algılama, genellikle etraflarına sınırlayıcı kutular çizerek bir görüntü içindeki tek tek nesneleri tanımlama ve bulma işlemidir. Ultralytics YOLO11 , gerçek zamanlı nesne algılamada özellikle iyi performans gösterir ve bu da onu çok çeşitli uygulamalar için ideal hale getirir.
Örneğin, perakende mağazalarında rafları stoklamak için kullanılan bilgisayarla görme çözümlerini ele alalım. Nesne algılama, meyvelerin, sebzelerin ve diğer ürünlerin sayılmasına yardımcı olarak doğru bir envanter elde edilmesini sağlayabilir. Aynı teknoloji tarımsal alanlarda mahsulün olgunluğunu izleyerek çiftçilerin hasat için en uygun zamanı belirlemelerine, hatta olgunlaşmış ve olgunlaşmamış ürünleri ayırt etmelerine yardımcı olabilir.
Nesne algılama, bir görüntüdeki nesneleri tanımlamak ve bulmak için sınırlayıcı kutular kullanır, ancak tam şekillerini yakalamaz. İşte burada örnek segmentasyonu devreye girer. Bir nesnenin etrafına bir kutu çizmek yerine, örnek segmentasyonu nesnenin kesin dış hatlarını izler.
Bunu şöyle düşünebilirsiniz: sadece "bu alanda bir elma var" demek yerine, elmanın tam şeklini dikkatlice çizer ve doldurur. Bu ayrıntılı süreç, özellikle nesneler birbirine yakın olduğunda, yapay zeka sistemlerinin bir nesnenin sınırlarını net bir şekilde anlamasına yardımcı olur.
Örnek segmentasyonu, altyapı denetimlerinden jeolojik araştırmalara kadar birçok uygulamaya uygulanabilir. Örneğin, jeolojik araştırmalardan elde edilen veriler, hem büyük hem de küçük yüzey çatlaklarını veya anormalliklerini segmentlere ayırmak için YOLO11 kullanılarak analiz edilebilir. Mühendisler, bu anormalliklerin etrafına kesin sınırlar çizerek sorunları belirleyebilir ve bir proje başlamadan önce bunları ele alabilir.
Şimdiye kadar incelediğimiz bilgisayarla görme görevleri tek bir görüntüde ne olduğuna odaklanıyordu. Ancak, söz konusu videolar olduğunda, tek bir karenin ötesine geçen içgörülere ihtiyacımız var. Nesne izleme görevi bunun için kullanılabilir.
YOLO11'in nesne izleme özelliği, bir dizi video karesi boyunca hareket ederken bir kişi veya araba gibi belirli bir nesneyi takip edebilir. Kamera açısı değişse veya başka nesneler görünse bile sistem aynı hedefi takip etmeye devam eder.
Bu, trafikteki arabaları takip etmek gibi zaman içinde izleme gerektiren uygulamalar için çok önemlidir. Aslında, YOLO11 araçları doğru bir şekilde izleyebilir, hızlarını gerçek zamanlı olarak tahmin etmeye yardımcı olmak için her arabayı takip edebilir. Bu da nesne takibini trafik izleme gibi sistemlerde önemli bir bileşen haline getiriyor.
Gerçek dünyadaki nesneler her zaman mükemmel bir şekilde hizalanmaz - eğik, yana doğru veya garip açılarda konumlandırılmış olabilirler. Örneğin, uydu görüntülerinde gemiler ve binalar genellikle döndürülmüş olarak görünür.
Geleneksel nesne algılama yöntemleri, bir nesnenin yönüne göre ayarlanmayan sabit dikdörtgen kutular kullanır ve bu da döndürülen bu şekillerin doğru bir şekilde yakalanmasını zorlaştırır. Yönlendirilmiş sınırlayıcı kutu (OBB) algılama, bir nesnenin etrafına tam olarak oturacak şekilde dönen ve daha hassas algılama için açısıyla hizalanan kutular kullanarak bu sorunu çözer.
Liman izleme ile ilgili olarak, YOLO11'in OBB algılama desteği, yönlerinden bağımsız olarak gemilerin doğru bir şekilde tanımlanmasına ve izlenmesine yardımcı olarak limana giren veya çıkan her geminin uygun şekilde izlenmesini sağlayabilir. Bu hassas tespit, yoğun limanları yönetmek ve çarpışmaları önlemek için kritik öneme sahip olan gemi konumları ve hareketleri hakkında gerçek zamanlı bilgi sağlar.
Poz tahmini, bir nesnenin nasıl hareket ettiğini anlamak için eklemler, uzuvlar veya diğer işaretleyiciler gibi kilit noktaları izleyen bir bilgisayarla görme tekniğidir. Bu yöntem, bir nesnenin veya vücudun tamamını tek bir birim olarak ele almak yerine, onu temel parçalarına ayırır. Bu sayede hareketler, jestler ve etkileşimler ayrıntılı olarak analiz edilebilir.
Bu teknolojinin yaygın uygulamalarından biri insan pozu tahminidir. Çeşitli vücut parçalarının konumlarını gerçek zamanlı olarak izleyerek, bir kişinin nasıl hareket ettiğine dair net bir resim sağlar. Bu bilgiler, jest tanıma ve aktivite izlemeden sporda performans analizine kadar çeşitli amaçlar için kullanılabilir.
Benzer şekilde, fiziksel rehabilitasyonda terapistler egzersizler sırasında hastaların hareketlerini izlemek için insan duruşu tahmini ve YOLO11 kullanabilir. Bu, zaman içindeki ilerlemeyi takip ederken her hareketin doğru yapıldığından emin olunmasına yardımcı olur.
YOLO11 tarafından desteklenen tüm bilgisayarla görme görevlerini ayrıntılı olarak incelediğimize göre, şimdi YOLO11 'in bunları nasıl desteklediğini inceleyelim.
YOLO11 sadece bir model değildir - her biri belirli bir bilgisayarla görme görevi için tasarlanmış özel model varyantlarından oluşan bir pakettir. Bu, YOLO11 'i çok çeşitli uygulamalara uyarlanabilen çok yönlü bir araç haline getirir. Ayrıca, projelerinizin benzersiz zorluklarının üstesinden gelmek için bu modellere özel veri kümeleri üzerinde ince ayar yapabilirsiniz.
İşte belirli görme görevleri için önceden eğitilmiş YOLO11 model varyantları:
Her varyant farklı boyutlarda mevcuttur ve kullanıcıların özel ihtiyaçları için hız ve doğruluk arasında doğru dengeyi seçmelerine olanak tanır.
Bilgisayarla görme görevleri, makinelerin dünyayı anlama ve dünyayla etkileşim kurma şeklini değiştiriyor. Bu teknolojiler, görüntüleri ve videoları temel unsurlara ayırarak nesneleri, hareketleri ve etkileşimleri ayrıntılı olarak analiz etmeyi kolaylaştırıyor.
YOLO11 gibi modeller, trafik güvenliğini ve spor performansını iyileştirmekten endüstriyel süreçleri düzenlemeye kadar, inovasyonu teşvik eden gerçek zamanlı içgörüler sağlayabilir. Vision AI gelişmeye devam ettikçe, her gün görsel verileri nasıl yorumladığımız ve kullandığımız konusunda giderek daha önemli bir rol oynayacaktır.
Topluluğumuza katılın ve yapay zekayı çalışırken görmek için GitHub depomuzu ziyaret edin. Lisanslama seçeneklerimizi keşfedin ve çözümler sayfalarımızda tarımda yapay zeka ve üretimde bilgisayarla görme hakkında daha fazla bilgi edinin.
Makine öğreniminin geleceği ile yolculuğunuza başlayın