Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

Bilgisayarlı görü uygulamalarının nasıl çalıştığını keşfetmek

Abirami Vina

5 dakikalık okuma

9 Ağustos 2024

Bilgisayarlı görü uygulamalarına bizimle birlikte derinlemesine dalın. Ayrıca nesne tespiti ve segmentasyon gibi çeşitli bilgisayarlı görü görevlerini de inceleyeceğiz.

Bilgisayarla görme modellerinin tarihini incelediğimizde, bilgisayarla görmenin nasıl geliştiğini ve bugün sahip olduğumuz gelişmiş görme modellerine giden yolu gördük. Gibi modern modeller Ultralytics YOLOv8 birden fazla bilgisayarla görme görevini destekliyor ve çeşitli heyecan verici uygulamalarda kullanılıyor. 

Bu makalede, bilgisayarlı görü ve görü modellerinin temellerine bir göz atacağız. Nasıl çalıştıklarını ve çeşitli endüstrilerdeki çeşitli uygulamalarını ele alacağız. Bilgisayarlı görü yenilikleri her yerde, sessizce dünyamızı şekillendiriyor. Bunları tek tek ortaya çıkaralım! 

Bilgisayarlı görü nedir?

Yapay zeka (AI), insan zekasının bir bölümünü taklit etmeyi amaçlayan birçok teknolojiyi kapsayan bir şemsiye terimdir. Yapay zekanın böyle bir alt alanı da bilgisayarlı görüdür. Bilgisayarlı görü, makinelere çevrelerini görebilen, gözlemleyebilen ve anlayabilen gözler vermeye odaklanır. 

Tıpkı insan görüşü gibi, bilgisayar görüşü çözümleri de nesneleri ayırt etmeyi, mesafeleri hesaplamayı ve hareketleri detect etmeyi amaçlar. Ancak, görmelerine ve anlamalarına yardımcı olacak ömür boyu deneyime sahip olan insanların aksine, bilgisayarlar büyük miktarda veriye, yüksek çözünürlüklü kameralara ve karmaşık algoritmalara güvenir. 

Şekil 1. İnsan Görüşü ve Bilgisayarlı Görüşün Karşılaştırılması.

Bilgisayarlı görü sistemleri, görüntüler ve videolar gibi görsel verileri inanılmaz hızlarda ve doğrulukta işleyebilir ve analiz edebilir. Büyük miktarda görsel bilgiyi hızlı ve doğru bir şekilde analiz etme yeteneği, bilgisayarlı görüyü üretimden sağlık hizmetlerine kadar çeşitli endüstrilerde güçlü bir araç haline getirir.

Görü modelleri çeşitli bilgisayarlı görü görevlerini destekler

Bilgisayarlı görü modelleri, herhangi bir bilgisayarlı görü uygulamasının temelini oluşturur. Bunlar esasen makinelere görsel bilgileri yorumlama ve anlama yeteneği kazandırmak için tasarlanmış derin öğrenme teknikleriyle desteklenen hesaplama algoritmalarıdır. Görü modelleri, görüntü sınıflandırmasından nesne tespitine kadar çok önemli bilgisayarlı görü görevlerini mümkün kılar. Bu görevlerden bazılarına ve bunların kullanım alanlarına daha yakından bakalım. 

Görüntü sınıflandırması

Görüntü sınıflandırma, görüntüleri önceden tanımlanmış sınıflara veya kategorilere ayırmayı ve etiketlemeyi içerir. Aşağıdaki gibi bir vizyon modeli YOLOv8 etiketli görüntülerden oluşan büyük veri kümeleri üzerinde eğitilebilir. Eğitim sırasında model, her bir sınıfla ilişkili kalıpları ve özellikleri tanımayı öğrenir. Eğitildikten sonra, özelliklerini analiz ederek ve bunları öğrenilen kalıplarla karşılaştırarak yeni, görünmeyen görüntülerin kategorisini tahmin edebilir. 

Şekil 2. Görüntü sınıflandırmasına bir örnek. (kaynak: towardsdatascience.com)

Farklı görüntü sınıflandırma türleri vardır. Örneğin, tıbbi görüntülerle uğraşırken, resimleri sağlıklı veya hasta gibi iki gruba ayırmak için ikili sınıflandırmayı kullanabilirsiniz. Diğer bir tür ise çok sınıflı sınıflandırmadır. Bir çiftlikteki domuzlar, keçiler ve inekler gibi farklı hayvanları classify gibi görüntüleri birçok gruba ayırmaya yardımcı olabilir. Ya da diyelim ki hayvanları memeliler ve kuşlar olarak classify ve daha sonra aslanlar, kaplanlar, kartallar ve serçeler gibi türlere ayırmak gibi gruplara ve alt gruplara sınıflandırmak istiyorsunuz; hiyerarşik sınıflandırma en iyi seçenek olacaktır.

Nesne tespiti

Nesne tespiti, bilgisayarlı görü kullanarak görüntü ve video karelerindeki nesneleri tanımlama ve konumlandırma işlemidir. İki görevden oluşur: nesnelerin etrafına sınırlayıcı kutular çizen nesne yerelleştirmesi ve her nesnenin kategorisini tanımlayan nesne sınıflandırması. Sınırlayıcı kutu açıklamalarına dayanarak, bir görü modeli her nesne kategorisine özgü kalıpları ve özellikleri tanımayı ve bu nesnelerin yeni, görülmemiş görüntülerdeki varlığını ve konumunu tahmin etmeyi öğrenebilir. 

Şekil 3. Bir futbol sahasındaki oyuncuları detect etmek için kullanılan YOLOv8 Nesne algılama.

Nesne tespiti, spordan deniz biyolojisine kadar farklı endüstrilerde birçok kullanım alanına sahiptir. Örneğin, perakende sektöründe Amazon'un Just Walk Out teknolojisi, müşterilerin aldığı ürünleri tanımlayarak ödeme işlemlerini otomatikleştirmek için nesne tespiti kullanır. Bilgisayarlı görü ve sensör verilerinin birleşimi, müşterilerin ürünlerini alıp sıra beklemeden ayrılmalarını sağlar. 

İşte nasıl çalıştığına dair daha yakından bir bakış:

  • Tavana monte edilmiş kameralar, mağazada dolaşan müşterileri yakalar ve bu video görüntüleri, görü modelleri tarafından gerçek zamanlı olarak işlenir.
  • Nesne algılama, bir müşterinin sanal sepetini buna göre güncellemek için tam olarak aldığı ve sepetine yerleştirdiği ürünü detect etmek için kullanılır.
  • Raflardaki ağırlık sensörleri, ürünün kaldırılmasını veya değiştirilmesini tespit ederek doğruluğu artırır.
  • Müşteri mağazadan çıkarken, nesne tespiti ve yüz tanıma teknolojisi müşterinin çıktığını doğrulamak için kullanılabilir ve kredi kartı gibi ödeme bilgileri otomatik olarak ücretlendirmek için kullanılabilir.

Semantik ve örnekleme segmentasyonu

Semantik segmentasyon ve örnekleme segmentasyonu, görüntüleri anlamlı segmentlere ayırmaya yardımcı olan bilgisayarlı görü görevleridir. Semantik segmentasyon, pikselleri semantik anlamlarına göre sınıflandırır ve bir kategori içindeki tüm nesneleri aynı etikete sahip tek bir varlık olarak ele alır. "Gökyüzü" veya "okyanus" gibi sayılamayan nesneleri veya "yapraklar" veya "çimen" gibi kümeleri etiketlemek için uygundur.

Öte yandan örnek segmentasyonu, tespit edilen her nesneye benzersiz bir etiket atayarak aynı sınıfın farklı örneklerini birbirinden ayırabilir. Nesnelerin sayısının ve bağımsızlığının önemli olduğu durumlarda sayılabilir nesneleri segment ayırmak için örnek segmentasyonunu kullanabilirsiniz. Daha hassas tanımlama ve farklılaştırma sağlar.

Şekil 4. Semantik ve örnekleme segmentasyonuna bir örnek.

Anlamsal ve örnek segmentasyonu arasındaki zıtlığı sürücüsüz araçlarla ilgili bir örnekle daha net anlayabiliriz. Anlamsal segmentasyon, bir sahnenin içeriğini anlamayı gerektiren görevler için harikadır ve otonom araçlarda yaya geçitleri ve trafik işaretleri gibi yoldaki özellikleri classify için kullanılabilir. Bu arada, örnek segmentasyonu otonom araçlarda bireysel yayalar, araçlar ve engeller arasında tanımlama yapmak için kullanılabilir. 

Poz tahmini

Poz tahmini, bir nesnenin görüntülerdeki veya videolardaki pozlarının temel noktalarını tespit etmeye ve izlemeye odaklanan bir bilgisayarlı görü görevidir. En yaygın olarak insan poz tahmini için kullanılır ve omuzlar ve dizler gibi alanlar temel noktaları içerir. Bir insanın pozunu tahmin etmek, çeşitli uygulamalar için kritik olan eylemleri ve hareketleri anlamamıza ve tanımamıza yardımcı olur.

Şekil 5. YOLOv8 kullanarak poz tahminine bir örnek.

Poz tahmini, sporcuların nasıl hareket ettiğini analiz etmek için sporda kullanılabilir. NBA, oyun sırasında oyuncu hareketlerini ve pozisyonlarını incelemek için poz tahminini kullanır. Omuzlar, dirsekler, dizler ve ayak bilekleri gibi temel noktaları izleyerek, poz tahmini oyuncu hareketleri hakkında ayrıntılı bilgiler sağlar. Bu bilgiler, antrenörlerin daha iyi stratejiler geliştirmesine, antrenman programlarını optimize etmesine ve oyunlar sırasında gerçek zamanlı ayarlamalar yapmasına yardımcı olur. Ayrıca, veriler oyuncu yorgunluğunu ve yaralanma riskini izleyerek genel oyuncu sağlığını ve performansını iyileştirmeye yardımcı olabilir.

Yönlendirilmiş sınırlayıcı kutular nesne tespiti

Yönlendirilmiş Sınırlayıcı Kutular Nesne Tespiti (OBB), bir görüntüdeki nesneleri hassas bir şekilde tanımlamak ve konumlandırmak için döndürülmüş dikdörtgenler kullanır. Görüntü eksenleriyle hizalanan standart sınırlayıcı kutulardan farklı olarak, OBB'ler nesnenin yönüne uyacak şekilde döner. Bu, onları özellikle mükemmel yatay veya dikey olmayan nesneler için kullanışlı hale getirir. Kalabalık ortamlarda örtüşmeleri önlemek için döndürülmüş nesneleri doğru bir şekilde belirleme ve izole etmede harikadırlar.

Şekil 6. YOLOV8 Kullanılarak Teknelerin Havadan Görüntüsü Üzerinde Yönlendirilmiş Sınırlayıcı Kutu Tespitine Bir Örnek.

Deniz gözetiminde, gemileri tanımlamak ve izlemek güvenlik ve kaynak yönetimi için önemlidir. OBB tespiti, gemilerin yoğun bir şekilde paketlenmiş veya çeşitli açılarda yönlendirilmiş olsalar bile, hassas bir şekilde konumlandırılması için kullanılabilir. Nakliye şeritlerini izlemeye, deniz trafiğini yönetmeye ve liman operasyonlarını optimize etmeye yardımcı olur. Ayrıca, kasırgalar veya petrol sızıntıları gibi olaylardan sonra gemilere ve altyapıya verilen hasarı hızlı bir şekilde belirleyip değerlendirerek afet müdahalesine yardımcı olabilir.

Nesne takibi

Şimdiye kadar, görüntülerle ilgilenen bilgisayarla görme görevlerini tartıştık. Nesne izleme, bir nesneyi bir videonun kareleri boyunca track bir bilgisayarla görme görevidir. Algılama algoritmalarını kullanarak nesneyi ilk karede tanımlayarak başlar ve ardından video boyunca hareket ettikçe konumunu sürekli olarak takip eder. Nesne izleme, izlemeyi doğru tutmak için nesne algılama, özellik çıkarma ve hareket tahmini gibi teknikleri içerir.

Şekil 7. Balıkları track için YOLOv8 kullanımı.

YOLOv8 gibi görüş modelleri deniz biyolojisinde balıklarıtrack için kullanılabilir. Araştırmacılar su altı kameralarını kullanarak balıkların doğal yaşam alanlarındaki hareketlerini ve davranışlarını izleyebilirler. Süreç, ilk karelerde tek tek balıkları tespit ederek başlar ve ardından video boyunca konumlarını takip eder. Balıkların izlenmesi, bilim insanlarının göç modellerini, sosyal davranışlarını ve çevreyle etkileşimlerini anlamalarına yardımcı olur. Ayrıca balık dağılımı ve bolluğu hakkında bilgi sağlayarak sürdürülebilir balıkçılık uygulamalarını destekler.

Bilgisayarlı görüye son bir bakış

Bilgisayarlı görü, teknolojiyi kullanma ve dünyayla etkileşim kurma şeklimizi aktif olarak değiştiriyor. Görüntüleri ve videoları anlamak için derin öğrenme modellerini ve karmaşık algoritmaları kullanarak, bilgisayarlı görü endüstrilerin birçok süreci kolaylaştırmasına yardımcı olur. Nesne tespiti ve nesne takibi gibi bilgisayarlı görü görevleri, daha önce hayal edilmemiş çözümler oluşturmayı mümkün kılıyor. Bilgisayarlı görü teknolojisi gelişmeye devam ettikçe, gelecek çok daha yenilikçi uygulamalar barındırıyor! 

Gelin birlikte öğrenelim ve büyüyelim! Yapay zekaya katkılarımızı görmek için GitHub depomuzu keşfedin. Yapay zeka ile otonom sürüşlü arabalar ve tarım gibi endüstrileri nasıl yeniden tanımladığımızı inceleyin. 🚀

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın