YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024

Bilgisayarlı görü uygulamalarının nasıl çalıştığını keşfetmek

Abirami Vina

5 dakikalık okuma

9 Ağustos 2024

Bilgisayarlı görü uygulamalarına bizimle birlikte derinlemesine dalın. Ayrıca nesne tespiti ve segmentasyon gibi çeşitli bilgisayarlı görü görevlerini de inceleyeceğiz.

Bilgisayarlı görü modellerinin tarihini incelerken, bilgisayarlı görünün nasıl geliştiğini ve günümüzdeki gelişmiş görü modellerine yol açan yolu gördük. Ultralytics YOLOv8 gibi modern modeller birden fazla bilgisayarlı görü görevini destekler ve çeşitli heyecan verici uygulamalarda kullanılmaktadır. 

Bu makalede, bilgisayarlı görü ve görü modellerinin temellerine bir göz atacağız. Nasıl çalıştıklarını ve çeşitli endüstrilerdeki çeşitli uygulamalarını ele alacağız. Bilgisayarlı görü yenilikleri her yerde, sessizce dünyamızı şekillendiriyor. Bunları tek tek ortaya çıkaralım! 

Bilgisayarlı görü nedir?

Yapay zeka (AI), insan zekasının bir bölümünü taklit etmeyi amaçlayan birçok teknolojiyi kapsayan bir şemsiye terimdir. Yapay zekanın böyle bir alt alanı da bilgisayarlı görüdür. Bilgisayarlı görü, makinelere çevrelerini görebilen, gözlemleyebilen ve anlayabilen gözler vermeye odaklanır. 

Tıpkı insan görüşü gibi, bilgisayarlı görü çözümleri de nesneleri ayırt etmeyi, mesafeleri hesaplamayı ve hareketleri tespit etmeyi amaçlar. Ancak, görmelerine ve anlamalarına yardımcı olacak bir ömür boyu deneyime sahip olan insanların aksine, bilgisayarlar büyük miktarda veriye, yüksek çözünürlüklü kameralara ve karmaşık algoritmalara güvenir. 

Şekil 1. İnsan Görüşü ve Bilgisayarlı Görüşün Karşılaştırılması.

Bilgisayarlı görü sistemleri, görüntüler ve videolar gibi görsel verileri inanılmaz hızlarda ve doğrulukta işleyebilir ve analiz edebilir. Büyük miktarda görsel bilgiyi hızlı ve doğru bir şekilde analiz etme yeteneği, bilgisayarlı görüyü üretimden sağlık hizmetlerine kadar çeşitli endüstrilerde güçlü bir araç haline getirir.

Görü modelleri çeşitli bilgisayarlı görü görevlerini destekler

Bilgisayarlı görü modelleri, herhangi bir bilgisayarlı görü uygulamasının temelini oluşturur. Bunlar esasen makinelere görsel bilgileri yorumlama ve anlama yeteneği kazandırmak için tasarlanmış derin öğrenme teknikleriyle desteklenen hesaplama algoritmalarıdır. Görü modelleri, görüntü sınıflandırmasından nesne tespitine kadar çok önemli bilgisayarlı görü görevlerini mümkün kılar. Bu görevlerden bazılarına ve bunların kullanım alanlarına daha yakından bakalım. 

Görüntü sınıflandırması

Görüntü sınıflandırması, görüntüleri önceden tanımlanmış sınıflara veya kategorilere ayırmayı ve etiketlemeyi içerir. YOLOv8 gibi bir görü modeli, etiketlenmiş görüntülerin büyük veri kümeleri üzerinde eğitilebilir. Eğitim sırasında model, her sınıfla ilişkili kalıpları ve özellikleri tanımayı öğrenir. Eğitildikten sonra, özelliklerini analiz ederek ve öğrenilen kalıplarla karşılaştırarak yeni, görülmemiş görüntülerin kategorisini tahmin edebilir. 

Şekil 2. Görüntü sınıflandırmasına bir örnek. (kaynak: towardsdatascience.com)

Farklı görüntü sınıflandırma türleri vardır. Örneğin, tıbbi görüntülerle uğraşırken, resimleri sağlıklı veya hasta gibi iki gruba ayırmak için ikili sınıflandırmayı kullanabilirsiniz. Bir diğer tür ise çok sınıflı sınıflandırmadır. Görüntüleri domuz, keçi ve inek gibi bir çiftlikteki farklı hayvanları sınıflandırmak gibi birçok gruba ayırmaya yardımcı olabilir. Veya, hayvanları memeliler ve kuşlar ve daha sonra aslanlar, kaplanlar, kartallar ve serçeler gibi türler halinde sınıflandırmak istediğinizi varsayalım; hiyerarşik sınıflandırma en iyi seçenek olacaktır.

Nesne tespiti

Nesne tespiti, bilgisayarlı görü kullanarak görüntü ve video karelerindeki nesneleri tanımlama ve konumlandırma işlemidir. İki görevden oluşur: nesnelerin etrafına sınırlayıcı kutular çizen nesne yerelleştirmesi ve her nesnenin kategorisini tanımlayan nesne sınıflandırması. Sınırlayıcı kutu açıklamalarına dayanarak, bir görü modeli her nesne kategorisine özgü kalıpları ve özellikleri tanımayı ve bu nesnelerin yeni, görülmemiş görüntülerdeki varlığını ve konumunu tahmin etmeyi öğrenebilir. 

Şekil 3. Bir futbol sahasındaki oyuncuları tespit etmek için kullanılan YOLOv8 Nesne tespiti.

Nesne tespiti, spordan deniz biyolojisine kadar farklı endüstrilerde birçok kullanım alanına sahiptir. Örneğin, perakende sektöründe Amazon'un Just Walk Out teknolojisi, müşterilerin aldığı ürünleri tanımlayarak ödeme işlemlerini otomatikleştirmek için nesne tespiti kullanır. Bilgisayarlı görü ve sensör verilerinin birleşimi, müşterilerin ürünlerini alıp sıra beklemeden ayrılmalarını sağlar. 

İşte nasıl çalıştığına dair daha yakından bir bakış:

  • Tavana monte edilmiş kameralar, mağazada dolaşan müşterileri yakalar ve bu video görüntüleri, görü modelleri tarafından gerçek zamanlı olarak işlenir.
  • Nesne tespiti, bir müşterinin sanal sepetini buna göre güncellemek için aldığı ve sepetine koyduğu ürünün tam olarak tespit edilmesinde kullanılır.
  • Raflardaki ağırlık sensörleri, ürünün kaldırılmasını veya değiştirilmesini tespit ederek doğruluğu artırır.
  • Müşteri mağazadan çıkarken, nesne tespiti ve yüz tanıma teknolojisi müşterinin çıktığını doğrulamak için kullanılabilir ve kredi kartı gibi ödeme bilgileri otomatik olarak ücretlendirmek için kullanılabilir.

Semantik ve örnekleme segmentasyonu

Semantik segmentasyon ve örnekleme segmentasyonu, görüntüleri anlamlı segmentlere ayırmaya yardımcı olan bilgisayarlı görü görevleridir. Semantik segmentasyon, pikselleri semantik anlamlarına göre sınıflandırır ve bir kategori içindeki tüm nesneleri aynı etikete sahip tek bir varlık olarak ele alır. "Gökyüzü" veya "okyanus" gibi sayılamayan nesneleri veya "yapraklar" veya "çimen" gibi kümeleri etiketlemek için uygundur.

Örnekleme segmentasyonu ise, tespit edilen her nesneye benzersiz bir etiket atayarak aynı sınıfa ait farklı örnekleri ayırt edebilir. Nesnelerin sayısının ve bağımsızlığının önemli olduğu sayılabilir nesneleri segmentlere ayırmak için örnekleme segmentasyonunu kullanabilirsiniz. Daha kesin tanımlama ve farklılaştırmaya olanak tanır.

Şekil 4. Semantik ve örnekleme segmentasyonuna bir örnek.

Semantik ve örnekleme segmentasyonu arasındaki farkı otonom sürüşlü arabalarla ilgili bir örnekle daha net anlayabiliriz. Semantik segmentasyon, bir sahnenin içeriğini anlamayı gerektiren görevler için harikadır ve otonom araçlarda yoldaki yaya geçitleri ve trafik işaretleri gibi özellikleri sınıflandırmak için kullanılabilir. Bu arada, örnekleme segmentasyonu otonom araçlarda bireysel yayaları, araçları ve engelleri ayırt etmek için kullanılabilir. 

Poz tahmini

Poz tahmini, bir nesnenin görüntülerdeki veya videolardaki pozlarının temel noktalarını tespit etmeye ve izlemeye odaklanan bir bilgisayarlı görü görevidir. En yaygın olarak insan poz tahmini için kullanılır ve omuzlar ve dizler gibi alanlar temel noktaları içerir. Bir insanın pozunu tahmin etmek, çeşitli uygulamalar için kritik olan eylemleri ve hareketleri anlamamıza ve tanımamıza yardımcı olur.

Şekil 5. YOLOv8 kullanılarak poz tahmini örneği.

Poz tahmini, sporcuların nasıl hareket ettiğini analiz etmek için sporda kullanılabilir. NBA, oyun sırasında oyuncu hareketlerini ve pozisyonlarını incelemek için poz tahminini kullanır. Omuzlar, dirsekler, dizler ve ayak bilekleri gibi temel noktaları izleyerek, poz tahmini oyuncu hareketleri hakkında ayrıntılı bilgiler sağlar. Bu bilgiler, antrenörlerin daha iyi stratejiler geliştirmesine, antrenman programlarını optimize etmesine ve oyunlar sırasında gerçek zamanlı ayarlamalar yapmasına yardımcı olur. Ayrıca, veriler oyuncu yorgunluğunu ve yaralanma riskini izleyerek genel oyuncu sağlığını ve performansını iyileştirmeye yardımcı olabilir.

Yönlendirilmiş sınırlayıcı kutular nesne tespiti

Yönlendirilmiş Sınırlayıcı Kutular Nesne Tespiti (OBB), bir görüntüdeki nesneleri hassas bir şekilde tanımlamak ve konumlandırmak için döndürülmüş dikdörtgenler kullanır. Görüntü eksenleriyle hizalanan standart sınırlayıcı kutulardan farklı olarak, OBB'ler nesnenin yönüne uyacak şekilde döner. Bu, onları özellikle mükemmel yatay veya dikey olmayan nesneler için kullanışlı hale getirir. Kalabalık ortamlarda örtüşmeleri önlemek için döndürülmüş nesneleri doğru bir şekilde belirleme ve izole etmede harikadırlar.

Şekil 6. YOLOV8 Kullanılarak Teknelerin Hava Görüntüsünde Yönlendirilmiş Sınırlayıcı Kutu Tespiti Örneği.

Deniz gözetiminde, gemileri tanımlamak ve izlemek güvenlik ve kaynak yönetimi için önemlidir. OBB tespiti, gemilerin yoğun bir şekilde paketlenmiş veya çeşitli açılarda yönlendirilmiş olsalar bile, hassas bir şekilde konumlandırılması için kullanılabilir. Nakliye şeritlerini izlemeye, deniz trafiğini yönetmeye ve liman operasyonlarını optimize etmeye yardımcı olur. Ayrıca, kasırgalar veya petrol sızıntıları gibi olaylardan sonra gemilere ve altyapıya verilen hasarı hızlı bir şekilde belirleyip değerlendirerek afet müdahalesine yardımcı olabilir.

Nesne takibi

Şimdiye kadar, görüntülerle ilgilenen bilgisayarlı görü görevlerini tartıştık. Nesne takibi, bir videonun kareleri boyunca bir nesneyi izleyebilen bir bilgisayarlı görü görevidir. Algılama algoritmalarını kullanarak nesneyi ilk karede tanımlayarak başlar ve ardından videoda hareket ettikçe konumunu sürekli olarak takip eder. Nesne takibi, takibi doğru tutmak için nesne tespiti, özellik çıkarımı ve hareket tahmini gibi teknikleri içerir.

Şekil 7. Balıkları izlemek için YOLOv8 kullanma.

YOLOv8 gibi görme modelleri, deniz biyolojisinde balıkları izlemek için kullanılabilir. Sualtı kameralarını kullanarak, araştırmacılar balıkların doğal yaşam alanlarındaki hareketlerini ve davranışlarını izleyebilirler. Süreç, ilk karelerdeki bireysel balıkları tespit ederek başlar ve ardından videoda konumlarını takip eder. Balıkları izlemek, bilim insanlarının göç modellerini, sosyal davranışları ve çevre ile etkileşimleri anlamalarına yardımcı olur. Ayrıca, balık dağılımı ve bolluğu hakkında bilgi sağlayarak sürdürülebilir balıkçılık uygulamalarını destekler.

Bilgisayarlı görüye son bir bakış

Bilgisayarlı görü, teknolojiyi kullanma ve dünyayla etkileşim kurma şeklimizi aktif olarak değiştiriyor. Görüntüleri ve videoları anlamak için derin öğrenme modellerini ve karmaşık algoritmaları kullanarak, bilgisayarlı görü endüstrilerin birçok süreci kolaylaştırmasına yardımcı olur. Nesne tespiti ve nesne takibi gibi bilgisayarlı görü görevleri, daha önce hayal edilmemiş çözümler oluşturmayı mümkün kılıyor. Bilgisayarlı görü teknolojisi gelişmeye devam ettikçe, gelecek çok daha yenilikçi uygulamalar barındırıyor! 

Gelin birlikte öğrenelim ve büyüyelim! Yapay zekaya katkılarımızı görmek için GitHub depomuzu keşfedin. Yapay zeka ile otonom sürüşlü arabalar ve tarım gibi endüstrileri nasıl yeniden tanımladığımızı inceleyin. 🚀

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Bağlantı panoya kopyalandı