Sözlük

Bilgisayarla Görme (CV)

Bilgisayarlı Görü ile yapay zekanın potansiyelini ortaya çıkarın! Nesne algılama, sağlık hizmetleri, sürücüsüz arabalar ve ötesindeki rolünü keşfedin. Şimdi daha fazlasını öğrenin!

Bilgisayarlı Görme (CV), bilgisayarları görsel dünyayı yorumlamak ve anlamak için eğiten bir yapay zeka (AI) alanıdır. Kameralar, videolar ve derin öğrenme modellerinden elde edilen dijital görüntüleri kullanan makineler, nesneleri doğru bir şekilde tanımlayıp sınıflandırabilir ve ardından "gördüklerine" tepki verebilir. Amaç, bilgisayarların insan görüşünü taklit etmesini sağlamaktır; bu, anlamlandırmak için büyük miktarda görsel verinin işlenmesini ve analiz edilmesini içeren bir görevdir. Bir alan olarak, derin öğrenmedeki ilerlemeler ve büyük veri kümelerinin mevcudiyeti sayesinde hızla büyümüştür.

Bilgisayarla Görme Nasıl Çalışır?

Bilgisayarla görme, görsel verilere makine öğrenimi (ML) algoritmaları uygulayarak çalışır. Bir nesneyi tanımak için açıkça programlanmak yerine, bir CV modeli binlerce veya milyonlarca etiketli görüntüden kalıpları tanımlamayı öğrenir. Örneğin, bir modeli kedileri tanıyacak şekilde eğitmek için, bir kedinin özelliklerini kendi başına ayırt etmeyi öğrenene kadar sayısız kedi görüntüsü beslenecektir.

Modern CV büyük ölçüde derin öğrenme modellerine, özellikle de Evrişimsel Sinir Ağlarına (CNN'ler) dayanır. CNN, görüntü verilerini işlemede oldukça etkili olan bir sinir ağı türüdür. Kenarlar, dokular ve şekiller gibi önemli özellikleri vurgulayan özellik haritaları oluşturmak için bir görüntüye filtreler (veya çekirdekler) uygulayarak çalışır. Bu ağlar birçok yaygın bilgisayarla görme görevine güç vererek makinelerin görsel bilgileri artan bir doğrulukla analiz etmesini sağlar.

Bilgisayarla Görme ve Görüntü İşleme

Birbiriyle yakından ilişkili olsa da bilgisayarla görme ve görüntü işleme aynı şey değildir. Görüntü işleme, dijital görüntüleri geliştirmek veya faydalı bilgiler çıkarmak için manipüle etmeye odaklanan bir CV alt kümesidir. Bir görüntüyü netleştirme, bulanıklaştırma veya filtreleme gibi işlemleri içerir. Buna karşılık, bilgisayarla görme, görüntünün içeriğini yorumlamayı ve anlamayı amaçlayarak bir adım daha ileri gider. Örneğin, görüntü işleme bir fotoğrafın kalitesini artırmak için kullanılabilirken, bilgisayarlı görü bu fotoğraftaki insanları, nesneleri ve sahneyi tanımlamak için kullanılır. Dijital görüntü işlemeye ilişkin bu ayrıntılı genel bakışta ayrım hakkında daha fazla bilgi edinebilirsiniz.

Bilgisayarla Görme Alanındaki Temel Görevler

Bilgisayarla görme, makinelerin görsel verileri analiz etmesine ve yorumlamasına olanak tanıyan birkaç temel görevi kapsar:

  • Nesne Algılama: Bu, bir görüntü veya video içindeki nesnelerin tanımlanmasını ve konumlandırılmasını içerir. Ultralytics YOLO gibi bir model, algılanan her nesnenin etrafına bir sınırlayıcı kutu çizer ve ona bir sınıf etiketi atar.
  • Görüntü Sınıflandırma: Bu görev, önceden tanımlanmış bir kategori kümesinden tüm bir görüntüye tek bir etiket atamayı içerir. Örneğin, bir görüntüyü "kedi" veya "köpek" içerecek şekilde sınıflandırmak gibi.
  • Görüntü Segmentasyonu: Nesne algılamanın aksine, segmentasyon bir görüntüdeki her bir pikseli sınıflandırır. Görüntünün içeriğinin çok daha ayrıntılı bir şekilde anlaşılmasını sağlar. Alt görevler arasında örnek segmentasyonu ve semantik segmentasyon bulunur.
  • Poz Tahmini: Bu, bir kişinin veya nesnenin uzaydaki konumunu ve yönünü belirlemek için kullanılır. Robotik, artırılmış gerçeklik ve insan aktivite analizinde yaygın olarak kullanılır.
  • Nesne Takibi: Bu görev, bir video dizisinde zaman içinde bir veya daha fazla nesneyi takip etmeyi içerir. Gözetim ve otonom navigasyon gibi uygulamalar için çok önemlidir.

Gerçek Dünya Uygulamaları

Bilgisayarla görme uygulamaları çeşitli sektörlerde giderek yaygınlaşmaktadır:

Araçlar ve Çerçeveler

Bilgisayarla görme modellerinin geliştirilmesi ve dağıtılması çeşitli araçlar ve çerçevelerle daha kolay hale getirilmiştir. PyTorch ( PyTorch resmi sitesini ziyaret edin) ve TensorFlow ( TensorFlow resmi sitesini ziyaret edin) gibi kütüphaneler model oluşturmak için temeldir. OpenCV gibi açık kaynaklı kütüphaneler, gerçek zamanlı bilgisayarla görme için geniş bir işlev koleksiyonu sağlar.

Ultralytics HUB gibi platformlar, veri kümelerini yönetmekten ve özel modelleri eğitmekten dağıtıma kadar bir CV projesinin tüm yaşam döngüsünü kolaylaştırır. ONNX gibi standartlaştırılmış formatların kullanılması, farklı çerçeveler arasında birlikte çalışabilirliğin sağlanmasına da yardımcı olur. Bu teknolojiler olgunlaştıkça, sektörler genelinde inovasyonu teşvik etmeye devam edecektir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı