Sözlük

Bilgisayarlı Görü (CV)

Bilgisayar Görme (CV) temellerini keşfedin. Ultralytics ve Ultralytics nesne algılama, segmentasyon ve daha fazlasını nasıl mümkün kıldığını öğrenin.

Bilgisayar Görme (CV), Yapay Zeka (AI) alanının sofistike bir dalıdır ve bilgisayarların ve sistemlerin dijital görüntüler, videolar ve diğer görsel girdilerden anlamlı bilgiler elde etmesini sağlar. İnsan görme yetisi, çevreyi anında algılama ve anlama konusunda doğuştan gelen bir yeteneğe sahipken, bilgisayarlar desenleri tanımak ve pikselleri yorumlamak için eğitilmelidir. Makine Öğrenimi (ML) ve özellikle Derin Öğrenme (DL) algoritmalarından yararlanarak, CV sistemleri görsel verileri alabilir, işleyebilir ve bu bilgilere dayalı olarak önerilerde bulunabilir veya eylemlerde bulunabilir.

Bilgisayarlı Görü Nasıl Çalışır?

Temelinde, bir bilgisayar bir görüntüyü pikselleri temsil eden sayısal değerler dizisi olarak görür. Modern CV, insan beynindeki nöronların bağlantı modelini taklit etmek için tasarlanmış Convolutional Neural Networks (CNN) adlı sinir ağlarına büyük ölçüde dayanır. Bu ağlar, özellik çıkarma adı verilen bir süreç aracılığıyla basit kenar ve dokulardan karmaşık şekil ve nesnelere kadar bir dizi özelliği tanımlamayı öğrenir.

Etkili bir şekilde çalışabilmek için, bu modeller çok büyük miktarda eğitim verisine ihtiyaç duyar. Örneğin, bir arabayı tanıyabilmek için, bir model çeşitli koşullarda binlerce etiketli araba görüntüsünü işlemelidir. Ultralytics gibi araçlar bu iş akışını kolaylaştırarak, kullanıcıların veri kümelerine açıklama eklemesine, modelleri bulutta eğitmesine ve bunları verimli bir şekilde kullanmasına olanak tanır.

Bilgisayarla Görme Alanındaki Temel Görevler

Bilgisayar görme tek bir işlev değil, her biri belirli bir sorunu çözen farklı görevlerin bir koleksiyonudur:

Görüntü Sınıflandırma: Bu görev, tüm görüntüye bir sınıf etiketi atayarak "Bu resimde ne var?" sorusuna cevap verir (örneğin, kedi ile köpeği ayırt etmek).
Nesne Algılama: Bir adım daha ileri giderek, algılama, bir görüntüdeki farklı nesneleri tanımlar ve etraflarına bir sınır kutusu çizer. Bu, öğeleri saymak veya belirli özellikleri bulmak için çok önemlidir.
Örnek Segmentasyonu: Bu, algılanan her nesne için hassas piksel düzeyinde bir maske sağlayarak aynı sınıftaki tek tek örnekleri ayırır. Tıbbi görüntülerin analiz edilmesi gibi yüksek hassasiyet gerektiren uygulamalar için hayati önem taşır . .
Poz Tahmini: Bu, track ve duruşu track için insan vücudunun eklemleri gibi bir nesne üzerindeki belirli kilit noktaları tespit etmeyi içerir.

Gerçek Dünya Uygulamaları

Bilgisayar görüşünün kullanımı, daha önce insan gözü gerektiren görevleri otomatikleştirerek, neredeyse her sektöre yayılmıştır. göz.

Üretim ve Kalite Kontrol: Endüstriyel ortamlarda CV genellikle Makine Görme olarak adlandırılır. Kalite kontrolünü otomatikleştirmek, montaj hattındaki ürünlerdeki küçük kusurları insan denetçilerden daha hızlı ve daha doğru bir şekilde tespit etmek için kullanılır. Örneğin, Üretimde AI, arızaları önlemek için ekipmanın gerçek zamanlı olarak izlenmesini sağlar.
Otonom Ulaşım: Otonom araçlar, güvenli bir şekilde yol alabilmek için tamamen CV'ye güveniyor. Kameralar ve LiDAR sensörlerinden gelen girdileri işleyerek, bu araçlar 3D Nesne Algılama özelliğini kullanarak yayaları, diğer araçları ve trafik işaretlerini gerçek zamanlı olarak tanımlıyor. Bu, yüksek düzeyde araç otomasyonu elde etmenin kritik bir bileşenidir.
Sağlık ve Teşhis: Radyologlar, X-ışınları, MRG'ler ve BT taramalarındaki anormallikleri tespit etmek için CV'yi kullanır. Sağlık alanında yapay zeka, çıplak gözle görülmeyebilecek bölgeleri vurgulayarak tümörleri tespit etmek gibi hastalıkların erken teşhisinde yardımcı olur.

Bilgisayarlı Görü ve Görüntü İşleme

CV ile Görüntü İşleme'yi birbirinden ayırmak önemlidir, ancak bunlar genellikle birlikte çalışır.

Görüntü işleme, bir görüntüyü iyileştirmek veya bilgileri çıkarmak için görüntüyü manipüle etmeyi içerir (örneğin, parlaklığı, kontrastı ayarlamak veya Adobe Photoshop'taki gibi filtreler uygulamak). Çıktı genellikle başka bir görüntüdür.
Bilgisayar Görme, bir görüntüyü girdi olarak alır ve bilgi veya bir yorum (örneğin, "Bu odada üç kişi var") çıkarır. CV, görüntü işleme tekniklerini kullanarak görüntüleri Sinir Ağları tarafından analiz edilmek üzere hazırlar.

Python ile Bilgisayar Görme Uygulaması

Modern kütüphaneler, güçlü CV modellerinin uygulanmasını erişilebilir hale getirmiştir. Aşağıdaki örnek, son teknoloji YOLO26 görüntüdeki detect için model kullanarak ultralytics Paket.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on a standard example image
# The model identifies objects and their locations
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with bounding boxes
results[0].show()

Bu basit komut dosyası, önceden eğitilmiş bir modeli kullanarak karmaşık çıkarım görevlerini yerine getirir ve modern AI araçlarının erişilebilirliğini göstermektedir. Statik görüntülerin ötesine geçmek isteyen geliştiriciler için CV, güvenlik ve spor analizlerinde kullanılan Video Anlama ve gerçek zamanlı izleme sistemlerini de desteklemektedir. OpenCVgibi kütüphanelerle entegre ederek, geliştiriciler görsel dünyayı yakalayan, işleyen ve analiz eden kapsamlı uygulamalar oluşturabilirler.

Bilgisayarlı Görü (CV)

Sektörler arası iş akışlarını kolaylaştırmak için Ultralytics YOLO modellerini eğitin

Yeniliklerinizi güçlendirmek için esnek kurumsal lisanslama çözümü

Ultralytics YOLO ile yapay zeka modellerini saniyeler içinde eğitin

Bilgisayarlı Görü Nasıl Çalışır?

Bilgisayarla Görme Alanındaki Temel Görevler

Gerçek Dünya Uygulamaları

Bilgisayarlı Görü ve Görüntü İşleme

Python ile Bilgisayar Görme Uygulaması

Bu kategoride daha fazla okuyun

Bilgisayar görme teknolojisi ile desteklenen 12 hava görüntüsü kullanım örneği

Monoküler derinlik tahmini nedir? Genel bakış

AI tehdit tespiti için Ultralytics YOLO kullanımına bir bakış

Ultralytics topluluğuna katılın