Bilgisayar Görme (CV) temellerini keşfedin. Ultralytics ve Ultralytics nesne algılama, segmentasyon ve daha fazlasını nasıl mümkün kıldığını öğrenin.
Bilgisayar Görme (CV), Yapay Zeka (AI) alanının sofistike bir dalıdır ve bilgisayarların ve sistemlerin dijital görüntüler, videolar ve diğer görsel girdilerden anlamlı bilgiler elde etmesini sağlar. İnsan görme yetisi, çevreyi anında algılama ve anlama konusunda doğuştan gelen bir yeteneğe sahipken, bilgisayarlar desenleri tanımak ve pikselleri yorumlamak için eğitilmelidir. Makine Öğrenimi (ML) ve özellikle Derin Öğrenme (DL) algoritmalarından yararlanarak, CV sistemleri görsel verileri alabilir, işleyebilir ve bu bilgilere dayalı olarak önerilerde bulunabilir veya eylemlerde bulunabilir.
Temelinde, bir bilgisayar bir görüntüyü pikselleri temsil eden sayısal değerler dizisi olarak görür. Modern CV, insan beynindeki nöronların bağlantı modelini taklit etmek için tasarlanmış Convolutional Neural Networks (CNN) adlı sinir ağlarına büyük ölçüde dayanır. Bu ağlar, özellik çıkarma adı verilen bir süreç aracılığıyla basit kenar ve dokulardan karmaşık şekil ve nesnelere kadar bir dizi özelliği tanımlamayı öğrenir.
Etkili bir şekilde çalışabilmek için, bu modeller çok büyük miktarda eğitim verisine ihtiyaç duyar. Örneğin, bir arabayı tanıyabilmek için, bir model çeşitli koşullarda binlerce etiketli araba görüntüsünü işlemelidir. Ultralytics gibi araçlar bu iş akışını kolaylaştırarak, kullanıcıların veri kümelerine açıklama eklemesine, modelleri bulutta eğitmesine ve bunları verimli bir şekilde kullanmasına olanak tanır.
Bilgisayar görme tek bir işlev değil, her biri belirli bir sorunu çözen farklı görevlerin bir koleksiyonudur:
Bilgisayar görüşünün kullanımı, daha önce insan gözü gerektiren görevleri otomatikleştirerek, neredeyse her sektöre yayılmıştır. göz.
CV ile Görüntü İşleme'yi birbirinden ayırmak önemlidir, ancak bunlar genellikle birlikte çalışır.
Modern kütüphaneler, güçlü CV modellerinin uygulanmasını erişilebilir hale getirmiştir. Aşağıdaki örnek,
son teknoloji YOLO26 görüntüdeki detect için model
kullanarak ultralytics Paket.
from ultralytics import YOLO
# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on a standard example image
# The model identifies objects and their locations
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with bounding boxes
results[0].show()
Bu basit komut dosyası, önceden eğitilmiş bir modeli kullanarak karmaşık çıkarım görevlerini yerine getirir ve modern AI araçlarının erişilebilirliğini göstermektedir. Statik görüntülerin ötesine geçmek isteyen geliştiriciler için CV, güvenlik ve spor analizlerinde kullanılan Video Anlama ve gerçek zamanlı izleme sistemlerini de desteklemektedir. OpenCVgibi kütüphanelerle entegre ederek, geliştiriciler görsel dünyayı yakalayan, işleyen ve analiz eden kapsamlı uygulamalar oluşturabilirler.