YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Video Anlama

Videodaki eylemleri ve olayları yorumlayan gelişmiş yapay zeka olan Video Anlamayı keşfedin. Nasıl çalıştığını ve otonom sürüş ve akıllı güvenlikteki uygulamalara nasıl güç verdiğini öğrenin.

Video Anlama, makinelerin videoların içeriğini otomatik olarak yorumlamasını ve analiz etmesini sağlayan gelişmiş bir Yapay Zeka (AI) ve Bilgisayarlı Görü (CV) alanıdır. Statik görüntüleri işlemenin aksine, video anlama, yalnızca nesneleri değil, aynı zamanda eylemlerini, etkileşimlerini ve olayların zamansal bağlamını tanımak için kare dizilerini analiz etmeyi içerir. İnsanların dinamik sahneleri algılayıp yorumlamasına çok benzer şekilde, video verilerinin bütünsel bir şekilde anlaşılmasını amaçlar. Bu yetenek, otonom araçlardan otomatik gözetim ve içerik denetimine kadar çok çeşitli uygulamalar için temel oluşturur.

Video Anlama Nasıl Çalışır

Video anlama sistemleri, görsel ve zamansal bilgileri işlemek ve yorumlamak için tipik olarak birden fazla AI tekniğini entegre eder. Süreç, tek tek video karelerinde gerçekleştirilen temel bilgisayarlı görü görevleriyle başlar. Bu görevler genellikle şunları içerir:

  • Nesne Tespiti: Her bir karedeki nesneleri tanımlama ve konumlandırma. Ultralytics YOLO gibi modeller bu ilk adım için oldukça etkilidir.
  • Nesne İzleme: Hareketlerini ve kalıcılıklarını anlamak için tanımlanan nesnelerin bir dizi kare boyunca takip edilmesi.
  • Poz Tahmini (Pose Estimation): İnsan vücutlarının duruşunu ve kilit noktalarını tanıma, insan eylemlerini analiz etmek için çok önemlidir.
  • Görüntü Bölütleme: Nesnelerin kesin şeklini ve sınırlarını anlamak için bir çerçevedeki her pikseli sınıflandırma.

Bu mekansal özellikler çıkarıldıktan sonra, sistem bunları zaman içinde Tekrarlayan Sinir Ağları (RNN'ler) veya modern mimarilerde daha yaygın olarak kullanılan Transformer ağları gibi sıralı veriler için tasarlanmış modelleri kullanarak analiz eder. Bu modeller, nesnelerin ve sahnelerin nasıl değiştiğine dair kalıpları belirleyerek, eylem tanıma, olay algılama ve video özetleme gibi daha üst düzey görevleri mümkün kılar. 3B Evrişimli Sinir Ağları gibi bazı gelişmiş mimariler, mekansal ve zamansal özellikleri aynı anda öğrenmek için tasarlanmıştır. Tüm süreç, verimli eğitim, dağıtım ve izleme sağlamak için uyumlu bir Makine Öğrenimi Operasyonları (MLOps) çerçevesi içinde yönetilir.

Video Anlama - İlgili Kavramlar Karşılaştırması

Video Anlama'nın diğer ilgili bilgisayarlı görü görevlerinden ayırt edilmesi önemlidir.

  • Video Anlama - Nesne Tespiti/Takibi Karşılaştırması: Nesne tespiti tek bir karede ne olduğunu belirler ve nesne takibi bu nesneleri birden çok karede takip eder. Video Anlama, neden sorusunu yorumlamak için bu görevlerin çıktılarını kullanır—zaman içinde meydana gelen eylemler, olaylar ve etkileşimler. Örneğin, bir kişiyi takip etmek nesne takibidir; kişinin bir kapıyı açtığını belirlemek video anlamadır.
  • Video Anlama - Görüntü Tanıma Karşılaştırması: Görüntü Tanıma, tek bir statik görüntüdeki nesneleri veya sahneleri sınıflandırmaya odaklanır. Video Anlama ise bu kavramı zaman boyutuna taşıyarak, dinamik olayları anlamak için bir dizi görüntüyü analiz eder. Sadece "ne" olduğunu değil, aynı zamanda "nasıl" ve "ne zaman" olduğunu da anlamayı gerektirir.
  • Video Anlama - Metinden Videoya Karşılaştırması: Metinden Videoya, metinsel açıklamalardan video içeriği oluşturan bir üretken yapay zeka görevidir. Aksine, video anlama, mevcut video içeriğinden anlam çıkaran ve açıklamalar veya yapılandırılmış veriler üreten analitik bir görevdir.

Gerçek Dünya Uygulamaları

Video anlama, çeşitli sektörlerde giderek artan sayıda yenilikçi çözüme güç veriyor.

  1. Akıllı Gözetim ve Güvenlik: Güvenlik uygulamalarında, video anlama sistemleri olağandışı faaliyetleri otomatik olarak tespit edebilir. Örneğin, bir sistem bir hastanedeki gözetim akışlarını izleyerek bir hastanın ne zaman düştüğünü belirleyebilir veya bir perakende mağazasındaki trafiği analiz ederek hırsızlığı tespit edebilir. Bu sistemler, eylemlerin bağlamını anlayarak basit hareket algılamanın ötesine geçer, yanlış alarmları önemli ölçüde azaltır ve daha hızlı yanıtlar sağlar. Ultralytics YOLO11 ile akıllı gözetimi geliştirme hakkında daha fazla bilgi edinebilirsiniz.
  2. Otonom Sürüş: Kendi kendine giden arabalar için yolu anlamak kritik öneme sahiptir. Video anlama modelleri, yayaların niyetlerini tahmin etmek, diğer araçların davranışlarını yorumlamak ve karmaşık senaryolarda trafik sinyallerini tanımak için kameralardan gelen yayınları analiz eder. Bu derinlemesine anlama düzeyi, güvenli ve güvenilir navigasyon için gereklidir. Bu alan genellikle otonom sistemler için eylem tanıma alanındaki kapsamlı araştırmalara dayanır.

Diğer uygulamalar arasında uygunsuz videoları işaretleyerek sosyal medya platformlarında içerik denetimi, oyunun önemli anlarını özetleyerek spor analitiği ve eğlencede etkileşimli deneyimler oluşturma yer alır. Ultralytics HUB gibi platformlar, bu özel görevler için özel modelleri eğitmek için araçlar sağlarken, TensorRT gibi araçlarla entegrasyonlar bunları gerçek zamanlı çıkarım için optimize eder.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı