YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024

Meta AI'nın Segment Anything Model 2'sinin (SAM 2) Uygulamaları

Abirami Vina

5 dakikalık okuma

31 Temmuz 2024

Meta AI'nın Segment Anything Model 2 (SAM 2) modeline dalarken bize katılın ve çeşitli sektörlerde hangi gerçek zamanlı uygulamalar için kullanılabileceğini anlayın.

29 Temmuz 2024'te Meta AI, Segment Anything Model'in ikinci versiyonu olan SAM 2'yi yayınladı. Yeni model, hem resimlerde hem de videolarda bir hedef nesneye hangi piksellerin ait olduğunu belirleyebilir! En iyi yanı, modelin bir videonun tüm kareleri boyunca bir nesneyi tutarlı bir şekilde takip edebilmesidir. SAM 2, video düzenleme, karma gerçeklik deneyimleri ve bilgisayarlı görü sistemlerini eğitmek için görsel verilerin daha hızlı etiketlenmesi için heyecan verici olanaklar sunuyor.

Deniz bilimi, uydu görüntüleme ve tıp gibi alanlarda kullanılan orijinal SAM'in başarısı üzerine inşa edilen SAM 2, hızlı hareket eden nesneler ve görünümdeki değişiklikler gibi zorlukların üstesinden geliyor. Geliştirilmiş doğruluğu ve verimliliği, onu çok çeşitli uygulamalar için çok yönlü bir araç haline getiriyor. Bu makalede, SAM 2'nin nerede uygulanabileceğine ve yapay zeka topluluğu için neden önemli olduğuna odaklanacağız.

SAM 2 nedir?

Segment Anything Model 2, hem görüntülerde hem de videolarda istemlenebilir görsel segmentasyonu veya PVS'yi destekleyen gelişmiş bir temel modeldir. PVS, bir modelin kullanıcı tarafından verilen belirli istemlere veya girdilere göre bir görüntünün veya videonun farklı bölümlerini segmentlere ayırabildiği veya tanımlayabildiği bir tekniktir. Bu istemler, ilgi alanını vurgulayan tıklamalar, kutular veya maskeler şeklinde olabilir. Model daha sonra belirtilen alanın ana hatlarını çizen bir segmentasyon maskesi oluşturur.

SAM 2 mimarisi, görüntü segmentasyonundan video segmentasyonunu da içerecek şekilde genişleyerek orijinal SAM üzerine inşa edilmiştir. Görüntü verilerini ve istemleri kullanarak segmentasyon maskeleri oluşturan hafif bir maske kod çözücüsüne sahiptir. Videolar için SAM 2, önceki karelerden bilgileri hatırlamasına yardımcı olan ve zaman içinde doğru takibi sağlayan bir bellek sistemi sunar. Bellek sistemi, bölümlere ayrılan nesnelerle ilgili ayrıntıları depolayan ve geri çağıran bileşenler içerir. SAM 2 ayrıca örtüşmeleri işleyebilir, nesneleri birden çok kare boyunca takip edebilir ve çeşitli olası maskeler oluşturarak belirsiz istemleri yönetebilir. SAM 2'nin gelişmiş mimarisi, onu hem statik hem de dinamik görsel ortamlarda oldukça yetenekli kılar.

Özellikle, video segmentasyonu ile ilgili olarak, SAM 2, önceki yöntemlere kıyasla üç kat daha az kullanıcı etkileşimi ile daha yüksek bir doğruluk elde eder. Görüntü segmentasyonu için SAM 2, orijinal Segment Anything Model'den (SAM) altı kat daha hızlı ve daha doğru performans gösterir. Bu gelişme, SAM'in daha önce test edildiği 23'ü de dahil olmak üzere 37 farklı veri kümesinde SAM 2 araştırma makalesinde sergilendi. 

Şekil 1. SAM ve SAM 2'nin karşılaştırılması.

İlginç bir şekilde, Meta AI'nın SAM 2'si, bugüne kadarki en büyük video segmentasyon veri kümesi olan SA-V veri kümesini oluşturarak geliştirildi. Kapsamlı veri kümesi, 50.000'den fazla video ve 35,5 milyon segmentasyon maskesi içeriyor ve etkileşimli kullanıcı katkılarıyla toplandı. Etiketleyiciler, modelin çok çeşitli senaryolardan ve nesne türlerinden öğrenmesine yardımcı olmak için istemler ve düzeltmeler sağladı.

Segment Anything Model 2'nin Uygulamaları

Görüntü ve video segmentasyonundaki gelişmiş yetenekleri sayesinde, SAM 2 çeşitli sektörlerde kullanılabilir. Bu uygulamalardan bazılarını keşfedelim.

SAM 2, Artırılmış Gerçeklik (AR) ve Sanal Gerçekliği (VR) mümkün kılar

Meta AI'nın yeni segmentasyon modeli, Artırılmış Gerçeklik (AR) ve Sanal Gerçeklik (VR) uygulamaları için kullanılabilir. Örneğin, SAM 2 gerçek dünyadaki nesneleri doğru bir şekilde tanımlayabilir ve segmentlere ayırabilir ve sanal nesnelerle etkileşimi daha gerçekçi hale getirebilir. Sanal ve gerçek unsurlar arasında gerçekçi bir etkileşimin gerekli olduğu oyun, eğitim ve eğitim gibi çeşitli alanlarda faydalı olabilir.

AR gözlükleri gibi cihazlar daha da gelişirken, SAM 2'nin yetenekleri yakında bunlara entegre edilebilir. Gözlüklerinizi taktığınızı ve oturma odanıza baktığınızı hayal edin. Gözlükleriniz köpeğinizin su kabını bölümlere ayırıp fark ettiğinde, aşağıdaki resimde gösterildiği gibi, onu doldurmanızı hatırlatabilir. Veya yeni bir yemek tarifi pişiriyorsanız, gözlükler tezgahınızdaki malzemeleri tanımlayabilir ve pişirme deneyiminizi iyileştirerek ve gerekli tüm öğelere sahip olduğunuzdan emin olarak adım adım talimatlar ve ipuçları sağlayabilir.

Şekil 2. SAM 2 yakında AR gözlüklerinde kullanılabilir.

Segment Anything Model 2 ile sonar görüntüleme

SAM modeli kullanılarak yapılan araştırmalar, modelin sonar görüntüleme gibi özel alanlarda uygulanabileceğini göstermiştir. Sonar görüntüleme, düşük çözünürlüğü, yüksek gürültü seviyeleri ve görüntülerdeki nesnelerin karmaşık şekilleri nedeniyle benzersiz zorluklar içerir. Araştırmacılar, SAM'i sonar görüntüleri için ince ayar yaparak, deniz döküntüleri, jeolojik oluşumlar ve diğer ilgi çekici öğeler gibi çeşitli su altı nesnelerini doğru bir şekilde bölümlere ayırma yeteneğini göstermişlerdir. Hassas ve güvenilir su altı görüntüleme, deniz araştırmalarında, su altı arkeolojisinde, balıkçılık yönetiminde ve habitat haritalama, eser keşfi ve tehdit algılama gibi görevler için gözetimde kullanılabilir.

Şekil 3. Sonar görüntülerinin segmentasyonu için ince ayarlı SAM kullanımına bir örnek.

SAM 2, SAM'in karşılaştığı zorlukların çoğunu temel alıp geliştirdiği için, sonar görüntülemesinin analizini daha da geliştirme potansiyeline sahiptir. Hassas segmentasyon yetenekleri, bilimsel araştırma ve balıkçılık dahil olmak üzere çeşitli denizcilik uygulamalarında yardımcı olabilir. Örneğin, SAM 2 su altı yapılarını etkili bir şekilde ana hatlarıyla belirleyebilir, deniz döküntülerini tespit edebilir ve ileriye dönük sonar görüntülerindeki nesneleri tanımlayarak daha doğru ve verimli su altı keşif ve izlemeye katkıda bulunabilir.

SAM 2'yi sonar görüntülemeyi analiz etmek için kullanmanın potansiyel faydaları şunlardır:

  • Verimlilik: Manuel segmentasyon için gereken süreyi ve çabayı azaltır, profesyonellerin analiz ve karar almaya daha fazla odaklanmasını sağlar.
  • Tutarlılık: Geniş ölçekli deniz araştırmaları ve izleme için gerekli olan tutarlı ve tekrarlanabilir segmentasyon sonuçları sağlar.
  • Çok yönlülük: Çok çeşitli sonar görüntülerini işleyebilme özelliği, onu deniz bilimi ve endüstrisindeki çeşitli uygulamalar için kullanışlı kılar.

SAM 2'yi sonar görüntüleme süreçlerine entegre ederek, denizcilik endüstrisi su altı araştırmalarında ve analizlerinde daha yüksek verimlilik, doğruluk ve güvenilirlik elde edebilir ve sonuç olarak deniz araştırmalarında daha iyi sonuçlara yol açabilir.

Otonom araçlarda SAM 2'yi kullanma

SAM 2'nin bir diğer uygulama alanı da otonom araçlardır. SAM 2, yayalar, diğer araçlar, yol işaretleri ve engeller gibi nesneleri gerçek zamanlı olarak doğru bir şekilde tanımlayabilir. SAM 2'nin sağlayabileceği detay düzeyi, güvenli navigasyon ve çarpışma önleme kararları almak için çok önemlidir. SAM 2, görsel verileri hassas bir şekilde işleyerek, çevrenin ayrıntılı ve güvenilir bir haritasını oluşturmaya yardımcı olur ve daha iyi karar almaya yol açar.

Şekil 4. Trafiği anlamak için segmentasyon kullanılıyor. 

SAM 2'nin farklı aydınlatma koşullarında, hava değişikliklerinde ve dinamik ortamlarda iyi çalışma yeteneği, onu otonom araçlar için güvenilir kılar. İster yoğun bir şehir caddesi ister sisli bir otoyol olsun, SAM 2, aracın çeşitli durumlara doğru şekilde yanıt verebilmesi için nesneleri sürekli olarak doğru bir şekilde tanımlayabilir ve segmentlere ayırabilir. 

Ancak, akılda tutulması gereken bazı sınırlamalar vardır. Karmaşık, hızlı hareket eden nesneler için SAM 2 bazen ince ayrıntıları kaçırabilir ve tahminleri çerçeveler arasında kararsız hale gelebilir. Ayrıca, SAM 2 bazen kalabalık sahnelerde birbirine benzeyen birden fazla nesneyi karıştırabilir. Bu zorluklar, otonom sürüş uygulamalarında ek sensörlerin ve teknolojilerin entegrasyonunun neden çok önemli olduğunu göstermektedir.

SAM 2 yardımıyla çevresel izleme

Bilgisayarlı görü kullanarak çevresel izleme zor olabilir, özellikle de açıklanmış veri eksikliği olduğunda, ancak bu aynı zamanda SAM 2 için ilginç bir uygulama olmasını sağlıyor. SAM 2, ormanlar, su kütleleri, kentsel alanlar ve tarım arazileri gibi çeşitli çevresel özellikleri uydu veya drone görüntülerinden doğru bir şekilde bölümlendirerek ve tanımlayarak doğal peyzajlardaki değişiklikleri izlemek ve analiz etmek için kullanılabilir. Özellikle, hassas bölümlendirme, orman tahribatını, kentleşmeyi ve arazi kullanımındaki değişiklikleri zaman içinde izleyerek çevre koruma ve planlama için değerli veriler sağlamaya yardımcı olur.

İşte SAM 2 gibi bir modeli zaman içindeki çevresel değişiklikleri analiz etmek için kullanmanın bazı faydaları:

  • Erken Tespit: Çevresel bozulmanın erken belirtilerini tanımlar ve daha fazla hasarı önlemek için zamanında müdahalelere olanak tanır.
  • Kaynak yönetimi: Çeşitli çevresel özelliklerin durumu hakkında ayrıntılı bilgiler sağlayarak doğal kaynakların verimli bir şekilde yönetilmesine yardımcı olur.
  • Biyoçeşitlilik koruma: Yaban hayatının izlenmesine ve biyoçeşitliliğin gözlemlenmesine yardımcı olarak, koruma çalışmalarına ve nesli tükenmekte olan türlerin korunmasına katkıda bulunur.
  • Afet müdahalesi: Seller, orman yangınları ve kasırgalar gibi doğal afetlerin etkisini değerlendirmeye yardımcı olarak hızlı ve etkili afet müdahalesi ve iyileştirme planlaması sağlar.

SAM 2 ile video düzenleme: Kendiniz deneyin

Segment Anything 2 Demosu, modeli bir videoda denemek için harika bir yoldur. SAM 2'nin PVS özelliklerini kullanarak eski bir Ultralytics YouTube videosu aldık ve videodaki üç nesneyi veya kişiyi bölümlere ayırıp piksellerini bulanıklaştırabildik. Geleneksel olarak, videodan üç kişiyi çıkarmak zaman alıcı ve sıkıcı olurdu ve manuel kare kare maskeleme gerektirirdi. Ancak SAM 2 bu süreci basitleştiriyor. Demoda birkaç tıklama ile saniyeler içinde ilgi alanınızdaki üç nesnenin kimliğini koruyabilirsiniz.

Şekil 6. SAM 2 Demosunu deneme. 

Demo ayrıca, izleme için seçtiğiniz nesnelerin üzerine bir spot ışığı koymak ve izlenen nesneleri silmek gibi birkaç farklı görsel efekti denemenize olanak tanır. Demoyu beğendiyseniz ve SAM 2 ile yenilik yapmaya başlamaya hazırsanız, modelle uygulamalı olarak ilgilenme hakkında ayrıntılı talimatlar için Ultralytics SAM 2 model belgeleri sayfasına göz atın. Projelerinizde SAM 2'nin potansiyelinden tam olarak yararlanmak için özellikleri, kurulum adımlarını ve örnekleri keşfedin!

Özet

Meta AI'nın Segment Anything Model 2'si (SAM 2), video ve görüntü segmentasyonunda dönüşüm yaratıyor. Nesne takibi gibi görevler iyileştikçe, video düzenleme, karma gerçeklik, bilimsel araştırma ve tıbbi görüntülemede yeni fırsatlar keşfediyoruz. Karmaşık görevleri kolaylaştırarak ve açıklamaları hızlandırarak SAM 2, yapay zeka topluluğu için önemli bir araç olmaya hazırlanıyor. SAM 2 gibi modellerle keşfetmeye ve yenilik yapmaya devam ederken, çeşitli alanlarda daha da çığır açan uygulamalar ve gelişmeler bekleyebiliriz!

GitHub depomuzu keşfederek ve topluluğumuza katılarak yapay zeka hakkında daha fazla bilgi edinin. Üretim ve sağlık alanlarındaki yapay zeka hakkında ayrıntılı bilgiler için çözüm sayfalarımıza göz atın. 🚀

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Bağlantı panoya kopyalandı