Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

U-Net

Semantik segmentasyon için güçlü CNN mimarisi olan U-Net'i keşfedin. Tıbbi, uydu ve otonom görüntülemedeki uygulamalarını öğrenin.

U-Net, aşağıdakiler için özel bir mimaridir konvolüsyonel sinir ağları (CNN'ler) olarak bilinen hassas, piksel düzeyinde sınıflandırma yapmak için tasarlanmıştır. anlamsal segmentasyon. Bir görüntünün tamamına tek bir etiket atayan geleneksel sınıflandırma modellerinin aksine, U-Net Her piksel, nesnelerin tam şeklini ve konumunu özetleyen ayrıntılı bir harita oluşturur. Başlangıçta aşağıdakiler için geliştirilmiştir biyomedikal görüntü analizi alanında temel bir yapı haline gelmiştir. bilgisayarla görme (CV) nedeniyle kısıtlı imkanlarla etkin çalışma becerisi eğitim verileri verirken yüksek çözünürlüklü sonuçlar.

U Şeklinde Mimari

"U-Net" adı, standart bir ağı değiştiren simetrik, U şeklindeki diyagramından türetilmiştir. autoencoder tasarım. Mimari özellikleri çıkarmak ve görüntüyü ayrıntılı bir şekilde yeniden yapılandırmak için işbirliği yapan üç ana bölümden oluşur segmentasyon maskeleri.

  • Sözleşme Yolu (Kodlayıcı): "U "nun sol tarafı geleneksel bir CNN olarak işlev görür backbone. Tekrarlanan uygulamalar konvolüsyon ve havuzlama işlemleri görüntünün uzamsal boyutlarını kademeli olarak azaltmak için. olarak bilinen bu süreç alt örneklemesayısını artırır. özellik haritaları her katmanda, modelin görüntüde "ne" olduğu hakkında karmaşık, üst düzey bağlamı öğrenmesine olanak tanır.
  • Genişleyen Yol (Kod Çözücü): Mimarinin sağ tarafı kodlayıcıyı yansıtır ancak şunları gerçekleştirir ters işlem. Özelliklerin çözünürlüğünü orijinal çözünürlüğe yükseltmek için yukarı evrişim katmanlarını kullanır. giriş boyutu. Bu yukarı örnekleme adımı aşağıdakiler için çok önemlidir Bağlamı daha yüksek çözünürlüklü katmanlara yayarak ağın nesnelerin "nerede" olduğunu anlamasına yardımcı olur bulundu.
  • Bağlantıları Atlayın: U-Net'in tanımlayıcı yeniliği bağlantıları atla. Bu bağlantılar, yüksek çözünürlüklü özellik haritalarını sözleşme yolundan doğrudan genişleyen yoldaki karşılık gelen katmanlar. Bu mekanizma, ince taneli uzamsal bilgileri korur. tipik olarak alt örnekleme sırasında kaybolur ve keskin, doğru sınırların oluşturulmasını sağlar.

Gerçek Dünya Uygulamaları

U-Net, ufuk açıcı makalede tanıtıldı "U-Net: Biyomedikal Görüntü Segmentasyonu için Evrişimsel Ağlar" ve o zamandan beri hassas üretim gerektiren çok sayıda sektöre uyarlanmıştır. YERELLEŞTİRME.

Tıbbi Görüntü Analizi

Sağlık hizmetlerinde hassasiyet kritik önem taşır. U-Net şu alanlarda yaygın olarak kullanılmaktadır tibbi̇ görüntü anali̇zi̇ için anormalliklerin tespitini otomatikleştirir. Örneğin, MRI'daki tümörleri segmentlere ayırarak radyologların iş akışlarına yardımcı olur taramaları veya mikroskopi görüntülerinde tek tek hücrelerin sayılması, bu alandaki gelişmeleri Sağlık hizmetlerinde yapay zeka.

Jeo-uzamsal ve Uydu İzleme

Mimari ayrıca aşağıdakiler için de hayati önem taşır uydu görüntülerini analiz etme. U-Net modelleri, su, orman ve kentsel alanlar arasında ayrım yaparak arazi örtüsü türlerini segment ayırabilir. ormansızlaşma veya mahsul sağlığının izlenmesi için akıllı tarım.

İlgili Terimlerden Ayrım

U-Net'i anlamak, onu diğer görme görevlerinden ayırmayı gerektirir:

  • U-Net ve Nesne Algılama: Bir yandan nesne algılama modeller bulun dikdörtgen kullanarak nesneler sınırlayıcı kutularU-Net, nesnenin tam konturlarını izleyen piksel mükemmelliğinde bir maske üretir.
  • U-Net ve Örnek Segmentasyonu: Standart U-Net anlamsal segmentasyon gerçekleştirerek tüm aynı sınıftaki nesneleri (örneğin, tüm arabalar) tek bir bölge olarak gösterir. Tam tersine, örnek segmentasyonu aynı sınıftaki bireysel nesneler arasında ayrım yapar. Gibi modern mimariler YOLO11 her ikisini de idare etmek için evrimleşmiştir algılama ve segmentasyon görevlerini yüksek verimlilikle gerçekleştirir.

Ultralytics ile Modern Segmentasyon

Ham bir U-Net uygulamak genellikle aşağıdaki gibi çerçevelerde ayrıntılı kod yazmayı içerir PyTorch veya TensorFlowmodern kütüphaneler bu süreci basitleştirir. Ultralytics ekosistemi aşağıdakileri sağlayan optimize edilmiş segmentasyon modelleri sunar gerçek zamanlı performans için benzer mimari ilkelerden yararlanır.

Aşağıdaki örnekte önceden eğitilmiş bir YOLO11 segmentasyon modeli üretmek için piksel düzeyinde maskeler:

from ultralytics import YOLO

# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image to detect and segment objects
results = model("path/to/image.jpg")

# Display the results with segmentation masks overlaid
results[0].show()

Bu kolaylaştırılmış iş akışı, geliştiricilerin karmaşık segmentasyon yeteneklerini aşağıdakiler için uygulamalara entegre etmelerine olanak tanır model dağıtımı uç cihazlarda. Bu modelleri özel veri kümeleri üzerinde eğitirken veri artırımı son derece önlemek için tavsiye edilir aşırı uyumhassas piksel düzeyinde ek açıklamalarla çalışırken karşılaşılan yaygın bir zorluktur.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın