EfficientNet nedir? Hızlı bir genel bakış.

Abirami Vina

6 dakika okuma

29 Ağustos 2025

EfficientNet mimarisini ve bileşik ölçeklendirme sihrini anlayın! Üst düzey görüntü sınıflandırma ve segmentasyon verimliliği için EfficientNet B0-B7'yi keşfedin.

2019 yılında Google AI'daki araştırmacılar, görüntülerdeki nesneleri ve desenleri tanımak için oluşturulmuş son teknoloji ürünü bir bilgisayarla görme modeli olan EfficientNet'i tanıttı. Öncelikle, bir görüntünün önceden tanımlanmış birkaç kategoriden birine atanmasını içeren görüntü sınıflandırması için tasarlanmıştır. Ancak günümüzde EfficientNet nesne algılama, segmentasyon ve transfer öğrenme gibi daha karmaşık görevler için de bir omurga görevi görüyor.

EfficientNet'ten önce, bu tür makine öğrenimi ve Vision AI modelleri daha fazla katman ekleyerek veya bu katmanların boyutunu artırarak doğruluğu artırmaya çalışıyordu. Katmanlar, bir sinir ağı modelinde (insan beyninden esinlenen bir tür derin öğrenme modeli) kalıpları öğrenmek ve doğruluğu artırmak için verileri işleyen adımlardır. 

Bu değişiklikler, geleneksel yapay zeka modellerini daha büyük ve daha yavaş hale getirerek bir ödünleşim yaratırken, ekstra doğruluk, gereken bilgi işlem gücündeki önemli artışa kıyasla genellikle minimum düzeydeydi.

EfficientNet farklı bir yaklaşım benimsemiştir. Derinliği (katman sayısı), genişliği (her katmandaki birim sayısı) ve görüntü çözünürlüğünü (girdi görüntülerinin ayrıntı düzeyi) dengeli bir şekilde birlikte artırdı. Bileşik ölçeklendirme adı verilen bu yöntem, mevcut tüm işlem gücünü güvenilir bir şekilde kullanır. Sonuç, ResNet veya DenseNet gibi eski modellerden daha iyi performans gösterebilen daha küçük ve daha hızlı bir modeldir.

Günümüzde Ultralytics YOLO11 gibi daha yeni bilgisayarla görme modelleri daha yüksek doğruluk, hız ve verimlilik sunmaktadır. Buna rağmen EfficientNet, birçok gelişmiş mimarinin tasarımını etkileyen önemli bir kilometre taşı olmaya devam etmektedir. 

Bu makalede EfficientNet'in nasıl çalıştığını, onu benzersiz kılanın ne olduğunu ve bilgisayarla görmede neden hala önemli olduğunu beş dakika içinde inceleyeceğiz. Hadi başlayalım!

EfficientNet nedir?

EfficientNet tasarlanmadan önce, çoğu görüntü tanıma modeli katmanlarını ayarlayarak veya daha fazla ayrıntı yakalamak için giriş görüntüsü boyutunu artırarak doğruluğu artırdı. Bu stratejiler sonuçları iyileştirirken, modelleri daha ağır ve daha zorlu hale getiriyordu. Bu da daha fazla belleğe ve daha iyi donanıma ihtiyaç duydukları anlamına geliyordu. 

EfficientNet, katmanları tek tek değiştirmek yerine, bileşik ölçekleme adı verilen bir yöntem kullanarak derinliği, genişliği ve görüntü çözünürlüğünü birlikte ölçeklendirir. Bu yaklaşım, modelin tek bir yöne aşırı yüklenmeden verimli bir şekilde büyümesini sağlar.

EfficientNet mimarisi görüntüleri, her biri daha küçük modüllerden oluşan bir dizi blok aracılığıyla işler. Her bloktaki modül sayısı model boyutuna bağlıdır. 

Şekil 1. EfficientNet'in yapı taşları.(Kaynak)

Daha küçük versiyonlarda daha az modül kullanılırken, daha büyük versiyonlarda modüller daha sık tekrarlanır. Bu esnek tasarım, EfficientNet'in mobil cihazlardan büyük ölçekli sistemlere kadar geniş bir uygulama yelpazesinde yüksek doğruluk ve verimlilik sunmasını sağlar.

Bileşik ölçeklendirme nasıl çalışır?

Bileşik ölçeklendirme yöntemi bir modelin derinliğini, genişliğini ve görüntü çözünürlüğünü genişletir ancak bunları dengede tutar. Bu da bilgi işlem gücünün verimli kullanılmasını mümkün kılıyor. Seri, EfficientNet-B0 adı verilen ve diğer tüm sürümler için temel teşkil eden daha küçük bir temel modelle başlıyor.

B0'dan itibaren modeller EfficientNet-B1'den EfficientNet-B7'ye kadar adlandırılan daha büyük varyantlara ölçeklenir. Her adımda ağ ek katmanlar kazanır, kanal sayısını (işleme için kullanılan birimler) artırır ve daha yüksek çözünürlüklü giriş görüntülerini işler. Her adımdaki büyüme miktarı, derinlik, genişlik ve çözünürlüğün bağımsız olarak değil sabit oranlarda artmasını sağlayan bileşik katsayı adı verilen bir parametre ile belirlenir.

Şekil 2. Bileşik ölçeklendirme bir modelin genişliğini, derinliğini ve görüntü çözünürlüğünü artırır.(Kaynak)

EfficientNet mimarisi

Şimdi de EfficientNet'in mimarisine bir göz atalım. 

Mobil ve gömülü cihazlar için optimize edilmiş hafif bir bilgisayarla görme modeli olan MobileNetV2 üzerine inşa edilmiştir. Özünde, görüntü verilerini standart bir konvolüsyon gibi işleyen ancak daha az hesaplama yapan özel bir katman olan Mobil Ters Darboğaz Konvolüsyon (MBConv) bloğu bulunmaktadır. Bu blok, modeli hem hızlı hem de bellek açısından daha verimli hale getirir.

MBConv bloklarının her birinin içinde bir sıkma ve uyarma (SE) modülü bulunur. Bu modül ağdaki farklı kanalların gücünü ayarlar. Önemli kanalların gücünü artırır ve diğerlerinin gücünü azaltır. Modül, ağın bir görüntüdeki en önemli özelliklere odaklanmasına yardımcı olurken diğerlerini göz ardı eder. EfficientNet modeli ayrıca, görüntülerdeki desenleri eski yöntemlerden daha iyi tespit etmesine yardımcı olan bir Swish aktivasyon fonksiyonu (ağın desenleri öğrenmesine yardımcı olan matematiksel bir fonksiyon) kullanır. 

Bunun ötesinde, ağ içindeki bazı bağlantıların eğitim sırasında rastgele kapatıldığı DropConnect'i kullanır. Bu stokastik düzenleme yöntemi (modelin genelleme yapmak yerine eğitim verilerini ezberlemesini önleyen bir rastgeleleştirme tekniği), ağı görülmeyen verilere daha iyi aktarılan daha sağlam özellik temsilleri (verilerdeki daha güçlü, daha genel desenler) öğrenmeye zorlayarak aşırı uyumu azaltır.

Şekil 3. EfficientNet-B0 EfficientNet-B0 Mimarisi(Kaynak)

EfficientNet'in model çeşitlerine kısa bir genel bakış

EfficientNet modellerinin nasıl çalıştığını daha iyi anladığımıza göre, şimdi farklı model çeşitlerini tartışalım. 

EfficientNet modelleri, hız ve doğruluğu dengeleyen taban çizgisi olarak B0'dan başlayarak B7'ye kadar ölçeklenir. Her sürüm derinliği, genişliği ve görüntü çözünürlüğünü artırarak doğruluğu iyileştirir. Bununla birlikte, B1 ve B2'den yüksek performanslı B6 ve B7'ye kadar daha fazla hesaplama gücü gerektirirler. 

EfficientNet-B3 ve EfficientNet-B4 modelleri daha büyük görüntüler için bir denge kurarken, B5 genellikle hassasiyet gerektiren karmaşık veri kümeleri için seçilir. Bu modellerin ötesinde, en son model olan EfficientNet V2, eğitim hızını artırabilir, küçük veri kümelerini daha iyi işleyebilir ve modern donanım için optimize edilmiştir.

EfficientNet Uygulamaları

EfficientNet, diğer birçok modele göre daha az bellek ve işlem gücü kullanırken doğru sonuçlar üretebilir. Bu da onu bilimsel araştırmalardan insanların günlük olarak kullandığı ürünlere kadar birçok alanda kullanışlı hale getiriyor.

Tıbbi görüntü analizi

Akciğerlerin BT taramaları gibi tıbbi görüntüler, genellikle doğru teşhis için kritik olan ince ayrıntılar içerir. Yapay zeka modelleri, insanların tespit etmesi zor olabilecek desenleri ortaya çıkarmak için bu görüntülerin analiz edilmesine yardımcı olabilir. EfficientNet'in bu amaca yönelik bir uyarlaması, özellikle tıbbi görüntü analizi için tasarlanmış olan MONAI (Medical Open Network for AI) EfficientNet'tir.

EfficientNet'in mimarisini temel alan araştırmacılar, tümörleri tespit etmek için akciğer BT taramalarını sınıflandıran bir model olan Lung-EffNet'i de geliştirdiler. Tümörleri iyi huylu, kötü huylu veya normal olarak kategorize edebilen bu model, deneysel ortamlarda %99'un üzerinde bir doğruluk oranına ulaşmıştır.

Şekil 4. Lung-EffNet kullanarak tümörlerin görüntü sınıflandırması.(Kaynak)

Gerçek zamanlı nesne algılama

Nesne algılama, bir görüntüdeki nesneleri bulma ve konumlarını belirleme işlemidir. Güvenlik sistemleri, sürücüsüz arabalar ve drone'lar gibi uygulamaların önemli bir parçasıdır.

EfficientNet, görüntülerden özellik çıkarmanın çok verimli bir yolunu sunduğu için bu alanda önemli hale geldi. Derinlik, genişlik ve çözünürlüğü ölçeklendirme yöntemi, modellerin çok ağır veya yavaş olmadan nasıl doğru olabileceğini gösterdi. Bu nedenle EfficientDet gibi birçok tespit sistemi EfficientNet'i omurga olarak kullanmaktadır.

Ultralytics YOLO11 gibi daha yeni modeller, hızı doğrulukla birleştirme konusunda aynı hedefi paylaşmaktadır. Verimli modellere yönelik bu eğilim, EfficientNet gibi mimarilerden gelen fikirlerden büyük ölçüde etkilenmiştir.

EfficientNet'in artıları ve eksileri

Bilgisayarla görme projelerinde EfficientNet kullanmanın bazı avantajları şunlardır:

  • Daha az parametre ile yüksek doğruluk: EfficientNet, ResNet veya DenseNet gibi eski modellere benzer veya daha iyi doğruluk sağlayabilir. Bununla birlikte, daha az parametre kullanır, bu da onu eğitmeyi daha hızlı ve dağıtmayı daha kolay hale getirir.
  • Ölçeklenebilir model ailesi: B0'dan B7'ye kadar, temel ağı değiştirmeden donanım ve hassasiyet gereksinimlerinize uygun bir sürüm seçebilirsiniz.
  • Transfer öğrenimi için iyidir: EfficientNet, özel bir görev için önceden eğitilmiş bir modeli yeniden eğitme süreci olan transfer öğrenimi için güvenilir model performansı sağlayabilir. Çeşitli bilgisayarla görme görevleri için bir omurga olarak çalışabilir. İnce ayar yapıldığında da güçlü sonuçlar göstermiştir. Örneğin, yaygın olarak kullanılan bir görüntü sınıflandırma veri kümesi olan CIFAR-100'de önceki modellere göre önemli ölçüde daha az parametre ile son teknoloji ürünü doğruluk elde etmiştir.

EfficientNet'i kullanmanın birçok faydası olsa da, EfficientNet'in akılda tutulması gereken bazı sınırlamaları şunlardır:

  • Daha fazla bellek gerektirir: EfficientNet-B6 ve EfficientNet-B7 gibi sürümler çok fazla GPU belleği gerektirir.
  • ImageNet için ayarlanmış ölçeklendirme: Ölçekleme ayarları ImageNet veri kümesi için tasarlanmıştır, bu nedenle ince ayar yapılmadan çok farklı veri kümelerinde performans düşebilir. EfficientNet'in mimarisi ve ölçeklendirmesi, derinliğini ve genişliğini haklı çıkarmak için yeterli veri sağlayan ImageNet gibi büyük ve çeşitli bir veri kümesi için tasarlandığından, bu özellikle küçük veri kümeleri için geçerlidir.
  • Bazı donanımlarda daha yavaş: EfficientNet, modern donanımlarda verimlilik için tasarlanmış MBConv adlı katmanları kullanır. Eski GPU'larda veya CPU'larda bu katmanlar daha yavaş çalışabilir.

Önemli çıkarımlar

EfficientNet, derinlik, genişlik ve görüntü çözünürlüğünü dengede tutarak bilgisayarla görme modellerinin büyüme şeklini değiştirdi. Hala önemli bir modeldir ve daha yeni mimarileri de etkilemiştir. Özellikle bilgisayarla görme tarihinde anlamlı bir yere sahiptir.

Yapay zeka hakkında daha fazlasını keşfetmek için topluluğumuza ve GitHub depomuza katılın. Sağlık hizmetlerinde yapay zeka ve otomotivde bilgisayarla görme hakkında bilgi edinmek için çözüm sayfalarımıza göz atın. Lisanslama seçenek lerimizi keşfedin ve bilgisayarla görü ile geliştirmeye bugün başlayın!

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Panoya kopyalanan bağlantı