YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
ガイド

EfficientNetとは何か?クイック概要

EfficientNetのアーキテクチャと複合スケーリングの魔法を理解しましょう!画像分類およびセグメンテーションの効率において最高レベルのEfficientNet B0-B7を探究します。

ABAbirami Vina
6 min read
EfficientNetアーキテクチャの概要

2019年、Google AIの研究者たちは、画像内のオブジェクトやパターンを認識するために構築された最先端のコンピュータビジョンモデルであるEfficientNetを発表しました。これは主に画像分類(画像を事前に定義された複数のカテゴリのいずれかに割り当てる作業)を目的として設計されました。しかし今日では、EfficientNetはオブジェクト検出、セグメンテーション、転移学習といったより複雑なタスクのバックボーンとしても機能しています。

EfficientNet以前の機械学習およびビジョンAIモデルでは、レイヤーを追加したり、レイヤーのサイズを大きくしたりすることで精度の向上を図っていました。レイヤーとは、ニューラルネットワークモデル(人間の脳に着想を得たディープラーニングモデルの一種)において、データを処理してパターンを学習し、精度を高めるためのステップのことです。

こうした変更にはトレードオフがあり、従来のAIモデルをより大きく、より低速にする一方で、追加の精度向上は、必要とされる計算能力の大幅な増加に比べればわずかなものであることが多くありました。

EfficientNetは異なるアプローチをとりました。深さ(レイヤー数)、幅(各レイヤーのユニット数)、および画像解像度(入力画像の詳細レベル)をバランスよく同時に拡大したのです。この手法はコンパウンドスケーリングと呼ばれ、利用可能な処理能力をすべて確実かつ有効に活用します。最終的な結果として、ResNetやDenseNetといった古いモデルよりも優れた性能を発揮する、より小さく高速なモデルが実現しました。

今日、Ultralytics YOLO11のような新しいコンピュータビジョンモデルは、より高い精度、速度、効率を提供します。それでもなお、EfficientNetは多くの高度なアーキテクチャの設計に影響を与えた重要なマイルストーンとして存在し続けています。

本記事では、EfficientNetの仕組み、独自性、そしてコンピュータビジョンにおける重要性について、5分間で分かりやすく解説します。それでは始めましょう!

Link to this sectionEfficientNetとは?#

EfficientNetが設計される以前、ほとんどの画像認識モデルは、レイヤーを調整したり、より詳細な情報を捉えるために画像入力サイズを大きくしたりすることで精度を向上させていました。これらの戦略により結果は改善されましたが、同時にモデルが重くなり、負荷も増大しました。つまり、より多くのメモリと優れたハードウェアが必要になったということです。

EfficientNetは個々のレイヤーを変更する代わりに、コンパウンドスケーリングと呼ばれる手法を用いて深さ、幅、画像解像度を同時にスケーリングします。このアプローチにより、モデルは特定の要素に過度な負担をかけることなく、効率的に拡張することが可能となります。

EfficientNetのアーキテクチャは、一連のブロックを通じて画像を処理し、各ブロックは小さなモジュールで構成されています。各ブロック内のモジュール数はモデルのサイズによって異なります。

EfficientNetの構成要素

図1:EfficientNetのビルディングブロック。(出典)

小さいバージョンでは使用するモジュール数が少なく、大きいバージョンではモジュールがより頻繁に繰り返されます。この柔軟な設計により、EfficientNetはモバイルデバイスから大規模システムまで、幅広い用途で高い精度と効率を実現しています。

Link to this sectionコンパウンドスケーリングの仕組み#

コンパウンドスケーリング手法は、モデルの深さ、幅、画像解像度を拡張しつつ、それらのバランスを維持します。これにより、計算能力を効率的に活用することが可能になります。このシリーズは、他のすべてのバージョンの基礎となるEfficientNet-B0という小さなベースラインモデルから始まります。

B0から、モデルはEfficientNet-B1からEfficientNet-B7へと名付けられた大きなバリエーションへとスケールアップします。ステップごとに、ネットワークはレイヤーを追加し、チャンネル数(処理に使用されるユニット数)を増やし、より高解像度の入力画像を扱えるようになります。各ステップにおける成長量はコンパウンド係数と呼ばれるパラメータによって決定され、これにより深さ、幅、解像度が個別にではなく固定された比率で確実に増加します。

コンパウンドスケーリングはモデルの幅、深さ、および画像解像度を向上させます

図2:コンパウンドスケーリングはモデルの幅、深さ、画像解像度を増加させる。(出典)

Link to this sectionEfficientNetのアーキテクチャ#

次に、EfficientNetのアーキテクチャを見ていきましょう。

このモデルは、モバイルおよび組み込みデバイス用に最適化された軽量なコンピュータビジョンモデルであるMobileNetV2をベースに構築されています。その中核には、Mobile Inverted Bottleneck Convolution(MBConv)ブロックという特別なレイヤーがあり、標準的な畳み込みと同様に画像データを処理しますが、計算量は少なくなっています。このブロックにより、モデルは高速かつメモリ効率の高いものとなっています。

各MBConvブロックの内部には、Squeeze-and-Excitation(SE)モジュールが組み込まれています。このモジュールは、ネットワーク内の異なるチャンネルの強さを調整します。重要なチャンネルの強度を高め、他の強度を減らします。このモジュールにより、ネットワークは画像の最も重要な特徴に集中し、不要な情報を無視することができます。また、EfficientNetモデルはSwish活性化関数(ネットワークがパターンを学習するのを助ける数学的関数)を使用しており、以前の手法よりも画像内のパターンをより良く検出できるようになっています。

さらに、DropConnectが使用されており、トレーニング中にはネットワーク内の接続の一部がランダムにオフにされます。この確率的正則化法(モデルがデータを単に記憶するのではなく一般化できるようにするためのランダム化技術)は、ネットワークに対してより堅牢な特徴表現(データ内のより強力で一般的なパターン)を学習させることで過学習を抑制し、未知のデータに対する転移性能を向上させます。

EfficientNet-B0のアーキテクチャ

図3:EfficientNet-B0のアーキテクチャ (出典)

Link to this sectionEfficientNetモデルバリエーションの簡単な概要#

EfficientNetモデルの仕組みについて理解が深まったところで、さまざまなモデルバリエーションについて議論しましょう。

EfficientNetモデルはB0からB7までスケールし、B0が速度と精度のバランスをとるベースラインとなります。各バージョンは深さ、幅、画像解像度を増大させることで精度を向上させますが、同時に要求される計算能力もB1、B2から高パフォーマンスのB6、B7へと増加していきます。

EfficientNet-B3およびB4モデルはより大きな画像に対してバランスをとりますが、B5は精度が必要な複雑なデータセットに対して選ばれることが多くあります。これらのモデルを超えて、最新のモデルであるEfficientNet V2は、トレーニング速度を向上させ、小さなデータセットの扱いを改善し、最新のハードウェア向けに最適化されています。

Link to this sectionEfficientNetの用途#

EfficientNetは、他の多くのモデルよりも少ないメモリと計算能力で正確な結果を生み出すことができます。そのため、科学研究から日常的な製品まで、多くの分野で役立てられています。

Link to this section医療画像解析#

肺のCTスキャンなどの医療画像には、正確な診断に不可欠な微細な詳細が含まれていることがよくあります。AIモデルは、人間が検出するのが難しい可能性のあるパターンを明らかにするために、これらの画像の解析を支援できます。この目的のためのEfficientNetの適応の一つが、医療画像解析用に特別に設計されたMONAI (Medical Open Network for AI) EfficientNetです。

EfficientNetのアーキテクチャに基づいて、研究者たちは腫瘍を検出するために肺のCTスキャンを分類するモデルであるLung-EffNetも開発しました。これは腫瘍を良性、悪性、または正常に分類でき、実験環境では99%を超える精度が報告されています。

Lung-EffNetを使用した腫瘍の画像分類

図4:Lung-EffNetを使用した腫瘍の画像分類。(出典)

Link to this sectionリアルタイムオブジェクト検出#

オブジェクト検出は、画像内のオブジェクトを見つけてその位置を特定するプロセスです。これはセキュリティシステム、自動運転車、ドローンなどのアプリケーションの重要な要素です。

EfficientNetは、画像から特徴を抽出する非常に効率的な方法を提供したため、この分野で重要になりました。その深さ、幅、解像度をスケーリングする手法は、モデルが重くなったり低速になったりすることなく、どのように高精度を保てるかを示しました。これが、EfficientDetのような多くの検出システムがEfficientNetをバックボーンとして採用している理由です。

Ultralytics YOLO11のような新しいモデルも、速度と精度の両立という同じ目標を共有しています。効率的なモデルに向かうこの傾向は、EfficientNetのようなアーキテクチャのアイデアから強く影響を受けています。

Link to this sectionEfficientNetの長所と短所#

コンピュータビジョンプロジェクトでEfficientNetを使用することの利点をいくつか挙げます:

  • パラメータ数が少なく高精度: EfficientNetは、ResNetやDenseNetのような古いモデルと同等以上の精度を実現できます。しかし、パラメータ数が少ないため、トレーニングが高速で、デプロイも容易です。
  • スケーラブルなモデルファミリー: B0からB7まで取り揃えており、ベースラインネットワークを変更することなく、ハードウェアや精度の要件に合わせてバージョンを選択できます。
  • 転移学習に最適: EfficientNetは、事前学習済みモデルをカスタムタスク用に再トレーニングするプロセスである転移学習において、信頼性の高いモデルパフォーマンスを提供できます。多様なコンピュータビジョンタスクのバックボーンとして機能します。また、ファインチューニングを行った際にも強力な結果を示しています。例えば、広く使用されている画像分類データセットであるCIFAR-100において、以前のモデルよりも大幅に少ないパラメータ数で最先端の精度を達成しました。

EfficientNetの使用には多くの利点がありますが、留意すべき制限事項もいくつかあります:

  • より多くのメモリが必要: EfficientNet-B6やEfficientNet-B7のようなバージョンは、非常に多くのGPUメモリを消費します。
  • ImageNet用にチューニングされたスケーリング: スケーリング設定はImageNetデータセット用に設計されているため、ファインチューニングを行わない場合、大きく異なるデータセットでは性能が低下する可能性があります。EfficientNetのアーキテクチャとスケーリングは、その深さと幅を正当化する十分なデータを提供するImageNetのような大規模で多様なデータセット用に設計されているため、特に小さなデータセットではこの点が顕著です。
  • 一部のハードウェアで低速: EfficientNetは、最新のハードウェアでの効率化を目的として設計されたMBConvと呼ばれるレイヤーを使用しています。古いGPUやCPUでは、これらのレイヤーの動作が遅くなる可能性があります。

Link to this section重要なポイント#

EfficientNetは、深さ、幅、画像解像度のバランスを保つことで、コンピュータビジョンモデルの成長方法を変えました。現在でも重要なモデルであり、新しいアーキテクチャにも影響を与え続けています。特に、コンピュータビジョンの歴史において重要な位置を占めています。

AIについてさらに詳しく知るために、私たちのコミュニティGitHubリポジトリに参加してください。ヘルスケアにおけるAI自動車業界におけるコンピュータビジョンについて、私たちのソリューションページをご覧ください。ライセンスオプションを確認し、今すぐコンピュータビジョンの構築を始めましょう!

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう