Yolo 深圳
深セン
今すぐ参加
用語集

畳み込みニューラルネットワーク(CNN)

畳み込みニューラルネットワーク(CNN)がコンピュータビジョンに革命をもたらし、ヘルスケア、自動運転車などでAIを強化している様子をご覧ください。

畳み込みニューラルネットワーク(CNN)は、ディープラーニング(DL)アーキテクチャの特殊なクラスである。 ディープラーニング(DL)アーキテクチャの デジタル画像のような格子状のトポロジーを持つデータを処理するために設計された、特殊なディープラーニング(DL)アーキテクチャである。動物の視覚野の CNNは、動物の視覚野の生物学的構造にヒントを得て開発された。 特徴量の空間的階層を自動的に学習することができる。入力データを平坦な数値リストとして扱う従来のニューラルネットワークとは異なり CNNは画素間の空間的な関係を保持する。 現代の コンピュータ・ビジョン(CV)アプリケーションの基礎技術となっている。これにより 入力データを効率的にフィルタリングし、意味のあるパターンを抽出することで、このネットワークは、スマートフォンの顔認識から、医療機器の診断ツールに至るまで、さまざまな進歩を支えている。 スマートフォンの顔認識から医療画像解析の診断ツール 医療画像解析の診断ツールに至るまで、さまざまな進歩を支えている。

畳み込みニューラルネットワークの仕組み

CNNの有効性は、良い予測を得るために重要な特徴を失うことなく、画像を処理しやすい形に縮小する能力にある。 CNNの有効性は、良い予測を得るために重要な特徴を失うことなく、画像を処理しやすい形に縮小する能力にある。これは一連の特殊化された層によって達成される:

  1. 畳み込み層:これは中核となるビルディングブロックである。学習可能なフィルター(しばしばカーネルと呼ばれる)のセットを用いる。 カーネルと呼ばれ、入力画像上をスライドする。この数学的プロセスは コンボリューション エッジ、カーブ、テクスチャーなど特定のパターンを強調する特徴マップを生成する エッジ、カーブ、テクスチャなど、特定のパターンを強調する特徴マップを生成する。このプロセスは このプロセスをインタラクティブなCNNの説明で視覚化することができます。 視覚データをどのように抽出するかを見ることができます。
  2. 活性化関数:畳み込みの後、非線形関数が特徴マップに適用される。最も一般的なのは 最も一般的な選択は ReLU (Rectified Linear Unit)である。 は負のピクセル値をゼロに置き換える。これによって非線形性が導入され、ネットワークが単なる線形の組み合わせではなく、複雑な関係 を学習することができる。
  3. プーリング層:ダウンサンプリングとも呼ばれるこのレイヤーは、特徴マップの次元を削減する。 マップの次元を減らす。最大プーリング(max pooling)のような技法は、領域内の最も顕著な特徴を選択する。 計算負荷を軽減し、オーバーフィッティングを防ぐことでモデルの汎化を助ける。 オーバーフィッティングを防ぐことでモデルの汎化を助ける。
  4. 完全連結層:最終段階では、高レベルの特徴が平坦化され、標準的なニューラルネットワーク(NN)に入力される。 標準的なニューラルネットワーク(NN)に投入される。この層 は、前の層によって抽出された特徴に基づいて、最終的な分類または回帰タスクを実行する。

重要性と実世界での応用

CNNは、手作業による特徴抽出を不要にすることで、人工知能の分野に革命をもたらした。 学習データから特徴的な特徴を直接学習できるCNNの能力は 学習データから直接特徴的な特徴を学習することができるため、さまざまな業界 様々な業界で広く採用されている。

  • 自律システムのための物体検出:自動車業界では、CNNは自動運転車の認識にとって非常に重要である。 自動車業界では、CNNは CNNは自動車産業において、自動運転車の環境認識に不可欠である。以下のようなモデル YOLO11のようなモデルは、CNNベースの バックボーンを利用し、歩行者、交通標識、他の車両をリアルタイムでdetect 検出する。 をリアルタイムで高精度に検出する。
  • ヘルスケア診断:CNNは医療用スキャンの異常を特定することで、放射線科医を支援する。例えば 例えば、ディープラーニング・モデルはX線やMRIスキャンを分析し、腫瘍や骨折を人間の検査だけよりも早くdetect ことができる。 を検出することができる。米国国立衛生研究所 米国国立衛生研究所(NIH)の研究 は、このような自動化ツールが診断の一貫性を大幅に向上させることを実証している。
  • 小売と在庫管理自動レジシステムと スマート在庫管理 自動レジシステムやスマート在庫管理は、CNNを利用して棚の商品を認識し、在庫レベルをtrack し、ロスを防止することで、大手小売企業の業務を合理化している。 大手小売業者の業務を効率化しています。

CNNと関連概念との違い

一般的なAI用語と同じ意味で使われることが多いが、CNNは他のアーキテクチャとは異なる特徴を持っている。 特徴を持っている:

  • CNNと標準的なニューラルネットワークの比較:従来の完全結合ニューラルネットワークは、すべての入力 をすべての出力ニューロンに接続する。画像に適用した場合、これは膨大な数のパラメータとなり、空間的な構造を失うことになる。 空間構造が失われる。これとは対照的に、CNNはパラメータ共有(画像全体で同じフィルタを使用)を使用する。 画像全体で同じフィルタを使用する)ため、視覚データに対して非常に効率的である。
  • CNNとヴィジョン・トランスフォーマー(ViT)の比較:CNNが畳み込みを通じて局所的な特徴に注目するのに対して、視覚変換器(ViT)は、画像を処理する、 ヴィジョン・トランスフォーマー(ViT)は、画像 パッチのシーケンスとして処理する。 大域的な文脈を捉えるために 文脈を捉える。ViTは効果的に学習するために、より大きなデータセットを必要とすることが多い。 バイアス」を持っているため、少ないデータセットでも十分な性能を発揮する。のようなアーキテクチャーに見られるように、ハイブリッド・モデルは両者を組み合わせたものが多い。 のようなアーキテクチャ RT-DETR.

実施例

最新のライブラリを使えば、CNNのパワーを活用するのは簡単だ。その ultralytics パッケージは YOLO11ような最先端のモデルを利用することができる。YOLO1111は、最適化されたCNNバックボーンを備えており、迅速な推論が可能である。

次の例は、事前に訓練されたCNNベースのモデルをロードし、予測を実行する方法を示しています:

from ultralytics import YOLO

# Load a YOLO11 model, which uses a highly optimized CNN architecture
model = YOLO("yolo11n.pt")

# Run object detection on an image to identify features and objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the prediction results
results[0].show()

開発のためのツールとフレームワーク

CNNの開発は、オープンソースツールの強固なエコシステムによって支えられている。研究者やエンジニアは通常 フレームワーク PyTorchTensorFlowなどのフレームワークを使って、ゼロからカスタム・アーキテクチャを構築することができる。これらのライブラリ は、畳み込みとバックプロパゲーションに必要な低レベルのtensor 演算を提供する。

データ管理から配備まで、コンピュータビジョンプロジェクトのライフサイクルを合理化するために、今度のUltralyticsプラットフォームは包括的なソリューションを提供します。 Ultralytics Platformは包括的なソリューションを提供します。モデルのトレーニングに関わる複雑なワークフローを簡素化し モデルのトレーニングに関わる複雑なワークフローを簡素化し、チームがCNNの適用に集中できるようにします。 インフラを管理することよりも、ビジネス上の問題を解決するためにCNNを適用することに集中できるようになります。さらに、これらのモデルを エッジデバイスへの展開が容易になります。 ONNXTensorRTのようなフォーマットによって促進され 環境を提供します。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加