Yolo 深圳
深セン
今すぐ参加

パーセプトロンとニューラルネットワーク:コンピュータビジョンの基本原則

Abirami Vina

5分で読めます

2024年10月25日

サプライチェーンにおける品質管理から、ドローンを使用した自律的なユーティリティ検査まで、ニューラルネットワークが現代のテクノロジーをどのように変革しているかを理解します。

過去数十年にわたり、ニューラルネットワークは、多くの主要な人工知能(AI)イノベーションの構成要素となっています。ニューラルネットワークは、人間の脳の複雑な機能を模倣しようとする計算モデルです。機械がデータから学習し、パターンを認識して情報に基づいた意思決定を行うのに役立ちます。そうすることで、コンピュータビジョン深層学習などのAIのサブフィールドを、ヘルスケア金融自動運転車などの分野で実現します。 

ニューラルネットワークの仕組みを理解することは、AIという「ブラックボックス」に対する理解を深め、最先端技術がどのように私たちの日常生活に組み込まれているかを解明するのに役立ちます。この記事では、ニューラルネットワークとは何か、どのように機能するのか、そして長年にわたってどのように進化してきたのかを探ります。また、コンピュータビジョンアプリケーションにおいてニューラルネットワークが果たす役割についても見ていきます。それでは始めましょう。

AIにおけるパーセプトロンとは何か?

ニューラルネットワークについて詳しく説明する前に、パーセプトロンを見てみましょう。パーセプトロンは、最も基本的なタイプのニューラルネットワークであり、より複雑なモデルを構築するための基盤となります。 

パーセプトロンは、教師あり学習ラベル付けされたトレーニングデータからの学習)に使用される線形機械学習アルゴリズムです。これは、単層ニューラルネットワークとしても知られており、通常、2つのクラスのデータを区別するバイナリ分類タスクに使用されます。パーセプトロンを視覚化しようとする場合、それを単一の人工ニューロンとして考えることができます。 

図1. パーセプトロンは単一の人工ニューロンです。

パーセプトロンの仕組みを理解する

パーセプトロンは、複数の入力を取り込み、重みと組み合わせ、どのカテゴリに属するかを決定し、単純な意思決定器として機能する。入力値(ノードとも呼ばれる)、 weights and biasesネット和)、活性化関数である。 

仕組みは次のとおりです。

  • 入力と重み:複数の情報(入力)があり、それぞれに重要度を示す重みがあるとします。これに加えて、バイアスは、パーセプトロンがより柔軟に意思決定を行うのに役立ちます。
  • 重み付き和の計算:パーセプトロンは、各入力にその重みを掛け、バイアスを含むすべてを加算して、重み付き和を求めます。
  • 意思決定:次に、パーセプトロンは活性化関数を使用して最終的な出力を決定します。重み付き和を取り、パーセプトロンをアクティブにするかどうかを決定します。最も単純なケースでは、活性化関数は、重み付き和が特定のしきい値を超えている場合は1を出力し、そうでない場合は0を出力するステップ関数です。したがって、重み付けされた入力は、yes-or-noの決定に変換されます。
  • 学習と改善:パーセプトロンが間違いを犯した場合、次回改善するために重みを調整します。このプロセスは、モデルが間違いから学習するのに役立ちます
図 2. パーセプトロンの概要。出典: indiantechwarrior.com

コンピュータビジョンにおけるパーセプトロンの役割

パーセプトロンは、コンピュータビジョンの基礎を理解する上で重要な役割を果たします。これらは高度なニューラルネットワークの基礎となります。パーセプトロンとは異なり、ニューラルネットワークは単一の層に限定されません。相互接続されたパーセプトロンの複数の層で構成されており、複雑な非線形パターンを学習できます。ニューラルネットワークは、より高度なタスクを処理し、バイナリ出力と連続出力の両方を生成できます。たとえば、ニューラルネットワークは、高度なコンピュータビジョンタスクインスタンスセグメンテーションポーズ推定など)に使用できます。

ニューラルネットワークからコンピュータビジョン技術への進化

ニューラルネットワークの歴史は数十年に遡り、研究と興味深い発見に満ちています。これらの主要なイベントのいくつかを見てみましょう。 

初期のマイルストーンの簡単な概要を以下に示します。

  • 1940年代: Warren McCullochとWalter Pittsが、脳の働きを模倣する単純な回路を開発しました。
  • 1958年: Rosenblattがパーセプトロンを発表しました。
  • 1970年代: Paul Werbosがバックプロパゲーションの概念を考案しました(予測された出力と実際の出力の差を最小限にすることでニューラルネットワークが学習するのを助けるトレーニング方法)。バックプロパゲーションにより、多層ニューラルネットワークのトレーニングが可能になり、深層学習への道が開かれました。
  • 1980年代: Geoffrey HintonやYann LeCunなどの研究者は、相互接続されたユニットのネットワークがどのように認知プロセスを形成できるかというコネクショニズムを研究しました。彼らの研究は、現代のニューラルネットワークの基礎を築きました。
  • 1990年代: Jürgen SchmidhuberとSepp Hochreiterは、シーケンス予測に関わるタスクに不可欠となった長短期記憶(LSTM)ネットワークを提案しました。
図3。ニューラルネットワークの進化。

21世紀に入ると、ニューラルネットワークの研究が活発になり、さらなる進歩につながりました。2000年代には、ヒントンによる制限付きボルツマンマシン(データ内のパターンを見つけるニューラルネットワークの一種)の研究が、ディープラーニングの発展に重要な役割を果たしました。これにより、深層ネットワークのトレーニングが容易になり、複雑なモデルに関する課題を克服し、ディープラーニングをより実用的かつ効果的にすることができました。

そして2010年代、ビッグデータと並列コンピューティングの台頭により、研究は急速に加速した。この時期のハイライトは、AlexNetの ImageNetコンペティションでのAlexNetの優勝(2012年)だ。深層畳み込みニューラルネットワークであるAlexNetは画像を正確に認識するようなコンピュータ・ビジョンのタスクに対して深層学習がいかに強力であるかを示したため、大きなブレークスルーとなった。視覚認識におけるAIの急成長の火付け役となった。 

今日、ニューラルネットワークは、シーケンスの理解に優れたTransformer(トランスフォーマー)や、データ内の複雑な関係とうまく連携するグラフニューラルネットワークなどの新しいイノベーションによって進化しています。転移学習(あるタスクでトレーニングされたモデルを別のタスクに使用すること)や、モデルがラベル付けされたデータを必要とせずに学習する自己教師あり学習などの手法も、ニューラルネットワークができることを拡大しています。

ニューラルネットワークの理解:基本

基礎を説明したところで、ニューラルネットワークとは一体何かを理解しましょう。ニューラルネットワークとは、人間の脳に似た階層構造で相互接続されたノードまたはニューロンを使用する機械学習モデルの一種です。これらのノードまたはニューロンは、データから処理および学習し、パターン認識などのタスクを実行できるようにします。また、ニューラルネットワークは適応性があるため、間違いから学習して時間の経過とともに改善できます。これにより、顔認識などの複雑な問題にもより正確に取り組むことができます。

図4. ニューラルネットワーク。

ニューラルネットワークは、並行して動作する複数のプロセッサで構成され、層状に編成されています。入力層、出力層、およびその間のいくつかの隠れ層で構成されています。入力層は、私たちの視神経が視覚情報を取り込むのと同様に、生データを受け取ります。

各層は、脳内のニューロンが互いに信号を送信するのと同様に、元の入力と直接やり取りするのではなく、出力を次の層に渡します。最終層は、ネットワークの出力を生成します。このプロセスを使用することで、人工ニューラルネットワーク(ANN)は、画像の分類などのコンピュータビジョンタスクを実行することを学習できます。

コンピュータビジョンにおけるニューラルネットワークの産業応用

ニューラルネットワークとは何か、そしてそれがどのように機能するかを理解した上で、コンピュータビジョンにおけるニューラルネットワークの可能性を示すアプリケーションを見てみましょう。

エネルギー分野における送電線の検査

ニューラルネットワークは、以下のようなコンピュータビジョンモデルの基礎を形成している。 Ultralytics YOLO11のようなコンピュータ・ビジョン・モデルの基礎となり、ドローンを使った送電線の目視検査に使用できる。電力業界は、送電線の広範なネットワークの検査と保守に関して、物流上の課題に直面している。これらの送電線は、交通量の多い都市部から人里離れた険しい風景まで、あらゆる場所に張り巡らされていることが多い。従来、これらの点検は地上作業員が行っていた。効果的ではあるが、こうした手作業はコストと時間がかかり、作業員が 環境や電気的危険にさらされる可能性がある。 調査によると、電線工事はアメリカで最も危険な仕事のベスト10に入り、年間死亡率は10万人当たり30~50人である。

しかし、ドローン検査技術は空中検査をより実用的で費用対効果の高い選択肢にすることができる。最先端の技術により、ドローンは検査中に頻繁にバッテリーを交換することなく、より長い距離を飛行することができる。現在、多くのドローンはAIと統合され、自動障害物回避機能とより優れた障害検出機能を備えている。これらの機能により、送電線の多い混雑した地域を検査し、より遠くから高品質の画像を撮影することができる。多くの国で、送電線の点検作業にドローンとコンピューター・ビジョンの使用が採用されている。例えばエストニアでは、送電線検査の100%がドローンで行われている。

図5. 技術者がドローンとAIツールを使用して送電線を検査している様子(左側の画像)と、彼が操作しているドローン(右側の画像)(suasnews)。

主なポイント 

ニューラルネットワークは、研究から応用へと大きく進歩し、現代の技術革新の重要な一部となっています。ニューラルネットワークにより、機械は学習し、パターンを認識し、学習した内容を使用して情報に基づいた意思決定を行うことができます。ヘルスケアや金融から、自動運転車や製造まで、これらのネットワークはイノベーションを推進し、業界を変革しています。ニューラルネットワークモデルの探求と改良を続けるにつれて、私たちの日常生活やビジネス運営のより多くの側面を再定義する可能性がますます明確になっています。

詳細については、GitHubリポジトリにアクセスし、コミュニティにご参加ください。ソリューションページで、製造業農業におけるAIアプリケーションをご覧ください。🚀

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる