用語集

ジェネレーティブAI

ジェネレーティブAIがどのようにテキスト、画像、音声などのオリジナルコンテンツを作成し、革新的なアプリケーションで業界を変革しているかをご覧ください。

ジェネレーティブAIは、テキスト、画像、音声、動画など、新しいオリジナルのコンテンツを作成できる人工知能(AI)システムのカテゴリーである。既存のデータを分析したり作用させたりする従来のAIとは異なり、ジェネレーティブ・モデルは膨大な学習データのコーパスから基礎となるパターンや構造を学習し、学習したデータの特性を模倣した新しい出力を生成する。この技術は、大規模言語モデル(LLM)のような複雑な深層学習モデルによって支えられている。

ジェネレーティブAIの仕組み

ジェネレーティブAIの核心は、膨大なデータセットで訓練されたニューラルネットワーク(NN)に依存している。学習中、モデルはデータの確率的分布を学習する。プロンプトや入力が与えられると、この学習された分布を使用して、単語、ピクセル、音符のいずれであっても、シーケンス内の次の最も可能性の高い要素を予測し、生成する。このプロセスが繰り返され、完全なコンテンツが構築される。最新の生成モデルの多くは、入力データのさまざまな部分の重要性を評価するアテンション・メカニズムを使用するTransformerアーキテクチャで構築されており、複雑で長距離の依存関係を捕捉し、非常に首尾一貫した出力を生成することができる。これらの強力で事前に訓練されたモデルは、しばしば基礎モデルと呼ばれる。

生成AI vs 判別AI

生成AIと対をなすのが識別AIである。重要な違いはその目的にある:

  • 生成モデル:データの分布を学習し、新しいデータサンプルを作成する。その目的は、"データはどのように見えるか?"という問いに答えることである。例としては、テキストから画像への合成やテキスト生成のためのモデルがある。
  • 識別モデル:与えられた入力に対してラベルを分類または予測するために、異なるデータクラス間の境界を学習する。その目的は、"これらのグループの違いは何か?"に答えることである。Ultralytics YOLOのようなモデルによって実行される画像分類や 物体検出のような教師あり学習のタスクのほとんどは、このカテゴリーに入る。

識別モデルが分類と予測に優れているのに対し、生成モデルは創造と増強に優れている。

実世界での応用

ジェネレーティブAIは、幅広い用途で数多くの産業を変革している:

  1. コンテンツの作成と補強GPT-4のようなモデルは、記事、電子メール、コードを書くことができ、DALL-E 3やMidjourneyのようなテキストから画像へのモデルは、単純なテキスト記述から見事なビジュアルを作成します。これは、マーケティングやエンターテインメントからソフトウェア開発までの分野に革命を起こしており、GitHub Copilotのようなツールが開発者を支援している。
  2. 合成データの生成:ジェネレーティブAIは、他の機械学習(ML)モデルを訓練するために、現実的な人工データを作成することができる。例えば、自動車のAIでは自律走行車の知覚モデルのロバスト性を向上させるために、稀な運転シナリオを生成することができる。同様に、ヘルスケア分野では、診断ツールのトレーニング用に合成医療画像を生成することができ、データプライバシーや限られたデータセットに関する課題を克服するのに役立つ。この技術は、従来のデータ補強を補完するものである。

一般的な生成モデルの種類

いくつかのアーキテクチャは、生成AIの進歩において極めて重要な役割を果たしてきた:

  • 生成的逆数ネットワーク (GANs):生成器と識別器という2つの競合するニューラルネットワークで構成され、それらが協働して非常に現実的な出力を生成する。
  • 拡散モデル:画像に徐々にノイズを加え、そのプロセスを逆に学習して忠実度の高い画像を生成する。これは、Stable Diffusionのようなモデルを支える技術です。
  • 大規模言語モデル (LLM):Transformerアーキテクチャに基づくこれらのモデルは、人間のような言語を理解し生成するために、膨大な量のテキストデータに対して学習されます。Google AIや Meta AIのような主要研究機関は、常に可能性の限界を押し広げている。

課題と倫理的配慮

ジェネレーティブAIの急速な台頭は、重大な課題をもたらす。誤報キャンペーンのためのディープフェイクの作成や知的財産権の侵害など、悪用される可能性は大きな懸念事項である。また、モデルは学習データに存在するアルゴリズムのバイアスを永続させ、増幅させる可能性もある。これらの問題に対処するためには、AI倫理への強いコミットメントと、強固なガバナンスフレームワークの開発が必要である。さらに、このような大規模なモデルのトレーニングには計算量がかかるため、環境への影響も懸念される。Ultralytics HUBのようなMLOpsプラットフォームを通じてモデルのライフサイクルを効率的に管理することで、開発とデプロイメントを合理化することができます。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク