ヨロビジョン深圳
深セン
今すぐ参加
用語集

生成AI

テキスト、画像、オーディオなどのオリジナルコンテンツを生成する生成AIが、革新的な応用によって産業をどのように変革しているかをご覧ください。

生成AIは、テキスト、画像、オーディオ、ビデオなど、新しいオリジナルのコンテンツを作成できる人工知能(AI)システムのカテゴリです。既存のデータを分析したり、それに基づいて行動したりする従来のAIとは異なり、生成モデルは、膨大なトレーニングデータのコーパスから基盤となるパターンと構造を学習し、トレーニングされたデータの特性を模倣した新しい出力を生成します。この技術は、大規模言語モデル(LLM)などの複雑な深層学習モデルによって実現されており、これらのモデルはますますアクセスしやすく、強力になっています。

生成AIの仕組み

本質的に、生成AIは、大規模なデータセットでトレーニングされたニューラルネットワーク(NN)に依存しています。トレーニング中、モデルはデータの確率分布を学習します。プロンプトまたは入力が与えられると、学習したこの分布を使用して、単語、ピクセル、または音符など、シーケンス内の次に最も可能性の高い要素を予測および生成します。このプロセスは、コンテンツの完全な作品を構築するために繰り返されます。多くの最新の生成モデルは、Transformerアーキテクチャ上に構築されており、注意機構を使用して入力データのさまざまな部分の重要度を評価し、複雑な長距離依存関係をキャプチャして、高度に一貫性のある出力を生成できるようにします。これらの強力な事前トレーニング済みモデルは、基盤モデルと呼ばれることがよくあります。

生成AIと識別AIの比較

生成AIの対となるものは、識別AIです。主な違いは、その目的にあります。

  • Generative Models: データの分布を学習して、新しいデータサンプルを作成します。その目標は、「データはどのように見えるか?」という質問に答えることです。例としては、text-to-image合成やテキスト生成のモデルがあります。
  • 識別モデル: 異なるデータクラス間の境界を学習し、与えられた入力に対してラベルを分類または予測します。その目的は、「これらのグループ間の違いは何か?」という問いに答えることです。教師あり学習におけるタスクのほとんどは、画像分類物体検出など、Ultralytics YOLOのようなモデルによって実行され、このカテゴリに分類されます。

識別モデルは分類と予測に優れていますが、生成モデルは作成と拡張に優れています。

実際のアプリケーション

生成AIは、幅広いアプリケーションで多くの業界を変革しています。

  1. コンテンツの作成と拡張GPT-4のようなモデルは、記事、メール、コードを作成でき、text-to-imageモデルDALL-E 3やMidjourneyなど)は、簡単なテキスト記述から素晴らしいビジュアルを作成します。これは、マーケティングやエンターテインメントからソフトウェア開発まで、あらゆる分野に革命をもたらしており、GitHub Copilotのようなツールが開発者を支援しています。
  2. 合成データ生成: 生成AIは、他の機械学習(ML)モデルをトレーニングするための現実的な人工データを生成できます。たとえば、自動車分野のAIでは、まれな運転シナリオを生成して、自動運転車の認識モデルの堅牢性を向上させることができます。同様に、ヘルスケアでは、診断ツールをトレーニングするための合成医療画像を生成し、データプライバシーと限られたデータセットに関連する課題を克服するのに役立ちます。この手法は、従来のデータ拡張を補完します。

生成モデルの一般的な種類

いくつかのアーキテクチャが、生成AIの進歩において極めて重要な役割を果たしてきました。

  • 敵対的生成ネットワーク(GAN): 高度に現実的な出力を生成するために連携する、2つの競合するニューラルネットワーク(ジェネレーターと識別器)で構成されています。
  • 拡散モデル: 画像に徐々にノイズを加え、そのプロセスを逆にして高忠実度の画像を生成することを学習します。これは、Stable Diffusionなどのモデルの基盤となる技術です。
  • 大規模言語モデル(LLM): Transformerアーキテクチャに基づいて、これらのモデルは大量のテキストデータでトレーニングされ、人間のような言語を理解および生成します。Google AIMeta AIなどの主要な研究機関は、可能なことの限界を常に押し広げています。

課題と倫理的考察

生成AIの急速な台頭は、重大な課題をもたらしています。誤情報キャンペーンのためのディープフェイクの作成や、知的財産権の侵害など、悪用の可能性は大きな懸念事項です。モデルは、トレーニングデータに存在するアルゴリズムバイアスを永続させ、増幅させる可能性もあります。これらの問題に対処するには、AI倫理への強いコミットメントと、堅牢なガバナンスフレームワークの開発が必要です。さらに、これらの大規模モデルのトレーニングは計算集約的であり、環境への影響に関する懸念が高まっています。MLOpsプラットフォーム(Ultralytics HUBなど)を通じてモデルのライフサイクルを効率的に管理することで、開発とデプロイメントを効率化できます。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました