Yolo 深圳
深セン
今すぐ参加
用語集

生成AI

生成AIの基礎を探求しましょう。合成データの生成方法、Ultralytics との連携方法、そしてコンピュータビジョンにおけるイノベーションの推進方法について学びます。

生成AIとは、ユーザーのプロンプトに応じてテキスト、画像、音声、動画、コンピュータコードなどの新規コンテンツを生成することに特化した人工知能(AI)の一分野を指す。classify 分析やclassify 主目的とする従来のAIシステムとは異なり、生成モデルは深層学習(DL)アルゴリズムを用いて大規模データセットの基盤となるパターン、構造、確率分布を学習する。 訓練後、これらのシステムは 訓練データと統計的類似性を持ちつつも独自の創作物である新規出力を生成できる。この能力により生成AIは現代の基盤モデルの礎石として位置づけられ、 クリエイティブ産業、ソフトウェア開発、科学研究の分野で革新を推進している。

生成モデルの仕組み

生成AIの中核には、情報の符号化と復号を学習する複雑なニューラルネットワークアーキテクチャが存在する。これらのモデルは通常、膨大なデータコーパスを用いた教師なし学習によって訓練される。

  • トランスフォーマー:テキストとコードにおいて、 トランスフォーマーアーキテクチャは自己注意機構などのメカニズムを活用し、 シーケンス内の単語track 。これにより、 大規模言語モデル(LLM)は 一貫性があり文脈的に関連性のあるテキストを生成できます。
  • 拡散モデル:画像生成において、 拡散モデルは画像にノイズを加え、 認識不能になるまで処理した後、 このプロセスを逆転させることを学習し、 ランダムなノイズから鮮明な画像を再構築する。
  • GANs: 生成的敵対ネットワーク(GANs)は、 互いに競合する二つのニューラルネットワーク——生成器と判別器——を採用し、 生成器がより現実的な出力を生み出すよう促す。

生成AIと識別AI

生成AIを理解するには、識別AIとの区別が極めて重要です。 両者とも機械学習の柱ではありますが、その目的は大きく異なります。

  • 生成AIは 創造に焦点を当てています。個々のクラスの分布をモデル化し、新たなサンプルを生成します。例えば、Stable Diffusionのようなモデルは、テキスト記述に基づいて犬の新しい画像を生成します。
  • 識別型AIは 分類と 予測に焦点を当てます。 クラス間の決定境界を学習し、入力データを分類します。 YOLO26のような高性能ビジョンモデルは識別型であり、 画像自体を生成するのではなく、 画像を分析して特定の物体を識別・位置特定する(例:写真内の犬を検出) 物体検出に優れています。

実際のアプリケーション

生成AIの汎用性により、様々な分野で応用が可能であり、しばしば識別モデルと組み合わせて強力なワークフローを構築する。

  1. 合成データ生成:コンピュータビジョンエンジニアにとって最も実用的な応用例の一つが 合成データの作成である。 特定の産業上の欠陥や危険な道路状況など、 稀なエッジケースに関する実世界のデータを収集することは、 危険を伴うか、あるいはコストがかかる場合があります。 生成モデルは、こうしたシナリオのフォトリアリスティックな画像を 何千枚も生成できます。このデータはその後、 YOLO26のような堅牢な検出器を訓練するために使用され、 実世界での精度を向上させます。
  2. クリエイティブデザインとプロトタイピング:クリエイティブ分野では、テキストから画像を生成するモデルを活用したツールにより、デザイナーはコンセプトを迅速に可視化できます。プロンプトを入力するだけで、アーティストは製品デザイン、建築レイアウト、マーケティング資産の複数のバリエーションを生成でき、アイデア創出段階を大幅に加速させます。
  3. コード生成とデバッグ:ソフトウェア開発は、コードリポジトリで訓練されたモデルによって変革された。これらのアシスタントは、コードスニペットの提案、ドキュメント作成、さらにはバグの特定を通じて開発者を支援し、ソフトウェアライフサイクルを効率化している。

コンピュータビジョンとの相乗効果

生成AIと判別型コンピュータビジョンモデルは、しばしば補完的な技術として機能する。一般的なパイプラインでは、生成モデルを用いてデータセットを拡張した後、Ultralytics などのツールを用いて、その拡張されたデータセット上で判別モデルを訓練する。

次のPython 例は ultralytics YOLO26モデルを読み込むパッケージ。 ハイブリッドワークフローでは、このコードを使用して合成生成画像内のオブジェクトを検証できます。

from ultralytics import YOLO

# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")

# Run inference on an image (e.g., a synthetic sample from a generative model)
# The model identifies objects within the generated content
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results to verify the synthetic data quality
results[0].show()

課題と考慮事項

強力な一方で、生成AIはユーザーが対処すべき特有の課題をもたらす。モデルは時に幻覚を生成し、 信憑性のあるように聞こえるが事実と異なる情報や視覚的アーティファクトを生み出すことがある。 さらに、これらのモデルはインターネット規模のデータで訓練されているため、 ソース素材に存在するAIバイアスを意図せず拡散させる可能性がある。

著作権や知的財産に関する倫理的懸念も、様々なAI倫理フレームワークで議論されているように顕著である。スタンフォード人間中心AI研究所などの研究者や組織は、これらの強力なツールが責任を持って開発・導入されるよう、その手法を積極的に模索している。さらに、これらの大規模モデルを訓練する計算コストの高さから、エッジデバイス上での推論をよりエネルギー効率良くするため、モデルの量子化への関心が高まっている。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加