Yolo 深圳
深セン
今すぐ参加
用語集

基盤モデル

AIにおける基盤モデルの力を探求しましょう。Ultralytics Platformを活用し、Ultralytics YOLO26のような大規模モデルをカスタムタスクに適応させる方法を学びます。

基盤モデルは人工知能(AI)分野における重要なパラダイムシフトを表す。これは膨大なデータ(多くの場合数十億のパラメータを含む)で訓練された大規模機械学習モデルであり、幅広い下流タスクに適応可能である。従来の機械学習(ML)モデルが特定の花の種類を分類するなど単一の目的向けに構築されるのとは異なり、基盤モデルはリソース集約的な事前学習段階で広範なパターン・構造・関係を学習する。この広範な知識基盤により、開発者は転移学習を通じて新たな問題にモデルを適用でき、最先端の結果を達成するために必要な時間とデータを大幅に削減できる。

中核メカニズム:事前学習と適応

基盤モデルの真価は、事前学習と微調整という二段階の開発プロセスにある。事前学習では、モデルはインターネットの大規模な部分、多様な画像ライブラリ、膨大なコードリポジトリなど、膨大なデータセットに晒される。 この段階では、 自己教師あり学習という手法が 頻繁に利用される。これはモデルがデータ構造自体から独自のラベルを生成する技術であり、手動によるデータアノテーションのボトルネックを解消する。例えば、言語モデルは文中の次の単語を予測することを学び、視覚モデルはエッジ、テクスチャ、 物体の恒常性を理解することを学ぶ。

事前学習が完了したモデルは、汎用性の高い出発点として機能します。 微調整と呼ばれるプロセスを通じて、開発者はより小規模でドメイン特化型のデータセット上で モデルの重みを微調整できます。この機能はAIの民主化の核心であり、 限られた計算リソースを持つ組織でも強力なアーキテクチャを活用できるようにします。 現代のワークフローでは、Ultralytics のようなツールを活用し、この適応プロセスを効率化することが一般的です。これにより、ニューラルネットワークを一から構築することなく、カスタムデータセット上での効率的なトレーニングが可能になります。

実際のアプリケーション

基盤モデルは様々な産業におけるイノベーションの基盤となる。その汎化能力により、自然言語処理から高度なコンピュータビジョンに至るまで幅広いタスクに応用可能である。

  • 医療におけるコンピュータビジョン:専門的なビジョン基盤モデルは、医療画像解析を支援するために微調整が可能である。一般画像で訓練されたモデルを適応させ、MRI画像におけるdetect X線画像における背骨の骨折の detect に活用できる。この応用例は、一般的な視覚理解が命を救う診断ツールへと変換される過程を示している。
  • 産業オートメーション:製造現場では、Ultralytics ビジョンモデルが物体検出の基盤アーキテクチャとして機能する。工場ではこれらのモデルを活用し、品質検査を自動化。組立ライン上の欠陥を高速かつ高精度で検出する。モデルが持つ物体の境界に関する事前知識が、こうしたスマート製造ソリューションの導入を加速させる。

技術的実装例

開発者は基盤モデルを活用することで、最小限のコードで複雑なタスクを実行できます。以下の例では、事前学習済みYOLO26モデル(リアルタイムアプリケーション向けに最適化されたビジョン基盤モデル)を読み込み、画像上で物体検出を実行する方法を示します。

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")

# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

主要用語の区別

AIの分野において「基盤モデル」を関連概念と区別することは、それぞれの具体的な役割を理解する上で有用である:

  • 大規模言語モデル(LLM) LLMは、テキストの処理と生成に特化して設計された基盤モデルの一種である。全てのLLMは基盤モデルであるが、全ての基盤モデルがLLMであるとは限らない。このカテゴリーには、SAM Segment Anything Model)のような視覚モデルやマルチモーダルシステムも含まれる。
  • 転移学習これは基盤モデルを新たなタスクに適用する技術である。基盤モデルは成果物(保存されたニューラルネットワーク)であり、転移学習はその成果物の知識を特定のユースケース(例:農業における害虫防除)に向けて更新するプロセスである。
  • 生成AIこれは 新しいコンテンツ(テキスト、画像、コード)を生成できるシステムを指します。多くの基盤モデルが生成AIアプリケーションを支えていますが、 分類や物体追跡といった判別タスクにも利用可能です。これらは厳密には 「生成」とは言えません。

今後の方向性と影響

基盤モデルの進化は、単一のシステムがテキスト、画像、音声、センサーデータからの情報を同時に処理・関連付け可能なマルチモーダルAIへと向かっている。スタンフォード大学人間中心AI研究所(HAI)などの研究機関による調査は、 これらのシステムが人間のように世界について推論する可能性を浮き彫りにしている。 これらのモデルの効率性が高まるにつれ、 エッジコンピューティングデバイスへの展開がますます現実的になり、 強力なAI機能をスマートフォン、ドローン、IoTセンサーに直接提供できるようになる。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加