AIにおける基盤モデルの力を探求しましょう。Ultralytics Platformを活用し、Ultralytics YOLO26のような大規模モデルをカスタムタスクに適応させる方法を学びます。
基盤モデルは人工知能(AI)分野における重要なパラダイムシフトを表す。これは膨大なデータ(多くの場合数十億のパラメータを含む)で訓練された大規模機械学習モデルであり、幅広い下流タスクに適応可能である。従来の機械学習(ML)モデルが特定の花の種類を分類するなど単一の目的向けに構築されるのとは異なり、基盤モデルはリソース集約的な事前学習段階で広範なパターン・構造・関係を学習する。この広範な知識基盤により、開発者は転移学習を通じて新たな問題にモデルを適用でき、最先端の結果を達成するために必要な時間とデータを大幅に削減できる。
基盤モデルの真価は、事前学習と微調整という二段階の開発プロセスにある。事前学習では、モデルはインターネットの大規模な部分、多様な画像ライブラリ、膨大なコードリポジトリなど、膨大なデータセットに晒される。 この段階では、 自己教師あり学習という手法が 頻繁に利用される。これはモデルがデータ構造自体から独自のラベルを生成する技術であり、手動によるデータアノテーションのボトルネックを解消する。例えば、言語モデルは文中の次の単語を予測することを学び、視覚モデルはエッジ、テクスチャ、 物体の恒常性を理解することを学ぶ。
事前学習が完了したモデルは、汎用性の高い出発点として機能します。 微調整と呼ばれるプロセスを通じて、開発者はより小規模でドメイン特化型のデータセット上で モデルの重みを微調整できます。この機能はAIの民主化の核心であり、 限られた計算リソースを持つ組織でも強力なアーキテクチャを活用できるようにします。 現代のワークフローでは、Ultralytics のようなツールを活用し、この適応プロセスを効率化することが一般的です。これにより、ニューラルネットワークを一から構築することなく、カスタムデータセット上での効率的なトレーニングが可能になります。
基盤モデルは様々な産業におけるイノベーションの基盤となる。その汎化能力により、自然言語処理から高度なコンピュータビジョンに至るまで幅広いタスクに応用可能である。
開発者は基盤モデルを活用することで、最小限のコードで複雑なタスクを実行できます。以下の例では、事前学習済みYOLO26モデル(リアルタイムアプリケーション向けに最適化されたビジョン基盤モデル)を読み込み、画像上で物体検出を実行する方法を示します。
from ultralytics import YOLO
# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")
# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
AIの分野において「基盤モデル」を関連概念と区別することは、それぞれの具体的な役割を理解する上で有用である:
基盤モデルの進化は、単一のシステムがテキスト、画像、音声、センサーデータからの情報を同時に処理・関連付け可能なマルチモーダルAIへと向かっている。スタンフォード大学人間中心AI研究所(HAI)などの研究機関による調査は、 これらのシステムが人間のように世界について推論する可能性を浮き彫りにしている。 これらのモデルの効率性が高まるにつれ、 エッジコンピューティングデバイスへの展開がますます現実的になり、 強力なAI機能をスマートフォン、ドローン、IoTセンサーに直接提供できるようになる。