Yolo 深圳
深セン
今すぐ参加
用語集

モデルのデプロイ

機械学習モデルをクラウドまたはエッジ環境にデプロイする方法を学びましょう。Ultralytics がYOLO26のエクスポートと本番環境展開をいかに効率化するかをご覧ください。

モデルデプロイメントは、訓練済み機械学習モデルを本番環境に統合する重要な段階である。 環境へ統合し、新たなデータに基づいて実用的な意思決定や予測を行う重要な段階である。これは研究や実験環境(多くの場合、隔離されたノートブックで実行される)から、モデルが現実世界のユーザーやシステムと相互作用する稼働中のアプリケーションへの移行を表す。このプロセスにより、重みとアーキテクチャの静的なファイルが、動画フィード内の物体識別やウェブサイトでの商品推薦など、価値を生み出す能力を持つ能動的なAIエージェントへと変容する。

効果的なデプロイメントには、モデルトレーニングとは異なる課題、 具体的にはレイテンシ、スケーラビリティ、ハードウェア互換性への対応が求められます。 組織ではUltralytics を活用し、このライフサイクルを効率化することで、 クラウドでトレーニングされたモデルを、高性能サーバーからリソース制約のあるエッジデバイスまで、 多様な環境にシームレスに展開することを実現しています。

デプロイメントの全体像

デプロイ戦略は一般的に、クラウドデプロイとエッジデプロイの2種類に分類される。選択は、速度、プライバシー、接続性に関する具体的な要件に大きく依存する。

  • クラウド展開:モデルは集中管理されたサーバー上に存在し、多くの場合 AWS SageMakerGoogle AI などのサービスによって管理されます。アプリケーションはインターネット経由でデータを モデルに送信します。 REST APIを介してデータを送信し、モデルはリクエストを処理して結果を返します。この方法は事実上無制限の計算能力を提供するため、大規模で複雑なモデルに最適ですが、安定したインターネット接続に依存します。
  • エッジデプロイメント:モデルは、スマートフォン、ドローン、工場カメラなど、データが生成されるデバイス上でローカルに実行されます。エッジコンピューティングとして知られるこのアプローチでは、情報がデバイス外に流出しないため、遅延を最小限に抑え、データプライバシーを強化します。 TensorRT などのツールが、こうした環境向けにモデルを最適化するために頻繁に利用されます。

モデルの生産準備

モデルをデプロイする前に、通常は最適化処理が行われ、ターゲットハードウェア上で効率的に動作するよう保証されます。このプロセスにはモデルエクスポートが含まれ、トレーニング形式(PyTorchなど)がONNXやTensorFlow Deployなどのデプロイに適した形式に変換されます。 ONNX (Open Neural Network Exchange)や OpenVINOなどのデプロイに適した形式に変換する作業です。

量子化などの最適化技術は、精度を大幅に損なうことなくモデルのサイズとメモリ使用量を削減します。異なるコンピューティング環境間で一貫性を確保するため、開発者はしばしばDockerのようなコンテナ化ツールを使用します。これらはモデルと必要なソフトウェア依存関係をすべてパッケージ化します。

以下は、YOLO26モデルをONNX にエクスポートする方法の例です。これはデプロイ準備における一般的な手順です:

from ultralytics import YOLO

# Load the YOLO26 nano model
model = YOLO("yolo26n.pt")

# Export the model to ONNX format for broad compatibility
# This creates a file suitable for various inference engines
path = model.export(format="onnx")

print(f"Model successfully exported to: {path}")

実際のアプリケーション

モデル展開技術は、様々な産業分野で広く利用されているコンピュータービジョンシステムを支えています。

  • 製造品質管理: スマート製造では、導入されたモデルがコンベアベルトをリアルタイムで監視します。NVIDIA デバイス向けに最適化されたモデルを実行するカメラシステムは、detect 瞬時にdetect 、ロボットアームを起動して不良品を排除します。これはエッジAI導入のみが提供可能な超低遅延を必要とします。
  • 小売分析:店舗は導入済みモデルを活用し、来店客数と顧客行動を分析する。 セキュリティカメラ映像に対象追跡モデルを統合することで、小売業者は人気通路のヒートマップを生成可能。これらの知見は店舗レイアウトの最適化や在庫管理の改善に寄与し、複数拠点からのデータを集約するためクラウドベースの展開が頻繁に利用される。

デプロイメント vs. 推論 vs. トレーニング

機械学習ライフサイクルにおける関連用語とモデル展開を区別することが重要です:

  • モデルトレーニングとは、アルゴリズムがデータセットからパターンを学習する教育段階である。
  • モデルデプロイメントとは、トレーニング済みモデルを本番環境インフラストラクチャ(サーバー、アプリケーション、またはデバイス)に導入する統合フェーズです。
  • 推論は運用フェーズであり、デプロイされたモデルが実際のデータを処理して予測を生成する実際の行為である。例えば、推論エンジンはデプロイされたモデルによって定義された計算を実行する。

監視と保守

デプロイは最終段階ではない。モデルは稼働後も継続的な監視が必要でありデータドリフト(実世界のデータがトレーニングデータから乖離し始める現象)などのdetect PrometheusやGrafanaといったツールを統合し、track 、 システムの長期的な信頼性を確保する。 パフォーマンスが低下した場合、モデルの再トレーニングと再デプロイが必要となり、 これによりMLOpsのサイクルが完結する。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加