Can I deploy the same model to multiple regions?

はい。各モデルは複数のリージョンに同時にデプロイできます。利用可能なエンドポイントの数は、お客様のプランによって異なります。

What's the difference between shared and dedicated inference?

共有推論はマルチテナントサービスで実行され、レート制限があるため、開発とテストに最適です。専用エンドポイントは、レート制限がなく、一貫したレイテンシと構成可能なリソースを備えたシングルテナントサービスであり、スケーラブルな本番ワークロード向けに構築されています。

How long does deployment take?

専用エンドポイントのデプロイは通常1〜2分かかります。これには、コンテナのプロビジョニング、起動、および初期ヘルスチェックが含まれます。準備が整い次第、エンドポイントは直ちに推論リクエストの受け入れを開始します。

What is model deployment?

モデルデプロイメントとは、トレーニング済みのコンピュータービジョンモデルを、現実世界のデータを受信および処理できるようにするプロセスです。デプロイされると、アプリケーションはAPIを介して画像やビデオフレームをモデルに送信し、予測を受け取ることができます。Ultralytics Platformでは、ブラウザでモデルをテストし、43のグローバルリージョンのいずれかにある専用エンドポイントにデプロイし、そのパフォーマンスを監視することができます。これらすべてを同じワークスペースから行えます。

コンピュータービジョンモデルをグローバルに展開

mAP50が96.2%、mAP50-95が90.1%、精度が87.2%であるモデルのパフォーマンスメトリクスと、パリにデプロイされたYOLO26sセグメンテーションモデルのログパネルを示すダッシュボード。

トラフィックに合わせたオートスケーリング

専用エンドポイントは、トラフィックの急増時にはスケールアップし、アイドル時にはゼロまでスケールダウンします。

デフォルトでゼロにスケールします。 エンドポイントがリクエストを受信していない場合、コストはかかりません。

レート制限なし。専用 エンドポイントにはスループットの上限がありません。

設定可能なリソース。ワークロードに合わせて、CPU 1～8コア）とメモリ（1～32 GB）を選択してください。

17種類以上のエクスポート形式。あなたのモデルをあらゆる環境で。

Ultralytics 、高性能を実現するためのクラウドおよびエッジ環境での導入に対応しています。Ultralytics YOLO 、あらゆる環境で効率的に動作するようネイティブに最適化されており、演算リソースが限られたエッジデバイスであっても、高い精度、信頼性の高いパフォーマンス、および互換性を提供します。

PyTorchモデルのONNX、TorchScript、OpenVINO、TensorRT GPU、CoreML、TF Liteを含むエクスポート形式のリストと、それぞれのアイコンおよび形式コード。

過去24時間における総リクエスト数13,959件、アクティブなデプロイ数3件、エラー率0%、P95レイテンシ14ミリ秒を示すダッシュボード。

本番環境のすべてを監視

モデルのパフォーマンスをリアルタイムで完全に可視化します。モデルが本番環境にデプロイされると、デプロイメントダッシュボードでは、稼働中のすべてのエンドポイントを一元的に把握できます。また、フレームワークを最適化し、安定して稼働させ続けるために必要なメトリクスやツールキットも提供されます。

リクエスト数。 過去24時間における全エンドポイントのリクエストの合計数 。

P95レイテンシ。実世界のユースケースパフォーマンスを追跡するための95パーセンタイル応答時間。

エラー率。 エラー率が5%を超えた場合にアラートを通知し 、深刻度でフィルタリングされたログを活用して問題を迅速に診断します。

ヘルスチェック。自動再試行機能付きの実時間エンドポイント監視。チェックごとのレイテンシを表示。

よくある質問

同じモデルを複数のリージョンにデプロイできますか？

はい。各モデルは複数のリージョンに同時にデプロイできます。お客様のプランによって利用可能なエンドポイントの総数が決まります。無料プランでは3つ、Proプランでは10個、Enterpriseプランでは無制限です。これにより、各リージョンで低遅延のエンドポイントを使用して、グローバルにユーザーにサービスを提供できます。

デプロイにかかる費用はどのくらいか

専用エンドポイントは、CPU、メモリ、およびリクエスト量に基づいて課金されます。デフォルトでスケール・トゥ・ゼロが有効になっているため、アクティブな推論時間に対してのみ料金が発生し、エンドポイントがリクエストを受信していない場合は費用はかかりません。プラットフォームプランには共有推論が含まれています。

共有推論と専用推論の違いは何ですか？

共有推論は、3つのリージョンにまたがるマルチテナントサービスで実行され、1分あたり20リクエストにレート制限されています。これは開発や迅速なテストに最適です。専用エンドポイントは、43のいずれかのリージョンにデプロイされるシングルテナントサービスであり、レート制限なし、一貫したレイテンシ、設定可能なリソースを備え、スケーラブルな本番ワークロード向けに構築されています。

デプロイにはどのくらい時間がかかりますか？

専用エンドポイントのデプロイは通常1〜2分かかります。これには、コンテナのプロビジョニング、起動、およびサービスが準備完了であることを検証するための初期ヘルスチェックが含まれます。エンドポイントの準備が整い次第、直ちに推論リクエストの受け入れを開始します。

モデルデプロイメントとは？

モデルデプロイメントとは、トレーニング済みのコンピュータービジョンモデルを、現実世界のデータを受信および処理できるようにするプロセスです。デプロイされると、コンピュータービジョンアプリケーションはAPIを介して画像やビデオフレームをモデルに送信し、予測を受け取ることができます。これにより、自動品質検査から本番システムでのリアルタイムobject detectionまで、あらゆる機能が実現可能になります。Ultralytics Platformでは、デプロイメントはエンドツーエンドのトレーニングワークフローに直接統合されています。モデルのトレーニングが完了したら、ブラウザでテストし、43のグローバルリージョンのいずれかにある専用エンドポイントにデプロイし、そのパフォーマンスを監視することができます。これらすべてを同じワークスペースから行えます。

43のグローバルリージョンにコンピュータビジョンモデルを展開する

ブラウザでモデルをテスト

即時フィードバック

調整可能パラメータ

あらゆるタスクに対応

世界43地域にデプロイ

トラフィックに合わせたオートスケーリング

17種類以上のエクスポート形式。あなたのモデルをあらゆる環境で。

本番環境のすべてを監視

数分で統合

デプロイ方法を学ぶ！

まずモデルをトレーニングする必要がありますか？