Yolo 深圳
深セン
今すぐ参加
用語集

スケーラビリティ

Explore how scalability empowers AI systems to handle growth. Learn to optimize MLOps with [Ultralytics YOLO26](https://docs.ultralytics.com/models/yolo26/) and the [Ultralytics Platform](https://platform.ultralytics.com) for high-performance, distributed training and seamless deployment.

Scalability refers to the capability of a system, network, or process to handle a growing amount of work by adding resources. In the context of Artificial Intelligence (AI) and Machine Learning (ML), scalability describes a model's or infrastructure's ability to maintain performance levels as demand increases. This demand typically manifests as larger datasets during training, higher user traffic during inference, or increased complexity in computational tasks. A scalable architecture allows for seamless expansion—whether deploying a computer vision model to a single embedded device or serving millions of API requests via cloud clusters—ensuring that inference latency remains low even under heavy load.

AIにおけるスケーラビリティの重要性

Designing for scalability is a critical component of successful Machine Learning Operations (MLOps). A model that functions perfectly in a controlled research environment may fail when exposed to the high-velocity data streams found in production. Effectively managing Big Data requires systems that can scale horizontally (adding more machines to a cluster) or vertically (adding more power, such as RAM or GPUs, to existing machines).

スケーラブルなAIシステムの主な利点には以下が含まれます:

  • 信頼性:スケーラブルなシステムは、予期せぬトラフィックの急増時にも一貫したサービス稼働時間を確保し、 重要なアプリケーションのクラッシュを防止します。
  • コスト効率性:動的スケーリングにより、利用率が低い期間にはリソースを縮小できます。この機能は、AWSや Google などのクラウドコンピューティングプラットフォームで管理されることが一般的です。
  • 将来を見据えた設計:スケーラブルなインフラストラクチャは、ハードウェア環境の全面的な刷新を必要とせずに、 ビジョン・トランスフォーマー(ViT)など、より新しく複雑なアルゴリズムに対応します。

スケーラビリティを実現するための戦略

スケーラブルなAIソリューションを構築するには、モデル・アーキテクチャと導入インフラの両方を最適化する必要がある。

  • Distributed Training: When training datasets become too large for a single processor, distributed training splits the workload across multiple Graphics Processing Units (GPUs). Frameworks like PyTorch Distributed allow developers to parallelize computations, significantly reducing the time required to train foundation models. Tools like the Ultralytics Platform simplify this process by managing cloud training resources automatically.
  • 効率的なモデルアーキテクチャ:適切なモデルアーキテクチャの選択はスループットにとって極めて重要です。 Ultralytics 、従来モデルよりも小型かつ高速に設計されており、エッジAIデバイスから大規模サーバーファームまで、多様なハードウェア環境でネイティブにスケーラブルです。
  • Containerization and Orchestration: Packaging applications with Docker ensures they run consistently across different environments. For managing large clusters of containers, Kubernetes automates the deployment, scaling, and management of containerized applications.
  • モデル最適化: モデル量子化 プルーニングといった技術は、モデルのメモリ使用量と計算コストを削減します。 NVIDIA TensorRT は推論速度をさらに加速し、既存ハードウェア上でより高いスループットを実現します。

コード例:スケーラブルなバッチ推論

推論時のスケーラビリティを向上させる効果的な手法の一つは、入力を順次処理するのではなくバッチ処理することである。 GPU 最大化され、全体のスループットが向上する。

from ultralytics import YOLO

# Load a scalable YOLO26 model (smaller 'n' version for speed)
model = YOLO("yolo26n.pt")

# Define a batch of images (URLs or local paths)
# Processing multiple images at once leverages parallel computation
batch_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]

# Run inference on the batch
results = model(batch_images)

# Print the number of detections for the first image
print(f"Detected {len(results[0].boxes)} objects in the first image.")

実際のアプリケーション

スケーラビリティにより、AI技術は理論研究から世界的な産業ツールへと移行することが可能となる。

  • スマート製造: 製造分野におけるAIでは、自動検査システムは高速組立ライン上で毎時数千の部品を分析しなければならない。スケーラブルな物体検出システムにより、生産速度が向上しても品質管理プロセスはボトルネック化することなく高い精度を維持できる。
  • 小売レコメンデーションエンジン:主要なeコマースプラットフォームは、 レコメンデーションシステムを活用し、数百万件の パーソナライズされた商品提案を瞬時に提供しています。スケーラブルなインフラにより、これらのプラットフォームは ブラックフライデーのような大規模イベント(トラフィックが100倍に急増する可能性あり)にも対応可能で、 Microsoft プロバイダーを通じて追加サーバーノードを動的にプロビジョニングします。

スケーラビリティと関連概念の比較

頻繁に混同されるが、スケーラビリティはパフォーマンスや効率性とは異なる概念である。

  • スケーラビリティ対パフォーマンス: パフォーマンスとは通常、特定の時点におけるシステムの速度や精度(例:1秒あたりのフレーム数)を指します。スケーラビリティとは、ワークロードが増加してもそのパフォーマンスを維持するシステムの能力を意味します。
  • スケーラビリティ対効率性:効率性は特定のタスクを完了するために使用されるリソースを測定する (例:推論ごとのエネルギー消費量)。システムは効率的であってもスケーラブルでない場合がある(並列タスクを処理できない場合)、あるいはスケーラブルであっても非効率的である場合がある(成長を処理するために過剰なリソースを使用する場合)。
  • スケーラビリティ対柔軟性:柔軟性により、システムは異なる種類のタスクを処理できます。例えば YOLO11 検出、セグメンテーション、 姿勢推定を処理する。スケーラビリティは特に、同じタスクをより多く処理することに焦点を当てる。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加