YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Half-Precision

半精度(FP16)がAIをどのように加速するかを学びます。GPUやエッジデバイス上で、Ultralytics YOLO26を最適化して推論速度の向上とメモリ消費量の削減を実現する方法を見つけましょう。

半精度は、FP16とも呼ばれ、コンピュータメモリ上で16ビットを占有する浮動小数点データ形式です。これは、32ビットを使用する標準的な単精度(FP32)形式とは異なります。人工知能や機械学習の分野において、半精度はモデルのトレーニングと推論を高速化し、メモリ消費量を大幅に削減するために使用される重要な最適化手法です。ニューラルネットワークのモデル重みや勾配などの数値をより少ないビットで保存することで、開発者はより大きなモデルをGPU(グラフィックス処理ユニット)に収めたり、既存のモデルを大幅に高速で実行したりできるようになります。この効率化は、YOLO26のようなモダンで複雑なアーキテクチャを、精度を大きく犠牲にすることなく、リソースが限られたデバイスにデプロイするために不可欠です。

Link to this section浮動小数点形式のメカニズム#

半精度を理解するには、フル精度と比較するのが役立ちます。標準的な32ビット浮動小数点数(FP32)は、指数部と仮数部により多くのビットを割り当てており、非常に広いダイナミックレンジと高い数値精度を提供します。しかし、ディープラーニングモデルは小さな数値誤差に対して非常に高い耐性を持っています。ニューラルネットワークは、16ビット形式で提供される制限されたダイナミックレンジや粒度であっても、多くの場合効果的に学習できます。

半精度への移行は、メモリ帯域幅の要件を半分に削減します。これにより、トレーニング中のバッチサイズを大きくすることが可能となり、勾配の更新を安定させ、全体的なトレーニングプロセスを高速化できます。NVIDIAのTensor Coreのようなモダンなハードウェアアクセラレータは、FP32よりも大幅に高い速度でFP16による行列演算を実行するように最適化されています。

Link to this sectionAIワークフローにおける主なメリット#

半精度の採用は、AI実務者にとっていくつかの具体的な利点をもたらします。

  • メモリフットプリントの削減: モデルが必要とするVRAM(ビデオRAM)が半分になるため、開発者は同じハードウェア上でより大きなネットワークをトレーニングしたり、より高解像度のトレーニングデータを使用したりできるようになります。
  • 推論の高速化: 自律走行車や映像解析などのリアルタイムアプリケーションでは、FP16を使用することでスループット(1秒あたりのフレーム数)を2倍にし、推論レイテンシを削減できます。
  • エネルギー効率: 処理するビット数が少ないほど消費電力が抑えられるため、バッテリー寿命に制約のあるエッジAIデバイスやスマートフォンにとって極めて重要です。
  • 混合精度トレーニング: 多くのモダンなフレームワークでは混合精度が利用されており、モデルは安定性のためにFP32で重みのマスターコピーを保持しつつ、負荷の高い計算はFP16で実行します。これにより、速度と収束の安定性という「両方の長所」が得られます。

Link to this section実社会での応用#

半精度は、プロダクショングレードのAIシステムにおいて広く普及しています。以下に2つの具体的な例を挙げます。

  1. エッジデバイスでのリアルタイム物体検出: 不審者を検知するためにUltralytics YOLO26を実行している防犯カメラシステムを検討します。モデルをFP16でデプロイすることで、NVIDIA JetsonやRaspberry Pi AI Kitのような組み込みチップ上でスムーズに動作させることができます。計算負荷が軽減されることで、システムは遅延なくリアルタイム推論モードでビデオフィードを処理でき、これはタイムリーな警告のために極めて重要です。

  2. 大規模言語モデル(LLM)のデプロイ: GPT-4やLlamaのバリエーションなどの生成AIモデルは、数十億のパラメータを持っています。これらのモデルをフル精度(FP32)で読み込むと、コスト的に見合わない膨大なサーバーメモリが必要となります。これらのモデルをFP16(あるいはそれ以下の形式)に変換することで、クラウドプロバイダーは基盤モデルを何千人ものユーザーに同時に提供できるようになり、チャットボットや自動コンテンツ生成といったサービスを経済的に実現可能にします。

Link to this section半精度と量子化の比較#

どちらの手法もモデルサイズを削減することを目的としていますが、「半精度」とモデル量子化を区別することが重要です。

  • 半精度(FP16): ビット幅を32から16に削減しますが、データは浮動小数点数として維持されます。妥当なダイナミックレンジを保持しており、多くの場合GPUトレーニングや推論におけるデフォルトの選択肢となります。
  • Quantization (INT8): Converts floating-point numbers into integers (usually 8-bit). This offers even greater speed and memory savings but can sometimes lead to a more noticeable drop in accuracy if not done carefully (e.g., via quantization-aware training). FP16 is generally safer for preserving model performance, while INT8 is used for extreme optimization.

Link to this sectionUltralyticsを用いた半精度の実装#

ultralyticsライブラリを使用すると、半精度を簡単に利用できます。予測中にモデルはハードウェアがサポートしていれば自動的に半精度に切り替えることができ、明示的にリクエストすることも可能です。

以下は、YOLO26モデルを読み込み、半精度を使用して推論を実行する方法を示すPythonの例です。half=Trueで実行するには、通常CUDA対応のGPUが必要であることに注意してください。

import torch
from ultralytics import YOLO

# Check if CUDA (GPU) is available, as FP16 is primarily for GPU acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"

# Load the latest YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference on an image with half-precision enabled
# The 'half=True' argument tells the engine to use FP16
results = model.predict("https://ultralytics.com/images/bus.jpg", device=device, half=True)

# Print the device and precision status
print(f"Inference device: {results[0].orig_img.shape}, Speed: {results[0].speed}")

データセットやトレーニングパイプラインを管理しているユーザー向けに、Ultralytics Platformはクラウド上でこれらの最適化の多くを自動的に処理し、アノテーションから最適化されたモデルデプロイへの移行を効率化します。

Link to this section詳細な読み物とリソース#

数値形式とそのAIへの影響についてさらに詳しく調べるには、Tensor Coreに関するNVIDIAディープラーニング性能ドキュメントを参照してください。これらの最適化が開発ライフサイクルにどのように組み込まれるかについてのより広い理解を得るには、機械学習運用(MLOps)についてお読みください。

さらに、異なる最適化戦略間のトレードオフに関心がある方は、ビット精度を減らすのではなく接続を削除する枝刈り(Pruning)について調べるか、デジタル演算の技術仕様についてはIEEE浮動小数点演算規格(IEEE 754)を確認してください。これらの基礎を理解することは、ONNXTensorRTのような形式にモデルをエクスポートして本番環境で利用する際に、情報に基づいた決定を下すのに役立ちます。

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう