Yolo 深圳
深セン
今すぐ参加
用語集

実験追跡

機械学習実験の追跡:再現可能なモデルトレーニングのために、ハイパーパラメータ、データセット、メトリクス、成果物を記録します。Ultralytics YOLO11で実行を整理する方法を学びましょう。

実験追跡とは、機械学習モデルのトレーニング中に生成される変数、メトリクス、および成果物を体系的に記録、整理、分析するプロセスです。科学者の実験ノートと同様に、この手法は検証されたあらゆる仮説の包括的なデジタル記録を作成し、研究開発段階が厳密で透明性が高く再現可能であることを保証します。ハイパーパラメータやデータセットのバージョンといった入力値と、性能グラフや学習済み重みといった出力値を同時に捕捉することで、実験追跡はモデルトレーニングの反復的で混沌とした性質を、構造化されたデータ駆動型ワークフローへと変革します。この体系化は、堅牢な人工知能(AI)システムを効率的に構築しようとするチームにとって極めて重要であり、どの設定が最良の結果をもたらすかを正確に特定することを可能にします。

実験追跡の主要構成要素

コンピュータビジョンプロジェクトのライフサイクルを効果的に管理するには、堅牢な追跡システムが通常、3つの異なるカテゴリの情報を記録します。これらの構成要素を整理することで、開発者は異なる反復を比較し、特定のユースケースに最適な構成を特定できます。

  • パラメータと設定: これらは学習開始前に設定される変数です。学習率、最適化アルゴリズムの選択(例:Adam )、バッチサイズ最新のYOLO26などの特定のモデルアーキテクチャが含まれます。これらを追跡することで、成功した実行を正確に再現できます。
  • パフォーマンス指標:トレーニング中に記録される定量的測定値であり、成功度を評価するために用いられる。 一般的な指標には、誤差を測定する損失関数、 分類タスクにおける精度、 および物体検出における平均精度(mAP)が含まれる。
  • 成果物と出力:成果物とは、実行によって生成される具体的なファイルを指します。例えば、 学習済みモデルの重み 混同行列などの可視化プロット、環境ログなどです。

実世界での応用における関連性

実験追跡の厳格な適用は、精度と安全性が最優先される産業において不可欠である。これによりエンジニアリングチームは過去のデータを振り返り、モデルが特定の挙動を示す理由を理解できる。

医療画像診断

医療分野では、研究者が医師の診断支援のために 医療画像解析を活用している。例えば脳腫瘍検出モデルの 訓練時、エンジニアはデータ拡張手法変化させた 数百の実験を実行する。実験追跡により、 どの前処理ステップの組み合わせが最高の感度をもたらしたかを特定でき、 展開されたAIエージェントが重要な診断シナリオで 偽陰性を最小限に抑えることを保証する。

自動運転車の安全性

自動運転車の開発には、 detect 、標識、detect するために大量のセンサーデータを処理する必要があります。自動運転車向けの物体検出に取り組むチームは、精度と推論遅延の両方を最適化しなければなりません。 実験を追跡することで、モデルサイズと速度のトレードオフを分析し、最終システムが 国家道路交通安全局(NHTSA)などの組織が定めた安全基準を損なうことなく リアルタイムで反応することを保証できる。

関連概念の区別

実験追跡はMLOps(機械学習運用)の基盤となる要素ですが、類似の用語と混同されることがよくあります。正しいワークフローを実装するには、これらの違いを理解することが重要です。

  • 実験追跡とモデル監視の比較:実験追跡は開発およびトレーニング段階(「オフライン」)で行われる。一方、モデル監視はモデルが本番環境にデプロイされた後(「オンライン」)に実施される。監視は実稼働データにおけるデータドリフトや性能低下といった問題の検出に焦点を当てるのに対し、追跡はモデルがユーザーに届く前に最適化することに重点を置く。
  • 実験追跡とバージョン管理: Gitなどのツールはソースコードのバージョン管理を提供し、テキストファイルの変更を時系列で追跡します。実験追跡はさらに一歩進んで、そのコードの特定バージョンを、トレーニング実行の特定データ・パラメータ・結果と関連付けます。バージョン管理が「コードはどのように変更されたか?」に答えるのに対し、実験追跡は「どのパラメータが最良のモデルを生成したか?」に答えます。

Ultralytics YOLO実装

現代のAIフレームワークは、開発者が実行結果をローカルディレクトリやリモートサーバーに簡単にログ記録できるようにすることで、実験の追跡を簡素化します。Ultralytics する場合、プロジェクト名と実行名を定義することで追跡を効果的に整理できます。この構造により、異なる実験仮説を分離するディレクトリ階層が作成されます。

以下の例は、プロジェクト名と実験実行名を明示的に指定しながら、速度と精度において最新の標準であるYOLO26モデルのトレーニング方法を示しています。これにより、メトリクス、ログ、重みが将来の比較のために整理された形で保存されます。

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model, specifying 'project' and 'name' for organized tracking
# Results will be saved to 'runs/detect/experiment_tracking_demo'
results = model.train(data="coco8.yaml", epochs=5, project="runs/detect", name="experiment_tracking_demo")

人気のツールと統合機能

開発者は記録されたデータを可視化および管理するために、専用のソフトウェアに依存しています。これらのツールには、トレーニング曲線とメトリック表を並べて比較できるダッシュボードが搭載されていることがよくあります。

  • MLflow: 実験、再現性、デプロイメントを含む機械学習ライフサイクルを管理するオープンソースプラットフォーム。 Ultralytics 統合により、YOLO 中のメトリクスのシームレスなロギングが可能になります。
  • TensorBoard: もともと TensorFlow向けに開発されたこの可視化ツールキットは、 PyTorchを含む PyTorchなど、 損失曲線や可視化を検査するために 広く使用されています。 TensorBoardとの統合により、 トレーニング指標を簡単に可視化できます。
  • DVC(データバージョン管理)DVCは追跡の概念をデータセットとモデルに拡張し、Gitでは扱えない大規模ファイルを管理します。DVC統合を利用することで、各実験で使用されるデータの厳密なバージョン管理を維持できます。
  • Weights & Biases: 機械学習運用(MLOps)のための開発者中心プラットフォーム。チームがtrack 、 モデルのバージョン管理、結果の可視化を支援します。 Weights & Biases 、複雑なトレーニング実行を分析するための 豊富なインタラクティブチャートを提供します。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加