Ultralytics YOLO DocsのReferenceセクションの使用方法
Ultralytics YOLO Docsの「Reference」セクションを使用して、Ultralytics Pythonパッケージの内部構造を理解する方法を学びます。

現在、人工知能(AI)はこれまで以上にアクセスしやすくなっており、誰でも簡単にAIの世界に飛び込み、さまざまな最先端のタスクに向けて多様なAIモデルを素早く使い始めることが可能です。
例えば、コンピュータビジョンは、コンピュータが画像や動画から視覚的な情報を解釈し理解できるようにするAIの一分野であり、Ultralytics YOLO11のようなコンピュータビジョンモデルは、簡単に利用を開始できます。
YOLO11は、物体検出、インスタンスセグメンテーション、画像分類といったタスクをサポートしており、自動運転、セキュリティ監視、小売分析などのアプリケーションに使用できます。

図1:YOLO11を使用してさまざまな物体を検出できます。
具体的には、Ultralytics Python packageは、これらのAIモデルを素早く学習、カスタマイズ、デプロイするための使いやすいツールを提供しており、あらゆるスキルレベルのユーザーが簡単に高度なコンピュータビジョンアプリケーションを構築できます。
しかし、その仕組みをより深く理解したり、独自のカスタマイズを作成したりすることに関心がある場合、Ultralyticsドキュメントのリファレンスセクションは優れたリソースです。このセクションでは、データの処理方法、モデルの学習プロセス、予測の可視化方法など、Ultralytics Python packageの内部構造について説明しています。
この記事では、Ultralyticsドキュメントのリファレンスセクションを詳しく紹介し、コンピュータビジョンプロジェクトでどのように活用するかを解説します。それでは始めましょう!
Link to this sectionUltralytics YOLOモデルの活用に向けたより深い洞察#
Ultralytics Python packageの操作はシンプルで直感的です。わずか数行のコードで、YOLOモデルの学習や、画像内の物体検出を実行できます。
しかし、コンピュータビジョンモデルの操作に慣れてきたら、Ultralyticsドキュメントのリファレンスセクションを活用することで、コードの動作の仕組みや、パッケージがサポートする機能をより深く理解できるようになります。また、分かりやすい解説、設定可能なオプション、そしてUltralytics GitHubリポジトリで利用可能な関連コードへのリンクも含まれています。
リファレンスセクションでは、Ultralytics Python packageの構造を説明しており、モデルのセットアップ、データ読み込み、学習プロセス、予測の作成および返却方法といった主要なコンポーネントを網羅しています。
すべてが明確なカテゴリに分類されているため、目的の情報が簡単に見つかります。例えば、自身のデータセットを使用してモデルを学習させる場合、リファレンスセクションのデータ関連セクションを参照すれば、モデル学習にデータがどのように使用されるかをより詳しく把握できます。
Link to this sectionリファレンスセクションの利用を開始する方法#
Ultralytics YOLOドキュメントのリファレンスセクションにアクセスすると、ページ左側にさまざまなリファレンスカテゴリが記載されたメニューが表示されます。各カテゴリは、models、データ処理、学習関数など、Ultralyticsコードベースの特定の領域に対応しています。
カテゴリをクリックすると、より詳細な情報が記載されたページに移動します。

図2。左側には、さまざまなリファレンスカテゴリのメニューがあります。
同様に、ページ右側には目次があり、各リファレンスページが関数(再利用可能なコードブロック)、クラス(オブジェクト作成の設計図)、メソッド(クラス内で定義された関数)といった主要コンポーネントに分類されています。これにより、探している情報に直接ジャンプできます。

図3。右側には、閲覧中のリファレンスページの目次があります。
Link to this sectionUltralytics GitHubリポジトリの構造#
Ultralytics GitHubリポジトリは、models、training、dataなど、Ultralyticsパッケージの各パーツに基づいたサブディレクトリやサブパッケージに整理されています。ドキュメントのリファレンスセクションも同じ構造に従っており、全体がどのように構成されているかを理解しやすくなっています。
以下は、Ultralytics GitHubリポジトリとUltralyticsドキュメントのリファレンスセクションの両方に共通する、主なサブディレクトリやカテゴリの一部です。
- Models: このセクションは、さまざまなモデルと、予測の実行、パフォーマンスの検証、学習済みモデルのエクスポートといったモードに焦点を当てています。
- Engine: ここには、モデルの学習、検証、予測、エクスポート、評価のためのコアロジックが含まれています。
- Data: データセットの読み込み、処理、拡張を管理します。これには、データローダー(データをバッチ単位でモデルに供給するツール)の作成、変換(リサイズや反転など、モデルの学習効率を高めるための画像変更)の適用、学習用データの準備(画像の整理やラベルのフォーマット)のための関数が含まれます。
- Utils: このセクションでは、可視化ツール、ファイル操作、メトリクスの計算など、コードベース全体で使用される広範なヘルパー関数を提供しています。
- HUB: ノーコードコンピュータビジョンプラットフォームであるUltralytics HUBに接続し、ログイン、モデルのアップロード、APIを通じたデータセットの管理などのクラウド機能を実現します。
- Trackers: 動画やフレームごとの画像シーケンスを扱うアプリケーション向けの物体追跡ロジックを実装しています。
GitHubリポジトリの各サブディレクトリは、ドキュメント内の対応するセクションを持っています。この構造は意図的に一致させており、ドキュメントの閲覧とソースコードの調査を容易に行き来できるようにしています。
実際、多くのリファレンスページでは実際のソースコードも表示されるため、ドキュメントから離れることなく、関数やクラスがどのように実装されているかを正確に確認できます。

図4。リファレンスページにはソースコードも含まれています。
Link to this sectionModels、Engine、Dataコンポーネントの理解#
リファレンスセクションの構成を確認したところで、Ultralyticsパッケージの3つの重要なパーツ、Models、Engine、Dataについて詳しく見ていきましょう。
modelsサブディレクトリには、各タイプのモデルの動作を定義するコードが含まれています。モデルタイプ(YOLO、FastSAM、RT-DETRなど)およびタスク(検出、セグメンテーション、分類など)の両方によって整理されています。それぞれの中には、モデルがどのように予測を行うか、どのように学習されるか、あるいはパフォーマンスがどのように評価されるかといった特定の動作を処理するファイルやモジュールが含まれています。
一方、engineサブディレクトリは、背後でプロセス全体を管理します。modelsサブディレクトリが各モデルの役割に焦点を当てるのに対し、engineサブディレクトリは、それらのタスクを一貫して効率的に実行する方法に焦点を当てています。
また、dataサブディレクトリは、データセットの読み込みと準備を担当します。このコードベースのパーツは、学習データがクリーンで構造化され、多様であることを保証し、モデルの学習効率と汎化性能を高める手助けをします。
このような明確な分離により、コードの保守が容易になり、ユーザーがカスタマイズするための柔軟性も確保されています。
Link to this sectionリファレンスセクションの使用例#
なぜUltralyticsコードベースの各パーツを理解することが重要なのか、疑問に思われるかもしれません。コードのどの部分が何を処理しているかを知っていれば、必要な情報を見つけることや、変更を加えること、問題をトラブルシューティングすることがはるかに簡単になります。
以下に、ドキュメントのリファレンスセクションを使用する方法の例をいくつか挙げます。
- 「モデルはどのように予測を行うのか?」という疑問に対しては、リファレンスセクションのModelsカテゴリに移動し、モデルタイプ(YOLOなど)を選択し、タスク(detectなど)を選んでから、Predictページを開くことで詳細を確認できます。
- データ拡張がどのように適用されているかを知りたい場合は、DataカテゴリのAugmentページを探索できます。そこには、モデルのパフォーマンスを向上させ、学習データの多様性を高めるために使用される組み込みの拡張技術が一覧表示されています。
Link to this sectionリファレンスセクションを通じた結果の探索#
リファレンスセクションは、モデルから返される出力を理解しようとする際にも役立ちます。YOLO11のようなモデルを使用して画像で推論を実行した後、何が検出されたかを記述した一連の結果が返されます。
例えば、カメラフィードでは、人を探知し、その位置をバウンディングボックスで強調表示するとともに、信頼スコア(検出に対するモデルの確信度を示す0から1の間の値)を返します。
その出力を自身のプロジェクトでどのように使用するかを理解しようとしている場合、リファレンスセクションが案内役となります。Resultsモジュールのページには、何が含まれているか、またそれをコード内でどのようにアクセスするかが詳しく記載されています。検出ボックスの表示方法、信頼スコアの確認、結果の表示や保存方法についての詳細があります。

図5。YOLO11から返された結果を可視化する方法の例です。
Link to this section重要なポイント#
Ultralyticsドキュメントは、YOLOモデルを効果的に使用する方法を理解するのに役立ちます。モデルの学習、データの準備、結果の操作といった主要なプロセスを説明しています。各ページには分かりやすい解説とコード例が記載されており、すぐに開発を始められます。
舞台裏で何が起きているのか興味がある場合、ドキュメントのリファレンスセクションでは、その仕組みをステップバイステップで解説しています。コードの構造、各部分の役割、そして全体がどのように連携しているかを示しています。これにより、自身のコンピュータビジョンプロジェクトを自信を持って学習し、カスタマイズし、構築することが容易になります。
活発なコミュニティに参加し、GitHubリポジトリを探索して、AIによる構築についてさらに学びましょう。自身のコンピュータビジョンのアイデアを形にする準備はできましたか?ライセンスオプションにアクセスして開始してください。また、自動車分野でのVision AIやヘルスケア分野でのAIがどのように影響を与えているかについては、当社のソリューションページでご確認ください。






