Ultralytics Platformによる画像アノテーションの効率化
Ultralytics Platformにおける画像アノテーションについて、データセットのラベリング、アノテーションの管理、モデル用のデータ準備といった組み込みツールを含めて解説します。

Ultralyticsは先日、コンピュータビジョン開発のライフサイクル全体をサポートするために構築された環境であるUltralytics Platformを発表しました。このプラットフォームは、データセットの準備、画像や動画のアノテーション、モデルのトレーニング、デプロイなど、ビジョンAIワークフローのさまざまな段階を管理するためのツールを一元化します。
自動運転やヘルスケアなどの業界で採用が進んでいるにもかかわらず、コンピュータビジョンソリューションの構築は、依然として断片的なプロセスと見なされることがあります。その主な理由の一つは、コンピュータビジョンモデルがトレーニングに使用するデータの品質に大きく依存しているためです。トレーニングを開始する前に、モデルが何を検知または認識すべきかを学習できるよう、データセットを作成、整理、レビュー、およびラベル付けする必要があります。
視覚データを扱う際、このプロセスはデータアノテーション、または画像アノテーションとして知られています。画像アノテーションでは、画像内の特定の箇所にマークを付け、トレーニング中にモデルをガイドするためのラベルを割り当てます。
例えば、画像内の犬を検知することが目標であれば、アノテーターは各犬の周囲にバウンディングボックスを描画して、それらがどこに現れるかを示します。より詳細なタスクでは、セグメンテーションマスクを使用して犬の形状をなぞったり、姿勢を捉えるためにキーポイントをマークしたりする場合があります。これらのラベル付けされた例は、デプロイ後のモデルのパフォーマンスに直接影響を与えます。
画像アノテーションのワークフローを大規模に管理することは困難な場合があります。大規模なデータセットでは多くの場合、一貫したラベル付け基準、複数のアノテーター間のコラボレーション、そしてアノテーションのレビューと修正を容易にするツールが必要となります。
Ultralytics Platformは、組み込みのアノテーションエディターによってこれらを実現します。複数のアノテーションタスクタイプをサポートしており、チームは単一のワークフロー内でデータにラベルを付け、コンピュータビジョン用データセットを準備するためのよりシンプルな方法を利用できます。

図1. Ultralytics Platformのアノテーションエディターの様子 (ソース)
この記事では、Ultralytics Platformのアノテーションエディターがどのようにチームの効率的なデータセットのアノテーションを支援し、データ準備を効率化するかを解説します。さっそく始めましょう!
Link to this sectionコンピュータビジョンにおけるデータアノテーション#
Ultralytics Platformで利用可能な画像アノテーションツールについて詳しく見る前に、データアノテーションとは何か、そしてなぜコンピュータビジョンシステムを構築する上で重要なのかを改めて確認しておきましょう。
コンピュータビジョンモデルは、データセットと呼ばれる大量の画像や動画コレクションを分析することで学習します。しかし、生の画像だけでは、モデルが何を検知または認識すべきかを理解するための十分な情報が得られません。データをトレーニングに役立てるには、モデルが探すべきオブジェクト、形状、パターンを学習できるように、データラベリングを通じて画像にラベルを付ける必要があります。
画像アノテーションでは、画像内の特定の要素にマークを付け、モデルが何を学習すべきかを表すラベルを割り当てます。これらのラベル付けされた例は、トレーニング中にディープラーニングモデルやアルゴリズムをガイドし、新しい画像を処理する際に同様のパターンを認識するのを助けます。
コンピュータビジョンのタスクが異なれば、アプリケーションやユースケースに応じて必要な画像アノテーションの種類も異なります。例えば、オブジェクト検知のためにオブジェクトの周囲にバウンディングボックスを描画したり、セマンティックセグメンテーションのために画像内の領域をなぞったり、ポーズ推定のためにキーポイントを定義したり、分類のために画像全体にラベルを割り当てたりすることがあります。
Link to this sectionデータの管理と準備#
コンピュータビジョンプロジェクトのためにデータを準備する際は、多くの場合、さまざまなファイル形式を扱い、データセットを整理する必要があります。また、機械学習アルゴリズムのアノテーションやトレーニングに向けてすべてが準備されていることを確認することも含まれます。多くのワークフローでは、このプロセスが複数のツールにまたがっており、データを使用可能にする前にアップロード、クリーニング、システム間での移動が行われています。
Ultralytics Platformは、データ準備、モデルトレーニング、デプロイを単一の環境で処理することで、これを簡素化します。チームは画像、動画、データセットのアーカイブをアップロードでき、手動またはAI自動アノテーションを用いた、完全にカスタマイズ可能なデータ準備手法を活用できます。Ultralytics Platformは、生のデータとYOLOやCOCOのような標準形式の両方をサポートしているため、新しいプロジェクトを簡単に開始できます。また、プラットフォーム上の既存のデータセット(チームが新しいプロジェクトや実験を迅速に開始するために使用できるアノテーション済みデータセットを含む)へのアクセスも提供します。

図2. Ultralytics Platformの単一環境でデータセットをアップロードして管理。(ソース)
データが利用可能になれば、プラットフォーム上で直接管理できます。開発者は画像をレビューし、アノテーションの進捗を監視し、組み込みの可視化機能を使用してデータセットの分布を把握し、潜在的なギャップを特定できます。
また、プラットフォームはデータセットのバージョン管理をサポートしており、データが進化するにつれてそのスナップショットを記録するのに役立ちます。これにより、変更の追跡、実験の比較、トレーニング中の整合性の維持が容易になります。
データの準備が整えば、チームは画像をアノテーションする段階に進むことができます。ここでは、モデルが何を検知するかを学習できるようにラベルが付けられます。
Link to this sectionUltralytics Platformでのデータセットのアノテーション#
データがアップロードされたら、次のステップはアノテーションです。ここで画像データにラベルが付けられ、コンピュータビジョンモデルをトレーニングするための基礎が築かれます。Ultralytics Platformには、アノテーションエディターを通じた組み込みの画像アノテーションサービスが含まれており、チームは同じ環境内で直接データセットをラベル付けおよび管理できます。
アノテーションエディターは、ユーザーが画像をレビューし、ラベルを追加し、必要に応じてアノテーションを更新できるシンプルなワークスペースで展開されます。すべてが1か所に整理されているため、データセットの整合性を保ち、データトレーニングの準備を整えるのが容易になります。
チームはデータセットをアップロードし、ブラウザ上で直接画像のラベル付けを開始できます。アノテーションクラスを定義・管理することで、データセット全体でラベルの一貫性を維持できます。アノテーションが作成されると、ユーザーはエディター内で視覚的にレビューできるため、モデルトレーニングに進む前に正確性を簡単に確認できます。
Link to this sectionUltralytics Platformの画像アノテーションツール#
Ultralytics Platformには、効率的なデータセットのラベル付けワークフローをサポートする機能もいくつか含まれており、高度なアルゴリズムを使用してアノテーションプロセスを簡素化します。
Ultralytics Platformで利用可能な主な機能の一部を以下に示します:
- 手動アノテーション: この手法により、ユーザーは画像上で直接、バウンディングボックス、セグメンテーション領域、キーポイントなどの画像アノテーションを作成する際、完全な制御と柔軟性を得ることができます。
- AIアシストによるラベリング: この機能は、提案されたアノテーションを自動的に生成し、手動ラベリングの必要性を軽減します。SAM (Segment Anything Model) を使用してワンクリックでオブジェクトや領域を検知し、アノテーションプロセスを効率化します。ユーザーは提案を確認および確定してからデータセットに追加できます。
- アノテーション編集: ユーザーは、画像アノテーションの作成後、いつでも修正または洗練させることができます。これにより、ラベリングのミスを修正し、アノテーションプロセス全体を通じて一貫したデータセットラベルを維持するのに役立ちます。
- クラス管理: チームや個人の開発者は、データセットのラベリング中に使用するアノテーションクラスを定義および整理できます。これは、画像全体でラベルを一致させ、クラスを正確に認識・識別できるモデルをトレーニングする上で重要です。
手動ツール、人工知能、自動化を組み合わせることで、Ultralytics Platformはユーザーがより効率的に画像をアノテーションできるよう支援します。また、スケーラブルなコンピュータビジョンモデル向けの高品質なトレーニングデータの準備も可能にします。
Link to this sectionサポートされているアノテーションタスクタイプ#
製品の品質保証といった異なるユースケースでは、画像や動画内で何を検知する必要があるかに応じて、異なるタイプのアノテーションが必要となります。上で触れたように、Ultralytics Platformは5つのオブジェクト検知タスクをサポートしており、それぞれ独自のアノテーションタイプがあります。
プラットフォームでサポートされているアノテーションタスクと、それらがデータセットのラベリングにどのように使用できるかを詳しく見ていきましょう。
Link to this sectionオブジェクト検出#
オブジェクト検知は、画像内のオブジェクトを識別および位置特定します。アノテーターは各ターゲットオブジェクトをバウンディングボックスでマークし、画像内のどこにアイテムが出現するかを示します。
アノテーションエディターでは、これはバウンディングボックスツールを使用して行われます。「編集モード」に入り、クリック&ドラッグでオブジェクトの周囲に長方形を描画し、ドロップダウンメニューからクラスラベルを割り当てることができます。
バウンディングボックスは作成後に調整できます。アノテーターはコーナーやエッジのハンドルをドラッグしてサイズを変更したり、ボックスの中心をドラッグして移動させたり、キーボードショートカットを使用して削除したりできます。これらのアノテーションは、ビジョンモデルがさまざまなシーンや状況でオブジェクトを検知できるように学習するのを助けます。

図3. Ultralytics Platformでのバウンディングボックスを使用したオブジェクト検知アノテーション。(ソース)
Link to this sectionインスタンスセグメンテーション#
インスタンスセグメンテーションは、画像内のオブジェクトの正確な形状を定義することで、より詳細なアノテーションを提供します。単純なボックスを描く代わりに、アノテーターはポリゴンアノテーションを使用してオブジェクトの境界線をなぞり、画像セグメンテーションタスクのための正確なマスクを作成します。
アノテーションエディターには、このタスク用のポリゴンツールが含まれています。アノテーターはオブジェクトの端に複数の頂点を配置して形状をなぞります。頂点が配置されたら、ポリゴンを閉じてセグメンテーションマスクを作成できます。
ポリゴンの作成後に頂点を調整できます。個々のポイントを移動させてオブジェクトの境界を洗練させたり、必要に応じて頂点を削除したりできます。これらのピクセルレベルのアノテーションは、モデルが詳細な視覚構造を学習し、近くに配置されたオブジェクトを区別できるようにするのに役立ちます。
Link to this section姿勢推定#
ポーズ推定アノテーションは、身体の関節の位置とそれらの関係を捉えます。これは、モデルが画像内の人間や動物の構造や動きを理解するのに役立ちます。
キーポイントツールを使用して、アノテーターは肩、肘、手首、腰、膝、足首などの身体の関節を表すキーポイントを配置します。プラットフォームは、17ポイントのCOCOヒューマンポーズ形式や、手、顔、犬、ボックスコーナー用のテンプレートなど、いくつかの組み込みスケルトンテンプレートをサポートしています。
テンプレートを使用すると、ワンクリックでスケルトンレイアウト全体を配置でき、その後、画像内のポーズに合わせて個々のキーポイントを調整できます。各キーポイントには、表示されているか隠れているかを示す可視性フラグを含めることもできます。

図4. キーポイントとスケルトンテンプレートを使用したポーズ推定アノテーション。(ソース)
Link to this section指向性バウンディングボックス (OBB)#
指向性バウンディングボックスは、回転をサポートすることで従来のバウンディングボックスを一歩進化させたものです。このタイプのアノテーションは、オブジェクトが画像フレームと一致しておらず、角度を持って出現する場合に便利です。
アノテーションエディターでは、アノテーターは指向性バウンディングボックスツールを使用して、オブジェクトの周囲に回転した長方形を描画できます。最初のボックスを描画した後、回転ハンドルを使用して角度を調整し、コーナーハンドルを使用してボックスのサイズを変更できます。
回転されたアノテーションは、航空画像、産業検査データセット、その他オブジェクトが斜めに出現したり、異なる視点から見えたりするシナリオでよく使用されます。

図5. 航空画像内の回転されたオブジェクトに対する指向性バウンディングボックス (OBB) アノテーション。(ソース)
Link to this section画像分類#
画像分類は、個々のオブジェクトにマークを付けるのではなく、画像全体にラベルを割り当てます。
分類データセットの場合、アノテーションエディターはクラスセレクターパネルを提供します。アノテーターは、サイドバーからクラスを選択するか、より高速なラベリングのためにキーボードショートカットを使用して、画像にラベルを割り当てることができます。
これらの画像レベルのラベルは、モデルがさまざまなカテゴリを表す高レベルの視覚パターンを学習するのに役立ちます。
Link to this sectionSAMを用いたAIアシストによるアノテーション#
セグメンテーションのようなタスクのために画像にラベルを付ける作業は、特にオブジェクトを正確になぞる必要がある場合、丁寧で詳細な作業が求められます。Ultralytics Platformには、アノテーションの正確さを保ちレビューを容易にしつつ、プロセスをスピードアップするAIアシストによるアノテーションツールが含まれています。
例えば、アノテーターは、アノテーションに含めたいオブジェクトの一部をクリックして画像と対話できます。また、結果を洗練させるために除外すべき領域をマークすることもできます。これらの入力に基づいて、モデルはリアルタイムでセグメンテーションマスクを生成し、保存前にレビューおよび調整できます。
このアプローチにより、すべての詳細を手動でなぞる必要なく、複雑な画像を扱う作業が容易になります。同時に、アノテーターは最終的な出力を制御できるため、データセット全体でアノテーションの一貫性が保たれます。

図6. Ultralytics Platformのスマートアノテーションツールを使用したAIアシストセグメンテーション。(ソース)
これらの機能はSegment Anything Models (SAM) によって駆動されます。これらのモデルは、最小限の入力から高品質なセグメンテーションを生成するように設計された、オープンソースのコンピュータビジョンツールという広範なエコシステムの一部です。プラットフォームはSAM 2.1やSAM 3を含む複数のSAMバリアントをサポートしており、チームはニーズに応じて、より高速なパフォーマンスか、より詳細な結果かを選択できる柔軟性を備えています。
これらのAIアシストツールは、オブジェクト検知、インスタンスセグメンテーション、指向性バウンディングボックス検知などのタスク全体で適用できます。これは、チームが信頼性の高いモデルトレーニングに必要な品質を維持しながら、大規模なデータセットをより効率的に処理できることを意味します。
Link to this section組み込みツールによるアノテーションワークフローの改善#
アノテーション作業が進むにつれて、前の作業に戻ってラベルを調整したり、エラーを修正したり、画像をより詳細にレビューしたりすることは一般的です。Ultralyticsのアノテーションエディターには、これらの日常的なタスクの処理を容易にし、時間を短縮する組み込みツールが含まれています。
エディターで利用可能なワークフロー機能の一部を以下に示します:
- キーボードショートカット: エディターには、アノテーションの保存、変更の取り消しまたはやり直し、ラベルの削除、アノテーション中のクラス選択など、一般的なアクションをスピードアップするショートカットが含まれています。
- 取り消しとやり直しの履歴: アノテーターは、編集セッション中に加えた変更を簡単に元に戻したり、復元したりできます。これにより、チームは進捗を失うことなくアノテーションを実験し、素早くミスを修正できるため、データセット準備中の品質管理が向上します。
- 柔軟なアノテーション編集: アノテーションは作成後も調整可能です。ユーザーは、特に不規則な形状のオブジェクトを洗練させる際に、必要に応じて形状のサイズ変更、移動、指向性バウンディングボックスの回転、またはクラスラベルの更新を行うことができます。
- 表示コントロール: エディターには、アノテーションやクラスラベルを表示または非表示にできる表示切り替えボタンが含まれており、ラベリング中に画像をより検査しやすくなります。
- 精密ツール: ズームやピクセル座標付きの十字カーソルなどの機能により、アノテーターは詳細な画像を扱う際にラベルをより正確に配置できます。
Link to this sectionUltralytics Platformでのアノテーションクラスの管理#
明確で一貫したアノテーションクラスは、信頼性の高いコンピュータビジョンデータセットを構築する上で重要な役割を果たします。プロジェクトが成長するにつれて、特に複数のアノテーターが関与する場合、大規模なデータセット全体でのデータラベリング管理は困難になる可能性があります。クラスを適切に整理しておくことは、アノテーションの一貫性を保ち、モデルが構造化されたデータから学習できるようにするのに役立ちます。
Ultralytics Platformは、クラス管理を直接アノテーションエディターに取り込むことで、このプロセスを簡素化します。チームはラベルを個別に扱う代わりに、作業中にクラスを作成、更新、レビューできるため、アノテーションワークフロー全体で一貫性を保つことが容易になります。
エディター内では、すべてのクラスがアノテーションキャンバスの横にあるサイドバーで利用可能です。これにより、ラベリング中に適切なラベルを選択し、データセット全体でクラスがどのように使用されているかを簡単に把握できます。ユーザーは、ワークフローを中断することなく、既存のクラスを検索したり、必要に応じて新しいクラスを作成したりできます。
クラスの詳細はいつでも更新できます。名前を直接編集でき、異なるクラスをアノテーション全体で識別しやすくするために色を割り当てることができます。また、エディターには各クラスに関連付けられているアノテーション数が表示され、ユーザーがレビューできるため、チームは一貫性と正確性を確認できます。
すべてのクラスは一元化されたテーブルを通じて管理され、並べ替え、検索、更新が可能です。ここで行われた変更はデータセット全体に自動的に適用されるため、アノテーションプロジェクトが拡大してもチームは一貫性を維持できます。

図7. アノテーションエディターでのクラス管理は、ラベルの整理と色のカスタマイズを示しています。(ソース)
Link to this sectionアノテーションの品質が実際のパフォーマンスに与える影響#
コンピュータビジョンシステムが開発から実運用へ移行するにつれ、アノテーション済みデータの品質がモデルのパフォーマンスに重要な役割を果たします。適切にラベル付けされたデータセットは、特に動的または予測不可能な環境において、モデルがより正確で一貫した予測を行うのに役立ちます。
実際には、アノテーションのわずかな不一致であっても、モデルの挙動に影響を与える可能性があります。オブジェクトのラベル付け方法やエッジケースの処理方法の違いは、トレーニング中は明らかではないかもしれませんが、システムがデプロイされた後には予測の信頼性が低下する原因となる可能性があります。
さらに、これらの不一致は実世界のアプリケーションではより顕著になる可能性があります。例えば、ロボティクスやヘルスケアシステムでは、モデルはリアルタイムでオブジェクトを検知し、アクションをガイドするために視覚入力に依存しています。ラベリングのばらつきは、これらのシステムが周囲の状況をどの程度正確に解釈するかに影響を与える可能性があります。
一貫したアノテーションの実践を維持し、Ultralyticsのようなプラットフォームを使用して時間をかけてデータセットを管理および洗練させることで、チームは制御されたテスト環境を超えて、より信頼性の高いパフォーマンスを発揮するモデルを構築できます。
Link to this section重要なポイント#
高品質なデータアノテーションは、正確なコンピュータビジョンモデルをトレーニングし、画像アノテーションプロジェクトの成功をサポートするために不可欠です。Ultralytics Platformは、複数のビジョンタスクをサポートする強力なアノテーションエディターにより、このプロセスを簡素化します。手動アノテーションツールとSAMを使用したAIアシストによるラベリング、および組み込みのワークフロー機能を組み合わせることで、チームはデータセットをより効率的に準備し、データ準備からモデル開発へと迅速に進むことができます。
コミュニティに参加して、GitHubリポジトリでコンピュータビジョンモデルの詳細をご覧ください。AI in automotiveやcomputer vision in roboticsなどのアプリケーションについては、ソリューションページをご覧ください。ライセンスオプションを確認して、独自のビジョンAIモデルの構築を始めましょう。






