Yolo 深圳
深セン
今すぐ参加

Ultralytics プラットフォームによる画像アノテーションの効率化

Ultralytics を使った画像アノテーションに関する基本から応用までを学びましょう。データセットのラベリング、アノテーションの管理、モデル用データの準備を行うための組み込みツールについてもご紹介します。

Ultralyticsでコンピュータビジョンプロジェクトをスケールアップ

始める

Ultralytics 、コンピュータビジョン開発の全ライフサイクルを支援するために構築された環境「 Ultralytics 」を発表しました。このプラットフォームは、データセットの準備、画像および動画のアノテーション、モデルのトレーニング、デプロイなど、ビジョンAIワークフローの各段階を管理するために使用されるツールを一元化しています。

自動運転や医療などの業界で導入が進んでいるにもかかわらず、 コンピュータビジョンソリューションの構築は依然として断片的なプロセスと見なされることがあります。その主な理由の一つは、コンピュータビジョンモデルが、学習に用いるデータの品質に大きく依存している点にあります。学習を開始する前に、モデルが何をdetect 認識すべきかを学習できるよう、データセットを作成、整理、検証し、ラベル付けを行う必要があります。

視覚データを扱う際、このプロセスは「データアノテーション」または「画像アノテーション」と呼ばれます。画像アノテーションでは、画像の特定の部分にマークを付け、ラベルを割り当てます。これにより、トレーニング中にモデルを誘導します。

例えば、画像内のdetect することが目的の場合、アノテーターは各犬の周囲にバウンディングボックスを描き、犬がどこに写っているかを示します。より詳細なタスクでは、セグメンテーションマスクを使って犬の輪郭を描いたり、姿勢を捉えるためにキーポイントをマークしたりすることもあります。こうしたラベル付けされた例は、モデルが実際に導入された際の性能に直接影響を与えます。

大規模な画像アノテーションのワークフローを管理するのは、困難を伴うことがあります。大規模なデータセットでは、一貫したラベリング基準の確立、複数のアノテーター間の連携、そしてアノテーションの確認や修正を容易にするツールが必要となる場合が少なくありません。

Ultralytics 、組み込み の注釈エディタを通じてこれらを統合しています。複数の注釈タスクタイプに対応しており、チームが単一のワークフロー内でデータのラベリングやコンピュータビジョン用データセットの準備をより簡単に進められるようにします。

図1.Ultralytics Platformの注釈エディタ(出典

この記事では、Ultralytics 注釈エディタUltralytics 、チームによるデータセットへの注釈付けを効率化し、データ準備のプロセスを合理化する仕組みについて解説します。さっそく見ていきましょう!

コンピュータビジョンにおけるデータアノテーション

Ultralytics 利用できる画像アノテーションツールについて詳しく見る前に、ひとまず一歩引いて、データアノテーションとは何か、そしてなぜそれがコンピュータビジョンシステムの構築において重要なのかを理解しておきましょう。

コンピュータビジョンモデルは、データセットと呼ばれる大量の画像や動画のコレクションを分析することで学習します。しかし、生の画像だけでは、モデルが何をdetect すべきかを理解するのに十分な情報が得られません。データをトレーニングに活用するためには、データラベリングを通じて画像にラベルを付け、モデルがどのような物体、形状、またはパターンを探すべきかを学習できるようにする必要があります。

画像の注釈付けでは、画像内の特定の要素にマークを付け、モデルが学習すべき内容を記述するラベルを割り当てます。これらのラベル付きデータは、トレーニング中に深層学習モデルやアルゴリズムを導き、新しい画像を処理する際に類似したパターンを認識する手助けとなります。

コンピュータビジョンのタスクは、その用途やユースケースに応じて、異なる種類の画像アノテーションを必要とします。例えば、アノテーターは、物体検出のために物体の周囲にバウンディングボックスを描画したり、セマンティックセグメンテーションのために画像内の領域を囲んだり、姿勢推定のためにキーポイントを定義したり、分類のために画像全体にラベルを割り当てたりすることがあります。

データの管理と準備

コンピュータビジョンプロジェクトに向けたデータ準備では、さまざまなファイル形式を扱ったり、データセットを整理したりすることがよくあります。また、機械学習アルゴリズムのラベリングやトレーニングに向けて、すべての準備を整えることも含まれます。多くのワークフローでは、このプロセスが複数のツールに分散しており、データを使用可能にするまでに、アップロードやクリーニング、システム間の移動といった作業が必要となります。

Ultralytics 、 データの前処理、モデルのトレーニング、デプロイを単一の環境内で処理することで、このプロセスを簡素化します。 チームは画像、動画、またはデータセットのアーカイブをアップロードし、手動またはAIによる自動アノテーションを活用して、完全にカスタマイズ可能なデータ準備アプローチの恩恵を受けることができます。Ultralytics 、生データだけでなくCOCO標準フォーマットもサポートしているため、新しいプロジェクトを簡単に開始できます。また、プラットフォーム上の既存のデータセットへのアクセスも提供しており、チームはアノテーション済みのデータセットを利用して、新しいプロジェクトや実験を迅速に開始することができます。

図2.Ultralytics 、単一の環境においてデータセットをアップロード・管理する。(出典

データが利用可能になると、プラットフォーム上で直接管理できるようになります。開発者は画像を確認したり、アノテーションの進捗状況を監視したり、組み込みの可視化機能を利用してデータセットの分布を把握し、潜在的な不足箇所を特定したりすることができます。

また、このプラットフォームはデータセットのバージョン管理にも対応しており、データが変化していく過程でスナップショットを保存できるよう支援します。これにより、track 、実験の比較、およびトレーニング中の一貫性の維持が容易になります。

データの準備が整ったら、各チームは画像の注釈付け作業に進むことができます。この作業では、モデルが何をdetect学習できるよう、画像にラベルを付けます。

Ultralytics でのデータセットへの注釈付け

データのアップロードが完了したら、次はアノテーションの段階です。ここでは画像データにラベルを付け、コンピュータビジョンモデルのトレーニングに向けた基礎を築きます。Ultralytics 、アノテーションエディタを通じて画像アノテーションサービスが組み込まれており、チームは同じ環境内で直接データセットにラベルを付け、管理することができます。

アノテーションエディタはシンプルなワークスペースとして展開され、ユーザーはそこで画像を確認したり、ラベルを追加したり、必要に応じてアノテーションを更新したりできます。すべてが一箇所にまとめられているため、データセットの一貫性を保ち、データトレーニングの準備を整えるのが容易になります。

チームはブラウザ上で直接データセットをアップロードし、画像のラベリングを開始できます。また、アノテーションクラスを定義・管理することで、データセット全体でラベルの一貫性を確保できます。アノテーションが作成されると、ユーザーはエディタ上で視覚的に確認できるため、モデルのトレーニングに進む前に精度を容易にチェックできます。

Ultralytics Platformの画像注釈ツール

Ultralytics 、高度なアルゴリズムを用いてアノテーションプロセスを簡素化し、データセットのラベリングワークフローを効率化する機能がいくつか備わっています。

Ultralytics Platformで利用できる主な機能は以下の通りです:

  • 手動アノテーション:この手法では、ユーザーは画像上に直接、バウンディングボックス、セグメンテーション領域、キーポイントなどの画像アノテーションを作成する際、完全な制御と柔軟性を発揮できます。
  • AIを活用したラベリング:この機能は、注釈の候補を自動的に生成し、手動でのラベリング作業を軽減します。SAM Segment Anything Model)を活用して、ワンクリックでdetect や領域detect することで、注釈付けのプロセスを効率化します。また、ユーザーは候補をデータセットに追加する前に、それらを確認・承認することができます。
  • アノテーションの編集:作成後の画像アノテーションは、いつでも変更や修正が可能です。これにより、ラベリングの誤りを修正し、アノテーションプロセス全体を通じてデータセットのラベルの一貫性を保つことができます。
  • クラス管理:チームや個人開発者は、データセットのラベリング時に使用するアノテーションクラスを定義・整理することができます。これにより、画像間でラベルの一貫性を保つことができ、クラスを正確に認識・区別できるモデルを学習させる上で重要です。

Ultralytics 、手動ツール、人工知能、自動化を組み合わせることで、ユーザーが画像の注釈付けをより効率的に行えるよう支援します。また、スケーラブルなコンピュータビジョンモデル向けの高品質なトレーニングデータの作成も可能にします。

対応しているアノテーションタスクの種類

製品の品質保証など、用途が異なれば、画像や動画内で何を検出する必要があるかによって、求められるアノテーションの種類も異なります。前述の通り、Ultralytics 5つの物体検出タスクに対応しており、それぞれに固有のアノテーション形式が用意されています。

このプラットフォームでサポートされているアノテーション作業と、それらをデータセットのラベル付けにどのように活用できるかについて、詳しく見ていきましょう。

物体検出

物体検出は、画像内の物体を識別し、その位置を特定します。アノテーターは、バウンディングボックスを使用して対象となる各物体にマークを付け、画像内のどこにその物体が存在するか示します。

注釈エディタでは、これはバウンディングボックスツールを使用して行います。ユーザーは「編集モード」に入り、クリックしてドラッグしてオブジェクトの周囲に長方形を描き、ドロップダウンメニューからクラスラベルを割り当てることができます。

バウンディングボックスは作成後に調整可能です。アノテーターは、角や辺のハンドルをドラッグしてサイズを変更したり、ボックスの中心をドラッグして移動させたり、キーボードショートカットを使って削除したりすることができます。これらのアノテーションは、ビジョンモデルがさまざまなシーンや条件下でdetect 学習するのに役立ちます。

図3.Ultralytics におけるバウンディングボックスを用いた物体検出の注釈付け。(出典

インスタンスセグメンテーション

インスタンスセグメンテーションでは、画像内のオブジェクトの正確な形状を定義することで、より詳細なアノテーションを提供します。アノテーターは単純な四角形を描くのではなく、ポリゴンアノテーションを使用してオブジェクトの境界線をトレースし、画像セグメンテーションタスクのための正確なマスクを作成します。

アノテーションエディタには、この作業を行うためのポリゴンツールが備わっています。アノテーターは、対象物の輪郭を描くために、その縁に沿って複数の頂点を配置します。頂点を配置したら、ポリゴンを閉じてセグメンテーションマスクを作成することができます。

ポリゴンを作成した後でも、頂点を調整することができます。個々の点を移動させてオブジェクトの境界を微調整したり、必要に応じて頂点を削除したりすることも可能です。こうしたピクセル単位の注釈により、モデルは詳細な視覚的構造を学習し、互いに近接して見えるオブジェクトを区別できるようになります。

ポーズ推定

姿勢推定の注釈は、体の関節の位置やそれらの間の関係を記録します。これにより、モデルは画像内の人物や動物の構造や動きを理解できるようになります。

アノテーターはキーポイントツールを使用して、肩、肘、手首、腰、膝、足首などの体の関節を表すキーポイントを配置します。このプラットフォームでは、17ポイントCOCO 形式をはじめ、手、顔、犬、箱の角などのテンプレートを含む、いくつかの組み込みスケルトンテンプレートがサポートされています。

テンプレートを使用すると、ワンクリックで骨格レイアウト全体を配置でき、その後、画像内のポーズに合わせて個々のキーポイントを調整することができます。また、各キーポイントには、表示されているか隠れているかを示す可視性フラグを設定することも可能です。

図4. キーポイントとスケルトンテンプレートを用いた姿勢推定の注釈。(出典

方向付きバウンディングボックス(OBB)

方向指定バウンディングボックスは、回転をサポートすることで、従来のバウンディングボックスをさらに進化させたものです。この種の注釈は、対象物が画像のフレームと一直線に並んでいるのではなく、斜めに配置されている場合に役立ちます。

アノテーションエディタでは、アノテーターは「方向指定バウンディングボックス」ツールを使用して、オブジェクトの周囲に回転させた長方形を描画できます。最初のボックスを描画した後、回転ハンドルを使って角度を調整でき、角のハンドルを使ってボックスのサイズを変更できます。

回転した注釈は、航空写真や産業用検査データセットなど、対象物が斜めに写っていたり、異なる視点から撮影されたりしている場面でよく使用されます。

図5. 航空写真内の回転した物体に対する方向付きバウンディングボックス(OBB)の注釈。(出典

画像分類

画像分類では、画像内の個々の物体を識別するのではなく、画像全体にラベルを割り当てます。

分類用データセットの場合、アノテーションエディタにはクラス選択パネルが用意されています。アノテーターは、サイドバーからクラスを選択するか、キーボードショートカットを使用して、より迅速に画像にラベルを割り当てることができます。

これらの画像レベルのラベルは、モデルがさまざまなカテゴリを表す高次元の視覚パターンを学習するのに役立ちます。

SAMを活用したAI支援型アノテーション

セグメンテーションなどのタスクに向けた画像のラベリングは、特にオブジェクトの輪郭を正確に描く必要がある場合、細心の注意を要する作業となることがよくあります。Ultralytics 、AIを活用したアノテーションツールが搭載されており、アノテーションの精度と確認のしやすさを維持しつつ、作業を効率化します。

例えば、アノテーターは、注釈に含めたいオブジェクトの部分をクリックすることで、画像を操作することができます。また、除外すべき領域をマークして、結果を精緻化することも可能です。これらの入力に基づいて、モデルはリアルタイムでセグメンテーションマスクを生成し、保存する前にその内容を確認・調整することができます。

このアプローチにより、細部まで手作業でトレースすることなく、複雑な画像の処理が容易になります。同時に、アノテーターは最終的な出力を管理し続けることができるため、データセット全体を通じてアノテーションの一貫性が保たれます。

図6.Ultralytics 「Smart annotation」ツールを使用したAI支援セグメンテーション。(出典

これらの機能は、Segment Anything Models(SAM)によって実現されています。これらのモデルは、最小限の入力から高品質なセグメンテーションを生成するように設計された、オープンソースのコンピュータビジョンツール群からなる広範なエコシステムの一部です。このプラットフォームは、SAM .1SAM を含む複数のSAM に対応しています。これにより、チームはニーズに応じて、処理速度を優先するか、より詳細な結果を得るかを選択する柔軟性を得ることができます。

これらのAI支援ツールは、物体検出、インスタンスセグメンテーション、向き付きバウンディングボックス検出などのタスクに幅広く活用できます。これにより、チームは信頼性の高いモデル学習に必要な品質を維持しつつ、大規模なデータセットをより効率的に処理できるようになります。

組み込みツールによるアノテーションワークフローの改善

アノテーション作業が進むにつれ、ラベルの修正や誤りの訂正、画像の詳細な確認などを行うことはよくあります。Ultralytics エディタには、こうした日常的な作業をより簡単に、かつ時間をかけずに処理できる機能が組み込まれています。

エディタで利用できるワークフロー機能には、次のようなものがあります:

  • キーボードショートカット:このエディタには、注釈の保存、変更の取り消しややり直し、ラベルの削除、注釈付け中のクラスの選択など、よく行う操作を効率化するショートカットが用意されています。
  • 元に戻す・やり直しの履歴:アノテーターは、編集セッション中に加えた変更を簡単に元に戻したり、復元したりできます。これにより、チームは進捗を損なうことなくアノテーションの試行錯誤やミスの迅速な修正が可能となり、データセット準備時の品質管理が強化されます。
  • 柔軟な注釈編集:注釈は作成後も調整が可能です。ユーザーは、特に不規則な形状のオブジェクトを微調整する際、必要に応じて図形のサイズ変更、注釈の移動、方向付きバウンディングボックスの回転、クラスラベルの更新を行うことができます。
  • 表示設定:このエディタには、注釈やクラスラベルの表示・非表示を切り替える機能が備わっており、ラベリング作業中に画像を簡単に確認できるようになっています。
  • 精密ツール:ズーム機能やピクセル座標付きの十字カーソルなどの機能により、アノテーターは詳細な画像を扱う際に、より正確にラベルを配置することができます。

Ultralytics でのアノテーションクラスの管理

明確かつ一貫性のあるアノテーションクラスは、信頼性の高いコンピュータビジョンデータセットを構築する上で重要な役割を果たします。プロジェクトが拡大するにつれ、特に複数のアノテーターが関与する場合、大規模なデータセット全体のデータラベリングを管理することは困難になる可能性があります。クラスを適切に整理しておくことで、アノテーションの一貫性を保ち、モデルが構造化されたデータから学習できるようになります。

Ultralytics 、クラス管理機能をアノテーションエディタに直接組み込むことで、このプロセスを簡素化します。ラベルを別途処理する必要がなく、チームは画像の作業を行いながらクラスの作成、更新、レビューを行えるため、アノテーションワークフロー全体を通じて一貫性を保ちやすくなります。

エディタ内では、すべてのクラスがアノテーションキャンバスの横にあるサイドバーから利用できます。これにより、アノテーション作業中に適切なラベルを簡単に選択できるほか、データセット全体でのクラスの使用track 。ユーザーは、作業の流れを中断することなく、既存のクラスを検索したり、必要に応じて新しいクラスを作成したりできます。

クラスの詳細情報はいつでも更新可能です。名前を直接編集できるほか、色を割り当てることで、注釈全体を通じて各クラスを区別しやすくなります。また、エディタには各クラスにリンクされている注釈の数が表示され、それらを確認できるため、チームが一貫性と正確性をチェックするのに役立ちます。

すべてのクラスは一元化されたテーブルを通じて管理されており、そこで並べ替え、検索、更新を行うことができます。ここで行われた変更はデータセット全体に自動的に反映されるため、アノテーションプロジェクトが拡大しても、チームは一貫性を維持しやすくなります。

図7. アノテーションエディタでのクラス管理画面。ラベルの整理と色のカスタマイズが表示されている。(出典

アノテーションの品質が実環境での性能に与える影響

コンピュータビジョンシステムが開発段階から実運用へと移行するにつれ、アノテーションが施されたデータの質は、モデルの性能に重要な役割を果たします。適切にラベル付けされたデータセットは、特に動的あるいは予測不可能な環境において、モデルがより正確で一貫性のある予測を行うのに役立ちます。

実際には、アノテーションのわずかな不整合でさえ、モデルの挙動に影響を与える可能性があります。オブジェクトのラベル付け方法やエッジケースの処理方法の違いは、トレーニング中は目立たないかもしれませんが、システムが本番環境に導入されると、予測の信頼性を低下させる原因となる可能性があります。

さらに、こうした不整合は実世界のアプリケーションにおいて、より顕著になる可能性があります。例えば、ロボット工学や医療システムでは、モデルは視覚的な入力に基づいてdetect 、リアルタイムで動作を制御しています。ラベリングのばらつきは、これらのシステムが周囲の状況をどれだけ正確に解釈できるかに影響を及ぼす可能性があります。

一貫したアノテーション手法を維持し、Ultralytics のようなプラットフォームを活用してデータセットUltralytics 継続的に管理・改善Ultralytics 、チームは制御されたテスト環境を超えても、より信頼性の高いパフォーマンスを発揮するモデルを構築することができます。

主なポイント

正確なコンピュータビジョンモデルの学習や、画像アノテーションプロジェクトの成功には、高品質なデータアノテーションが不可欠です。Ultralytics 、複数のビジョンタスクに対応した強力なアノテーションエディタにより、このプロセスを簡素化します。手動アノテーションツールと、SAM を活用したAI支援型ラベリングSAM 組み込みのワークフロー機能を組み合わせることで、チームはデータセットをより効率的に準備し、データ準備からモデル開発へと迅速に移行することができます。

ぜひコミュニティに参加し、GitHubリポジトリを閲覧して、コンピュータビジョンモデルについてさらに詳しく学んでください。ソリューションページでは、自動車分野におけるAIや ロボット工学におけるコンピュータビジョンなどの活用事例を紹介しています。ライセンスオプションをご確認の上、独自のビジョンAIモデルの構築を始めてみましょう。

一緒にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。