YOLO Vision Shenzhen
深セン
今すぐ参加

Ultralyticsプラットフォームによる画像アノテーションの効率化

Ultralytics Platformでの画像アノテーション、およびデータセットのラベリング、アノテーションの管理、モデル用のデータ準備のための組み込みツールについて知るべきことすべてを学びましょう。

コンピュータビジョンプロジェクトの導入をお考えですか?

ライセンスについて詳しく見る

Ultralyticsは最近、コンピュータービジョン開発のライフサイクル全体をサポートするために構築された環境である Ultralytics Platformを導入しました。このプラットフォームは、データセット準備、画像・動画アノテーション、モデルトレーニング、デプロイメントを含む、ビジョンAIワークフローの様々な段階を管理するために使用されるツールを一元化します。

自動運転やヘルスケアなどの業界で採用が拡大しているにもかかわらず、コンピュータービジョンソリューションの構築は、依然として断片的なプロセスと見なされることがあります。主な理由の1つは、コンピュータービジョンモデルがトレーニングに使用されるデータの品質に大きく依存することです。トレーニングが始まる前に、モデルが何を detect または認識すべきかを学習できるように、データセットを作成、整理、レビュー、ラベル付けする必要があります。

視覚データを扱う場合、このプロセスはデータアノテーション、または画像アノテーションとして知られています。画像アノテーションでは、画像内の特定の箇所がマークされ、トレーニング中にモデルをガイドするラベルが割り当てられます。

例えば、画像内の犬をdetectすることが目標の場合、アノテーターは各犬の周囲にバウンディングボックスを描画して、犬がどこに現れるかを示します。より詳細なタスクでは、セグメンテーションマスクを使用して犬の形状を輪郭で示したり、キーポイントをマークしてその姿勢を捉えたりすることがあります。これらのラベル付けされた例は、デプロイ後のモデルの性能に直接影響します。

大規模な画像アノテーションワークフローの管理は課題となる可能性があります。大規模なデータセットでは、一貫したラベリング基準、複数のアノテーター間のコラボレーション、およびアノテーションのレビューと修正を容易にするツールがしばしば必要となります。

Ultralytics Platformは、組み込みのアノテーションエディターと連携してこれを実現します。複数のアノテーションタスクタイプをサポートし、単一のワークフロー内でデータをラベリングし、コンピュータービジョンデータセットを準備するより簡単な方法をチームに提供します。

図1. Ultralytics Platform内のアノテーションエディタの様子 (出典)

本記事では、Ultralytics Platformのアノテーションエディターが、チームがデータセットを効率的にアノテーションし、データ準備を効率化するのにどのように役立つかを探ります。早速始めましょう!

コンピュータービジョンにおけるデータアノテーション

Ultralytics Platformで利用できる画像アノテーションツールを探索する前に、まず一歩引いて、データアノテーションとは何か、そしてコンピュータービジョンシステムを構築する上でそれがなぜ重要なのかを理解しましょう。

コンピュータービジョンモデルは、データセットとして知られる画像や動画の大規模なコレクションを分析することで学習します。しかし、生の画像だけでは、モデルが何をdetectまたは認識すべきかを理解するのに十分な情報を提供しません。トレーニングに役立つデータにするためには、モデルがどのようなオブジェクト、形状、またはパターンを探すべきかを学習できるように、データラベリングを通じて画像にラベルを付ける必要があります。

画像アノテーション中、画像内の特定の要素がマークされ、モデルが学習すべき内容を記述するラベルが割り当てられます。これらのラベル付きの例は、トレーニング中に深層学習モデルとアルゴリズムをガイドし、新しい画像を処理する際に同様のパターンを認識するのに役立ちます。

さまざまなコンピュータービジョンタスクでは、アプリケーションやユースケースに応じて異なる種類の画像アノテーションが必要です。例えば、アノテーターは物体detectのためにオブジェクトの周囲にバウンディングボックスを描画したり、セマンティックsegmentのために画像内の領域を輪郭付けたり、姿勢推定のためにキーポイントを定義したり、分類のために画像全体にラベルを割り当てたりすることがあります。

データの管理と準備

コンピュータビジョンプロジェクトのデータ準備には、多くの場合、様々なファイル形式の扱いとデータセットの整理が含まれます。また、アノテーションと機械学習アルゴリズムのトレーニングの準備がすべて整っていることを確認することも含まれます。多くのワークフローでは、このプロセスは複数のツールにまたがり、データが使用される前にシステム間でアップロード、クリーンアップ、移動されます。

Ultralytics Platformは、単一の環境内でデータ準備、モデルトレーニング、デプロイメントを処理することで、これを簡素化します。チームは画像、ビデオ、またはデータセットアーカイブをアップロードでき、手動またはAI自動アノテーションによるデータ準備に対する完全にカスタマイズ可能なアプローチから恩恵を受けられます。Ultralytics Platformは、生データとYOLOおよびCOCOのような標準フォーマットの両方をサポートしており、新しいプロジェクトを簡単に開始できます。また、チームが新しいプロジェクトや実験を迅速に開始するために使用できる、アノテーション付きデータセットを含むプラットフォーム上の既存のデータセットへのアクセスも提供します。

図2. Ultralytics Platformの単一環境でデータセットをアップロード・管理。 (出典)

データが利用可能になると、プラットフォーム上で直接管理できます。開発者は画像をレビューし、アノテーションの進捗を監視し、組み込みの視覚化機能を使用してデータセットの分布を理解し、潜在的なギャップを特定できます。

このプラットフォームはデータセットのバージョン管理もサポートしており、チームがデータの進化に合わせてスナップショットをキャプチャするのに役立ちます。これにより、変更の追跡、実験の比較、トレーニング中の整合性の維持が容易になります。

データが準備できたら、チームは画像のアノテーションに進むことができます。そこでは、モデルが何を detect すべきかを学習するのに役立つようにラベル付けされます。

Ultralytics Platformでのデータセットのアノテーション

データがアップロードされると、次のステップはアノテーションです。ここで画像データにラベル付けが行われ、その後のコンピュータビジョンモデルのトレーニングの基盤が築かれます。Ultralytics Platformには、アノテーションエディターを介した組み込みの画像アノテーションサービスが含まれており、チームは同じ環境内でデータセットにラベルを付け、管理することができます。

アノテーションエディタはシンプルなワークスペースで展開され、ユーザーは画像をレビューしたり、ラベルを追加したり、必要に応じてアノテーションを更新したりできます。すべてが一箇所に整理されているため、データセットの一貫性を保ち、データトレーニングの準備を整えることが容易になります。

チームはデータセットをアップロードし、ブラウザで直接画像のラベリングを開始できます。アノテーションクラスを定義・管理することで、データセット全体でラベルの一貫性を保ちます。アノテーションが作成されると、ユーザーはエディタで視覚的に確認でき、モデルトレーニングに進む前に精度を簡単にチェックできます。

Ultralytics Platformの画像アノテーションツール

Ultralytics Platformには、効率的なデータセットラベリングワークフローをサポートするいくつかの機能も含まれており、高度なアルゴリズムを使用してアノテーションプロセスを簡素化します。

Ultralytics Platformで利用できる主な機能をいくつかご紹介します。

  • 手動アノテーション: このアプローチにより、ユーザーはバウンディングボックス、segment領域、キーポイントなどの画像アノテーションを画像上に直接作成する際に、完全な制御と柔軟性を持つことができます。
  • AI支援ラベリング: この機能は、推奨されるアノテーションを自動的に生成し、手動ラベリングの必要性を減らします。SAM(Segment Anything Model)を使用して、ワンクリックでオブジェクトや領域をdetectし、アノテーションプロセスを効率化し、ユーザーが提案をデータセットに追加する前にレビューし、確認するのを支援します。
  • アノテーション編集: ユーザーは、画像アノテーションが作成された後、いつでもそれを修正または洗練することができます。これにより、ラベリングの誤りを修正し、アノテーションプロセス全体でデータセットラベルの一貫性を維持するのに役立ちます。
  • クラス管理: チームや個人開発者は、データセットのラベリング中に使用されるアノテーションクラスを定義し、整理できます。これにより、画像間でラベルの一貫性を保つことができ、クラスを正確に認識し区別できるモデルをトレーニングする上で重要です。

手動ツール、人工知能、自動化を組み合わせることで、Ultralytics Platformはユーザーが画像をより効率的にアノテーションするのを支援します。また、スケーラブルなコンピュータービジョンモデル向けの高品質なトレーニングデータの準備も可能にします。

サポートされるアノテーションタスクタイプ

製品品質保証のような異なるユースケースでは、画像や動画内で何をdetectする必要があるかに応じて、異なる種類のアノテーションが必要になります。上述したように、Ultralytics Platformは5つの物体detectタスクをサポートしており、それぞれ独自のアノテーションタイプを持っています。

プラットフォームでサポートされているアノテーションタスクと、それらがデータセットのラベル付けにどのように使用できるかを詳しく見てみましょう。

物体検出

オブジェクト検出は、画像内のオブジェクトを識別し、位置を特定します。アノテーターは、関心のある各オブジェクトをバウンディングボックスを使用してマークし、画像内のアイテムの出現位置を示します。

アノテーションエディタでは、バウンディングボックスツールを使用してこれを行います。ユーザーは「編集モード」に入り、クリック&ドラッグでオブジェクトの周囲に長方形を描画し、ドロップダウンメニューからクラスラベルを割り当てることができます。

バウンディングボックスは作成後に調整できます。アノテーターは、コーナーまたはエッジのハンドルをドラッグしてサイズを変更したり、ボックスの中央をドラッグして移動したり、キーボードショートカットを使用して削除したりできます。これらのアノテーションは、ビジョンモデルが異なるシーンや条件でオブジェクトをdetectすることを学習するのに役立ちます。

図3. Ultralytics Platformにおけるバウンディングボックスを用いた物体detectアノテーション。 (出典)

インスタンスセグメンテーション

インスタンスセグメンテーションは、画像内のオブジェクトの正確な形状を定義することで、より詳細なアノテーションを提供します。単純なボックスを描く代わりに、アノテーターはポリゴンアノテーションを使用してオブジェクトの境界をトレースし、画像セグメンテーションタスク用の正確なマスクを作成します。

アノテーションエディタには、このタスク用のポリゴンツールが搭載されています。アノテーターは、オブジェクトの輪郭に沿って複数の頂点を配置し、その形状を縁取ります。頂点が配置されると、ポリゴンを閉じてセグメンテーションマスクを作成できます。

ポリゴン作成後も頂点を調整できます。個々の点を移動してオブジェクトの境界を洗練したり、必要に応じて頂点を削除したりできます。これらのピクセルレベルのアノテーションは、モデルが詳細な視覚構造を学習し、近くに表示されるオブジェクトを区別するのに役立ちます。

ポーズ推定

ポーズ推定アノテーションは、身体の関節の位置とそれらの間の関係を捉えます。これにより、モデルは画像内の人物や動物の構造と動きを理解するのに役立ちます。

キーポイントツールを使用すると、アノテーターは肩、肘、手首、腰、膝、足首などの身体の関節を表すキーポイントを配置します。このプラットフォームは、17点COCO人体ポーズ形式を含むいくつかの組み込み骨格テンプレート、および手、顔、犬、ボックスコーナー用のテンプレートをサポートしています。

テンプレートを使用すると、ワンクリックで完全なスケルトンレイアウトを配置でき、その後、個々のキーポイントを画像内のポーズに合わせて調整できます。各キーポイントには、それが可視かオクルージョンされているかを示す可視性フラグを含めることも可能です。

図4. キーポイントとスケルトンテンプレートを用いた姿勢推定アノテーション (出典)

Oriented bounding boxes (obb)

Oriented bounding boxesは、従来のバウンディングボックスを一歩進め、回転をサポートします。このタイプのアノテーションは、オブジェクトが画像フレームと整列しているのではなく、角度を付けて現れる場合に有用です。

アノテーションエディターでは、アノテーターは向き付きバウンディングボックスツールを使用して、オブジェクトの周囲に回転した矩形を描画できます。最初のボックスを描画した後、回転ハンドルで角度を調整し、コーナーハンドルでボックスのサイズを変更できます。

回転アノテーションは、航空画像、産業検査データセット、およびオブジェクトが斜めまたは異なる視点から現れるその他のシナリオでしばしば使用されます。

図5. 航空画像における回転した物体に対するOriented bounding box (obb) アノテーション (出典)

画像分類

画像分類は、個々のオブジェクトをマークするのではなく、画像全体にラベルを割り当てます。

分類データセットの場合、アノテーションエディターはクラスセレクターパネルを提供します。アノテーターは、サイドバーからクラスを選択するか、キーボードショートカットを使用して、画像をより迅速にラベリングできます。

これらの画像レベルのラベルは、モデルが異なるカテゴリを表す高レベルの視覚パターンを学習するのに役立ちます。

SAMによるAI支援アノテーション

segmentのようなタスクの画像にラベル付けする作業は、特にオブジェクトを正確に輪郭付けする必要がある場合、慎重で詳細な作業を必要とすることがよくあります。Ultralytics Platformには、アノテーションの精度を保ち、レビューを容易にしながらプロセスを高速化するAIアシストのアノテーションツールが含まれています。

例えば、アノテーターは、アノテーションに含めたいオブジェクトの部分をクリックすることで画像と対話できます。結果を洗練するために、除外すべき領域をマークすることもできます。これらの入力に基づいて、モデルはリアルタイムでsegmentationマスクを生成し、それはその後、保存される前にレビューおよび調整できます。

このアプローチにより、複雑な画像を細部まで手動でトレースすることなく、より簡単に処理できるようになります。同時に、アノテーターは最終出力の制御を維持し、データセット全体でアノテーションの一貫性を確保します。

図6. Ultralytics PlatformのSmart annotationツールを用いたAI支援segmentation (出典)

これらの機能はSegment Anything Models (SAM)によって提供されます。これらのモデルは、最小限の入力から高品質な segment を生成するように設計された、オープンソースのコンピュータービジョンツールのより広範なエコシステムの一部です。このプラットフォームは、SAM 2.1やSAM 3を含む複数のSAMバリアントをサポートしています。これにより、チームはニーズに基づいて、より高速なパフォーマンスとより詳細な結果の間で選択する柔軟性が得られます。

これらのAI支援ツールは、object detection、instance segmentation、向き付きバウンディングボックス検出などのタスクに適用できます。これにより、チームは信頼性の高いモデルトレーニングに必要な品質を維持しながら、大規模なデータセットをより効率的に処理できます。

内蔵ツールによるアノテーションワークフローの改善

アノテーション作業が進むにつれて、ラベルの調整、エラーの修正、画像のより詳細なレビューのために戻ることがよくあります。Ultralyticsのアノテーションエディターには、これらの日常的なタスクをより簡単に、そして時間効率よく処理できる組み込みツールが含まれています。

エディターで利用可能なワークフロー機能の一部は次のとおりです。

  • Keyboard shortcuts: エディタには、アノテーションの保存、変更の取り消しややり直し、ラベルの削除、アノテーション中のクラス選択など、一般的なアクションを高速化するショートカットが含まれています。
  • 元に戻す・やり直し履歴: アノテーターは、編集セッション中に行われた変更を簡単に元に戻したり、復元したりできます。これにより、チームはアノテーションを試行し、進行状況を失うことなく迅速に間違いを修正でき、データセット準備中のより良い品質管理をサポートします。
  • Flexible annotation editing: アノテーションは作成後でも調整可能です。ユーザーは、特に不規則な形状のオブジェクトを調整する際に、必要に応じて形状のサイズ変更、アノテーションの移動、指向性バウンディングボックスの回転、またはクラスラベルの更新を行うことができます。
  • 表示コントロール: エディターには、アノテーションやクラスラベルの表示/非表示を切り替えるトグルが含まれており、ラベリング中の画像検査を容易にします。
  • 精密ツール: ズームやピクセル座標付きの十字カーソルなどの機能は、詳細な画像を扱う際にアノテーターがラベルをより正確に配置するのに役立ちます。

Ultralytics Platformでのアノテーションクラスの管理

明確で一貫性のあるアノテーションクラスは、信頼性の高いコンピュータービジョンデータセットを構築する上で重要な役割を果たします。プロジェクトが拡大するにつれて、特に複数のアノテーターが関与する場合、大規模なデータセット全体でのデータラベリングの管理は困難になる可能性があります。クラスを適切に整理することで、アノテーションの一貫性が保たれ、モデルが構造化されたデータから学習できるようになります。

Ultralytics Platformは、クラス管理をアノテーションエディターに直接統合することで、このプロセスを簡素化します。ラベルを個別に処理する代わりに、チームは画像作業中にクラスを作成、更新、レビューでき、アノテーションワークフロー全体で一貫性を保ちやすくなります。

エディター内では、すべてのアノテーションクラスがキャンバスの横のサイドバーで利用可能です。これにより、アノテーション中に正しいラベルを簡単に選択でき、データセット全体でクラスがどのように使用されているかを追跡できます。ユーザーは、ワークフローを中断することなく、既存のクラスを検索したり、必要に応じて新しいクラスを作成したりできます。

クラスの詳細はいつでも更新できます。名前は直接編集でき、アノテーション全体で異なるクラスを識別しやすくするために色を割り当てることができます。エディターは、各クラスにリンクされているアノテーションの数も表示し、ユーザーがそれらを確認できるようにすることで、チームが整合性と正確性をチェックするのに役立ちます。

すべてのクラスは一元化されたテーブルを通じて管理され、そこでソート、検索、更新が可能です。ここで行われた変更は、データセット全体に自動的に適用され、アノテーションプロジェクトが拡大するにつれてチームが整合性を維持するのに役立ちます。

図7. アノテーションエディターにおけるクラス管理は、ラベルの整理と色のカスタマイズを示しています。(出典)

アノテーションの品質が実世界でのパフォーマンスにどう影響するか

コンピュータービジョンシステムが開発段階から実世界での使用へと移行するにつれて、アノテーションされたデータの品質は、モデルの性能に重要な役割を果たします。適切にラベル付けされたデータセットは、特に動的または予測不可能な環境において、モデルがより正確で一貫した予測を生成するのに役立ちます。

実際には、アノテーションのわずかな不一致でもモデルの動作に影響を与える可能性があります。オブジェクトのラベル付け方法やエッジケースの処理方法の違いは、訓練中は明らかではないかもしれませんが、システムがデプロイされると、信頼性の低い予測につながる可能性があります。

さらに、これらの不整合は、実際のアプリケーションでより顕著になる可能性があります。例えば、ロボット工学やヘルスケアシステムでは、モデルは視覚入力に依存してobjectをdetectし、リアルタイムでアクションをガイドします。ラベリングのばらつきは、これらのシステムが周囲をどれだけ正確に解釈するかに影響を与える可能性があります。

一貫したアノテーションプラクティスを維持し、Ultralyticsのようなプラットフォームを使用して時間をかけてデータセットを管理および改良することで、チームは制御されたテスト環境を超えてより信頼性の高いパフォーマンスを発揮するモデルを構築できます。

主なポイント

正確なコンピュータービジョンモデルのトレーニングと、成功する画像アノテーションプロジェクトのサポートには、高品質なデータアノテーションが不可欠です。Ultralytics Platformは、複数のビジョンタスクをサポートする強力なアノテーションエディターでこのプロセスを簡素化します。手動アノテーションツールとSAMを使用したAI支援ラベリング、および組み込みのワークフロー機能を組み合わせることで、チームはデータセットをより効率的に準備し、データ準備からモデル開発へと迅速に移行できます。

私たちのコミュニティに参加し、コンピュータービジョンモデルについて学ぶために、GitHubリポジトリをご覧ください。ソリューションページで、自動車AIロボティクスにおけるコンピュータービジョンのようなアプリケーションについてお読みください。私たちのライセンスオプションをご確認の上、独自のVision AIモデルの構築を始めましょう。

共にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。