YOLO Vision Shenzhen
深セン
今すぐ参加

Ultralytics AIを活用してアノテーションを自動化する仕組み

Ultralytics 、AIを活用してアノテーションの自動化、大規模データセットの管理、一貫性の向上、そしてコンピュータビジョン開発の加速を実現する仕組みをご覧ください。

Ultralyticsでコンピュータービジョンプロジェクトをスケールアップ

始める

画像や動画を分析するコンピュータビジョンソリューションは、製造業から医療画像診断に至るまで、多くの業界のワークフローにおいて不可欠なものになりつつあります。例えば製造業では、コンベアベルト上を移動する製品の表面欠陥を検出するために、微細なパターンを識別できるコンピュータビジョンモデルが活用されています。 

こうしたモデルを効果的に機能させるには、各欠陥が明確に特定されたラベル付きデータを用いて学習させる必要があります。これにより、モデルはどのような点に注目すべきかを学習し、類似したパターンを認識できるようになります。 

こうしたラベルを作成するプロセスは、データアノテーションと呼ばれます。特に、画像アノテーションや動画アノテーションでは、画像や動画フレーム内の特定の領域にバウンディングボックスを描画したり、形状の輪郭をなぞったり、ラベルを付けたりします。

データセットが小規模な場合は対応可能ですが、データ量が増えるとすぐに処理が困難になります。数千枚もの画像にラベルを付けるには、継続的な手作業が必要となるため、アノテーションが大きなボトルネックとなります。従来のツールは、処理が遅く、機能も断片的で、拡張が難しい場合が少なくありません。 

オールインワンのビジョンAIプラットフォームUltralytics 、AIを活用したアノテーション機能により、こうした課題の解決を支援します。AIを用いて初期ラベルを自動生成し、それを迅速に確認・修正できるようにすることで、手作業の負担を軽減し、効率を向上させます。

この記事では、Ultralytics 支援型アノテーションの仕組みと、それがラベリングプロセスをどのように改善するのかについて解説します。さっそく見ていきましょう! 

データアノテーションプロセスの概要

Ultralytics におけるAIを活用したアノテーションの仕組みについて詳しく説明する前に、まずはデータアノテーションについて詳しく見ていきましょう。

データアノテーション(データラベリングとも呼ばれる)とは、機械学習モデルの訓練に使用できるように、生データに構造化されたラベルを付与するプロセスのことです。コンピュータビジョン分野では、これらのラベルは、画像や動画内の対象となる物体、領域、または特徴を定義するものです。 

トレーニング中、モデルやアルゴリズムは入力データをこれらのラベルに紐付けることを学習するため、アノテーションの品質はモデルの性能を左右する重要な要素となります。正確かつ一貫性のあるラベル付きデータセットがあれば、モデルは正しいパターンを学習できますが、不正確または一貫性のないアノテーションでは、信頼性の低い予測結果につながる可能性があります。

例えば、欠陥検出のユースケースでは、コンベアベルト上の製品の画像に、欠陥が発生している箇所をマークし、その欠陥の種類をラベル付けすることで注釈を付けることができます。これにより、モデルは欠陥がどのようなものかを学習し、新しい画像から欠陥を識別できるようになります。

一般的なアノテーション作業の概要

次に、コンピュータビジョンにおいて画像にアノテーションを付ける一般的な方法について見ていきましょう。これらの方法は、物体検出、インスタンスセグメンテーション、画像分類などのタスクに向けて、視覚データにラベルを付けるために用いられます。各アノテーション手法には、物体の位置特定、形状の把握、主要な構造の識別など、それぞれ異なる役割があります。

バウンディングボックス

バウンディングボックスとは、画像内のオブジェクトの位置を示すためにその周囲に描かれる単純な長方形のことです。これは、コンピュータビジョンにおいてデータにラベルを付ける最も一般的な方法の一つです。

これらのボックスが付けられた画像を用いて学習することで、物体検出モデルはさまざまな物体を認識し、画像内での位置を把握できるようになります。これにより、detect 物体を同時にdetect 、それぞれがどこに存在しているかを特定することが可能になります。

例えば、コンピュータビジョンを用いて野球の試合を分析する場合を考えてみましょう。各フレームにおいて、選手やバット、ボールの周囲にボックスを描画することで、モデルが試合全体を通じてこれらのオブジェクトdetect 識別できるようになります。

図1. バウンディングボックスを使用すると、複数のオブジェクトにラベルを付け、位置を特定することができる。(出典

ポリゴンまたはセグメンテーションマスク

ポリゴン(セグメンテーションマスクとも呼ばれる)は、バウンディングボックスよりも一歩進んで、オブジェクトをピクセル単位で識別します。大まかな長方形を描くのではなく、画像内の各オブジェクトの正確な形状やエッジを捉えます。そのため、より詳細な理解が求められるタスクにおいて有用です。

例えば、自動運転においては、セグメンテーションマスクは、各ピクセルに「道路」や「空」といったカテゴリを割り当てるセマンティックセグメンテーションや、車両や歩行者といった個々の物体を個別に識別するインスタンスセグメンテーションといったタスクで使用されます。 

また、人物などの被写体を画像の背景から切り抜くといった作業にも使用されます。

キーポイント

キーポイントは、人体の関節や動物の部位など、オブジェクト上の特定のポイントをマークするために使用されます。これらのポイントを特定することで、モデルはオブジェクトの構造や、各部位が互いにどのような位置関係にあるかを理解できるようになります。

コンピュータビジョンでは、これは「姿勢推定」と呼ばれ、その目的はこれらのキーポイントの位置を特定し、それらが互いにどのように関連しているかを把握することにあります。これらのポイントを時間経過とともに追跡することで、動きや姿勢の変化を分析することが可能になります。

図2. キーポイントの注釈は、人体姿勢推定のために関節をマークするために使用できる。(出典

よくある例として、動画内の体の関節にマーキングを施し、人の動きを分析することが挙げられます。これらの重要なポイントに注目することで、モデルは人の体の位置や、時間の経過に伴う姿勢の変化を捉えることができます。

方向付きバウンディングボックス(OBB)

画像内のすべてのオブジェクトが完全に整列しているわけではありません。現実の世界では、オブジェクトが傾いたり、回転していたり、あるいは異なる角度から撮影されていたりすることがよくあります。 

このような場合、標準のバウンディングボックスでは、不要な背景が含まれてしまったり、対象物と正確に一致しなかったりすることがよくあります。方向付きバウンディングボックスは、対象物の方向に合わせて回転させた長方形を使用することで、この問題を解決します。その結果、より正確で精密なアノテーションが可能になります。

この手法は、オブジェクトの位置と向きを同時に特定する「向き付きバウンディングボックス(OBB)検出」において用いられます。例えば、航空写真では、建物、船舶、車両などのオブジェクトがさまざまな角度から写り込むことがよくあります。回転させたボックスを用いることで、シーン内におけるそれらの真の形状や向きをより正確に捉えることが容易になります。

分類ラベル

分類ラベルは、特定の物体や領域にマークを付けるのではなく、画像全体に単一のラベルを割り当てるという点で、他のアノテーション手法とは異なるアプローチをとっています。これは、画像内の対象物がどこに現れているかには焦点を当てず、単に何が存在しているかを特定することを目的とする場合に用いられます。

例えば、画像は全体的な内容に基づいて「猫」や「犬」といったラベルを付けることができます。そのため、画像分類は、画像を大まかに理解するだけで十分なタスクにおいて有用です。

従来のアノテーションツールの限界

多くの従来のラベリングツールは、複数のステップや断片的なワークフローに依存しています。AI開発チームは、ラベリング、保存、検証のために複数のアノテーションプラットフォームを切り替えなければならないことが多く、それがAIプロジェクトの進行を遅らせています。 

多くのツールは、サポートするアノテーションの種類やデータ型が限られているため、チームはバウンディングボックス、セグメンテーション、キーポイントの処理にそれぞれ異なるツールを使用せざるを得ません。このような分散した環境は、特にコンピュータビジョンを初めて扱うチームにとっては、管理が困難になる場合があります。

手作業もまた大きな課題の一つです。1枚の画像にアノテーションを付ける作業は数分で済むかもしれませんが、大規模なデータセットを扱うとなると、特に類似した画像の処理で反復作業が必要になる場合、すぐに時間がかかってしまいます。

データセットが拡大するにつれ、チームはファイルの管理、track 、およびアノテーション間の一貫性の維持も行わなければなりません。これにより作業負荷が増大し、データ管理に費やす時間が増える一方で、モデルの性能向上に充てる時間が減ってしまいます。

より効率的なアプローチは、Ultralytics AIを活用したアノテーションを行うことです。このUltralytics ではAIを用いてラベルを生成・精緻化し、手作業の負担を軽減すると同時に、処理速度と一貫性を向上させます。これらはすべて、データセットの管理、アノテーション、モデルのトレーニング、デプロイ、モニタリングを統合した単一の環境内で実現されます。

Ultralytics アノテーションプロセスをどのように実現するか

Ultralytics 、アノテーションをコンピュータビジョンワークフローの他の工程と直接連携させることで、その作業を簡素化します。チームは、個別のツールに頼るのではなく、単一の環境内でデータ、アノテーション、モデルを扱って作業を行うことができます。 

物体検出、画像分類、インスタンスセグメンテーション、姿勢推定、向き付きバウンディングボックス検出など、幅広いコンピュータビジョンタスクに対応しています。

この環境では、アノテーションを複数の方法で実施できます。チームは、完全な制御を目的としてデータを手動でラベリングしたり、SAMスマートアノテーションによる対話型のポイントベースのラベリングを行ったり、YOLOスマートアノテーションを適用してアノテーションを自動生成し、それを確認・修正したりすることができます。この柔軟性により、さまざまなデータセットやアノテーション要件への対応が容易になります。

図3.Ultralytics 内のアノテーション画面(出典

AIを活用したアノテーションと手動によるアノテーションが、データセットの管理やモデルのトレーニングと統合されているため、チームはデータのラベリングからデータセットの整理、モデルのトレーニングへとシームレスに移行できます。これにより、ワークフローが体系的に維持され、ツールの切り替えやアノテーションの再フォーマットが不要になります。

このプラットフォームは、次のようなUltralytics YOLO もサポートしています。 Ultralytics YOLO11Ultralytics UltralUltralytics もサポートしており、アノテーション付きデータをトレーニングやテストに直接活用できます。これにより、データセットの不足箇所を特定し、アノテーションを精緻化し、継続的な反復を通じてモデルを再トレーニングすることが容易になります。

Ultralytics PlatformにおけるSAM アノテーションの主な機能

Ultralytics SAMスマートアノテーション機能は、物体検出、インスタンスセグメンテーション、および方向付きバウンディングボックス(OBB)タスクにおけるアノテーション作業を効率化するために設計されています。

このプラットフォームでは、SAM .1 Tiny、SAM .1 Small、SAM .1 Base、SAM .1 Large、SAM など、複数のSAM バリエーションが用意されており、ユーザーは処理速度と精度のバランスを考慮して選択することができます。 

図4.Ultralytics SAMスマートアノテーション(出典

「Tiny」や「Small」などの小型モデルは処理速度が速く、迅速なアノテーション作業に適しています。一方、「Large」やSAM 」などの大型モデルは、より複雑なシーンにおいて高い精度を発揮します。モデルを切り替えると、アノテーションの動作が即座に更新されます。

アノテーションエディタ内でSAM を選択すると、人間のアノテーターはスマートモードに切り替えてラベリングを開始できます。手動で図形を描く代わりに、シンプルなポイント入力によってモデルを誘導します。 

左クリックで領域を含めるための正の点を追加し、右クリックで不要な領域を除外するための負の点を追加します。これらの入力に基づいて、モデルはリアルタイムで正確なマスクを生成します。

ワークフローを効率化するために、自動適用モードを有効にすることができます。このモードが有効になっている場合、クリックするたびに手動での確認を必要とせずに、注釈が自動的に生成・保存されます。より複雑なオブジェクトの場合、アノテーターは「Shift」キーを押しながら複数のポイントを配置してからマスクを適用するか、自動適用モードを無効にして自由にポイントを追加し、「Enter」キーを押してマスクを適用することができます。

Ultralytics におけるYOLO アノテーションの理解

SAMスマートアノテーションと同様に、Ultralytics YOLO アノYOLO AIを活用してラベリングプロセスを高速化します。クリック操作でモデルを誘導するのではなく、モデルの予測結果を用いてアノテーションを自動的に生成します。

このアプローチは、物体検出、インスタンスセグメンテーション、および方向付きバウンディングボックス(OBB)の注釈付けなどのタスクに対応しています。具体的には、Ultralytics 提供する事前学習済みモデルUltralytics 独自に学習YOLO Ultralytics Ultralytics YOLO と連携して動作します。

アノテーションエディタ内で、アノテーターはスマートモードに切り替え、YOLO ピッカーYOLO を選択し、「予測」をクリックできます。モデルピッカーには、現在のデータセットのタスクにYOLO 表示されるため、生成されるアノテーションの互換性が確保されます。

このモデルは画像を分析し、その予測に基づいてアノテーションを生成します。生成されたアノテーションは、そのまま画像に直接追加されます。予測結果が、同じクラスの既存のアノテーション出力と重複する場合、重複が設定された閾値を超えると、重複検出は自動的にスキップされるため、クリーンで一貫性のあるラベルを維持することができます。

図5.Ultralytics YOLOモデルによるスマートアノテーション(出典

予測が生成されると、人間による確認を行うアノテーターが必要に応じてそれらを確認、調整、または削除することができます。これにより、すべてを手作業でアノテーションするのではなく、モデルが生成したアノテーションを起点としてそれを精査することで、大規模なデータセットのラベル付けを迅速かつ容易に行うことができます。

時間の経過とともに、改良されたYOLO 再利用してより精度の高い予測を生成することができ、反復的な自動ラベリングワークフローを支えることができます。

実稼働環境のパイプラインにおけるAIを活用したラベリングの適用

次に、Ultralytics が実際のユースケースにおいてどのようにデータアノテーションを実現しているか、具体例を見ていきましょう。

自動運転におけるセグメンテーション

コンピュータビジョンモデルを組み込んだ自動運転車は、周囲の状況をリアルタイムで把握するために、適切にアノテーションが施された視覚データに依存しています。このデータを用いて学習されたモデルは、segment 、歩行者、交通標識、および道路の境界をsegment することができます。

セグメンテーション作業には、ピクセル単位の正確な境界線が必要となるため、アノテーション作業は極めて重要であると同時に、多大な時間を要する作業となります。特に複雑な走行シーンにおいては、大量のセンサーデータを手作業でラベリングすることは、すぐにボトルネックとなりかねません。

Ultralytics 、YOLO 活用したAI支援型アノテーションにより、このプロセスを効率化します。SAMスマートアノテーションにより、クリック操作だけで正確なマスクを用いた高速なセグメンテーションが可能となり、一方、YOLO を使用することで、画像全体にわたるアノテーションを自動的に生成することができます。 

これらの手法を組み合わせることで、オブジェクトが重なり合うような複雑なシーンの処理が容易になります。

アノテーションはモデルのトレーニングと直接結びついているため、更新された大規模なデータセットを直ちに活用してモデルの再トレーニングや評価を行うことができます。これにより、チームはパフォーマンスを継続的に向上させ、新たな走行状況により効率的に適応することが可能になります。

製造における品質保証体制の強化

製造業において、一貫した品質管理を維持するには、生産工程中の欠陥を正確に検出することが不可欠です。コンピュータビジョンモデルは、問題をリアルタイムで特定するために頻繁に利用されていますが、その性能は、トレーニングデータが実際の生産状況をどの程度反映しているかに左右されます。

原材料、機械の設定、照明などの製造環境の変化により、元の学習データには含まれていなかった、新たな種類の欠陥やまれな欠陥が発生する可能性があります。これにより、モデルが学習した内容と、実際の生産ラインで発生する状況との間に乖離が生じます。

データセットの一貫性を保つためには、高品質な社内アノテーションを用いて定期的に更新する必要があります。Ultralytics を使用すれば、新たな欠陥パターンが出現した際にも、アノテーションの更新やデータセットの拡張を簡単に行うことができます。こうして更新されたデータセットを用いてモデルを再学習させることで、チームは変化する生産環境に迅速に対応できるようになります。

建設現場の監視と安全

建設現場は、複数のチームが活動し、重機が動き回り、配置が絶えず変化する、活気あふれる環境です。こうした状況下で安全を確保するには、明確で詳細な注釈が付けられた視覚的データが不可欠です。

正確なアノテーションはデータの品質を向上させ、混雑した現場や背景が変化する状況、照明条件が異なる状況など、さまざまな現場環境において、AIシステムが作業員、設備、安全装備、および潜在的なリスクを識別するのに役立ちます。

Ultralytics 、現場の状況が変化しても、アノテーションを簡単に更新・修正できるようにすることで、これをサポートします。新しい画像が撮影され次第、データセットに追加できるため、常に実世界の状況と一致した状態を維持できます。

主なポイント

信頼性の高いコンピュータビジョンやAIモデルを構築するには、高品質なアノテーションが不可欠ですが、従来のワークフローではチームの作業が遅延しがちです。Ultralytics 、自動化されたアノテーションツールと拡張性の高いワークフローにより、このプロセスを効率化します。その結果、チームは精度と一貫性を維持しつつ、データからモデルへの移行をより迅速に進めることができます。

コンピュータビジョンについて詳しく知りたい方は、拡大を続けるコミュニティや GitHubリポジトリをご覧ください。ビジョンソリューションの構築をご検討中の方は、ライセンスオプションをご確認ください。製造業におけるコンピュータビジョンのメリットや、医療分野におけるAIの活用について詳しく知りたい方は、ソリューションページをご覧ください。

共にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。