Yolo 深圳
深セン
今すぐ参加

Ultralytics YOLO11 アンカーフリー検出器であることの利点

Abirami Vina

5分で読めます

2024年12月5日

Ultralytics YOLO11 どのようにアンカーフリーのオブジェクト検出をサポートし、このモデル・アーキテクチャが様々なアプリケーションにもたらす利点を理解する。

Vision AIモデルの歴史を振り返ると、画像またはビデオ内のオブジェクトを識別して位置を特定する、コアとなるコンピュータビジョンタスクである物体検出の概念は、1960年代から存在しています。しかし、今日の最先端のイノベーションにおけるその重要性の主な理由は、それ以来、物体検出技術とモデルアーキテクチャが高度化し、急速に改善されたことです。 

前回の記事では、物体検出の進化と、Ultralytics YOLO モデルに至る道について説明しました。今日は、この道のりのより具体的なマイルストーン、つまりアンカーベースのディテクターからアンカーフリーのディテクターへのジャンプを探ることに焦点を当てます。 

アンカーベースの検出器は、画像内のオブジェクトの位置を予測するために、「アンカー」と呼ばれる定義済みのボックスに依存します。対照的に、アンカーフリー検出器は、これらの定義済みボックスをスキップし、代わりにオブジェクトの位置を直接予測します。

この変化は単純で論理的な変化のように見えるかもしれませんが、実際には物体検出の精度と効率の大幅な向上につながりました。この記事では、以下のような進歩を通じて、アンカーなし検出器がコンピュータビジョンをどのように作り変えたかを理解します。 Ultralytics YOLO11.

アンカーベースの検出器とは何ですか?

アンカーベースの検出器は、アンカーと呼ばれる事前定義されたボックスを使用して、画像内のオブジェクトの位置を特定します。これらのアンカーは、画像上に配置されたさまざまなサイズと形状のボックスのグリッドとして考えてください。次に、モデルはこれらのボックスを調整して、検出したオブジェクトに適合させます。たとえば、モデルが車を識別した場合、アンカーボックスを修正して、車の位置とサイズにより正確に一致させます。

各アンカーは画像内のオブジェクトに関連付けられ、学習中、モデルはオブジェクトの位置、サイズ、縦横比によりよく一致するようにアンカーボックスを調整する方法を学習する。これにより、モデルは異なるスケールや向きの物体をdetect できるようになる。しかし、適切なアンカーボックスのセットを選択するには時間がかかり、微調整の過程ではエラーが発生しやすい。

__wf_reserved_inherit
図1. アンカーボックスとは?

YOLOv4のようなアンカーベースの検出器は、多くのアプリケーションでうまく機能してきましたが、いくつかの欠点があります。例えば、アンカーボックスは、形や大きさの異なるオブジェクトと常にうまく整列するとは限らないため、小さなオブジェクトや不規則な形状のオブジェクトをdetect することが難しくなります。また、アンカーボックスのサイズを選択し、微調整するプロセスには時間がかかり、手作業が必要になります。これとは別に、アンカーベースのモデルは、あらかじめ定義されたボックスがこれらの複雑なシナリオにうまく適応しない場合があるため、オクルードやオーバーラップしているオブジェクトの検出に苦労することが多い。

アンカーフリー物体検出への移行

アンカーフリー検出器は、定義済みのアンカーボックスを必要とせずにオブジェクト検出への新たなアプローチをとったCornerNetやCenterNetのようなモデルで2018年に注目を集め始めました。オブジェクトの位置を予測するためにさまざまなサイズと形状のアンカーボックスに依存する従来のモデルとは異なり、アンカーフリーモデルはオブジェクトの位置を直接予測します。これらは、オブジェクトの中心のようなキーポイントまたは特徴に焦点を当て、検出プロセスを簡素化し、より高速かつ正確にします。

アンカーフリーモデルが一般的にどのように機能するかを以下に示します。

  • キーポイント検出: 定義済みのボックスを使用する代わりに、一部のモデルは、オブジェクトの中心や特定の角などのオブジェクト上の重要なポイントを識別します。これらのキーポイントは、モデルがオブジェクトの位置とサイズを把握するのに役立ちます。
  • 中心予測: オブジェクトの中心の予測に焦点を当てたモデルもあります。中心の位置が特定されると、モデルはそこからオブジェクト全体のサイズと位置を予測できます。
  • ヒートマップ回帰: 多くのアンカーフリーモデルはヒートマップを使用します。各ピクセルはオブジェクトの可能な位置を表します。ヒートマップの値が強いほど、そのポイントにオブジェクトが存在する信頼度が高いことを示します。
__wf_reserved_inherit
Fig 2. Anchor-Based DetectionとAnchor-Free Detectionの比較。

アンカー・フリー・モデルはアンカー・ボックスに依存しないため、設計がシンプルになる。これは、計算効率が高いことを意味する。複数のアンカーボックスを処理する必要がないため、物体をより迅速にdetect することができる。これは、自律走行やビデオ監視のようなリアルタイム・アプリケーションにおいて重要な利点となる。 

また、アンカーを使用しないモデルは、小さなオブジェクトや不規則なオブジェクト、またはオクルージョンがあるオブジェクトの処理に非常に優れています。アンカーボックスに合わせるのではなく、キーポイントを検出することに重点を置いているため、より柔軟性があります。そのため、アンカーベースのモデルでは失敗する可能性のある、乱雑で複雑な環境でも物体を正確に detect することができる。

Ultralytics YOLO11:アンカーのない検出器

もともとスピードと効率を重視して設計されたYOLO モデルは、徐々にアンカーベースの手法からアンカーなしの検出へと移行し、YOLO11 ようなモデルはより高速で柔軟性が高く、幅広いリアルタイム・アプリケーションに適している。

アンカーのないデザインが、YOLO さまざまなバージョンでどのように進化してきたかを簡単に紹介しよう:

  • Ultralytics YOLOv5u:アンカーフリー分割Ultralytics ヘッドを導入し、事前に定義されたアンカーボックスの必要性を排除。その代わりに、モデルが画像内のオブジェクトの位置を直接予測するため、プロセスが簡素化され、柔軟性とスピードが向上。
  • YOLOv6:アンカー支援トレーニング(AAT)と呼ばれる新しい手法が使用され、トレーニング中のみアンカーが使用される。これにより、アンカーを使用しない検出を実行時に使用し、スピードと適応性を向上させながら、学習時にアンカーを使用する手法の構造の恩恵を受けることができる。
  • Ultralytics YOLOv8:アンカー・フリー・スプリットUltralytics ヘッドを使用することで、アンカー・フリー検出に完全に切り替えました。これにより、特にアンカーボックスにうまく収まらない小さな物体や奇妙な形状の物体に対して、より高速で正確なモデルが実現した。
  • Ultralytics YOLO11:YOLOv88のアンカーフリーアプローチをベースに、アンカーボックスを完全に排除することで、検出をさらに最適化。その結果、動物の行動モニタリングや小売店分析などのリアルタイム・アプリケーションにおいて、より高速で正確な検出が可能になります。
__wf_reserved_inherit
図3.Ultralytics YOLOv8 Ultralytics YOLO11比較。

YOLO11実世界での応用

YOLO11 使ったアンカーフリー検出の利点の好例は、自律走行車である。自動運転車では、歩行者、他の車両、障害物を迅速かつ正確に検出することが、安全のために極めて重要です。YOLO11アンカーフリーアプローチは、事前に定義されたアンカーボックスに依存するのではなく、歩行者の中心や他の車両の境界など、物体のキーポイントを直接予測することで、検出プロセスを簡素化します。 

__wf_reserved_inherit
図4.YOLO11 アンカーなし検出の利点(Image By Author)。

YOLO11 、各オブジェクトにグリッド状のアンカーを調整したりフィットさせたりする必要がない。その代わりに、主要な特徴に焦点を当てることで、より高速で効率的な処理を可能にしている。例えば、歩行者が車両の進路に入った場合、YOLO11 、たとえ人が部分的に隠れていたり動いていたりしても、重要なポイントをピンポイントで特定することで、その位置を素早く特定することができる。アンカーボックスなしで様々な形状やサイズに適応できる能力により、YOLO11 、自律走行システムにおけるリアルタイムの意思決定に不可欠な物体を、より確実に、より高速でdetect ことができる。

YOLO11アンカーフリーの能力が際立つ他の用途には、次のようなものがある:

  • 小売と在庫管理:YOLO11 使えば、商品が積み重ねられていたり、一部がふさがっていたりしても、棚上の商品を簡単に監視することができます。これにより、より迅速で正確な在庫追跡が可能になり、ミスを減らすことができます。
  • メディカルイメージング:YOLO11 、医療スキャンで腫瘍やその他の異常をdetect できるため、医療分野でも効果を発揮する。不規則な形状の物体を扱うことができるため、複雑な状態の診断の精度を向上させることができる。
  • 野生動物モニタリング:野生動物の研究では、YOLO11 密林や厳しい地形で動物をtrack ことができ、研究者が行動を監視したり、絶滅危惧種を保護したりするのに役立ちます。
  • スポーツ分析:YOLO11 、スポーツイベント中に選手、ボールの動き、その他の要素をリアルタイムでtrack し、チーム、コーチ、放送局に貴重な洞察を提供するために使用することができます。

アンカーフリーモデルを使用する際の考慮事項

YOLO11 ようなアンカーフリーのモデルは、多くの利点を提供する一方で、ある種の制限を伴う。主な実用上の考慮点の1つは、アンカーなしモデルでさえも、オクルージョンや重なりの大きいオブジェクトに苦労することがあるということだ。その根拠は、コンピュータ・ビジョンは人間の視覚を再現することを目的としており、私たちがオクルージョンのあるオブジェクトを識別するのに苦労することがあるように、AIモデルも同様の課題に直面することがあるからです。

もうひとつの興味深い要因は、モデル予測の処理に関連している。アンカーなしモデルのアーキテクチャーは、アンカーベースよりも単純であるが、場合によってはさらなる洗練が必要となる。例えば、重複する予測をクリーンアップしたり、混雑したシーンでの精度を向上させるために、非最大抑制NMS NMS)のような後処理技術が必要になる場合がある。

YOLO11AIの未来に錨を下ろす

アンカーベースの検出からアンカーフリーの検出への移行は、物体検出において大きな進歩である。YOLO11ようなアンカーフリーのモデルでは、プロセスが簡素化され、精度とスピードの両方の向上につながる。

YOLO11、自動運転車、ビデオ監視、医療用画像処理など、高速かつ正確な検出が重要なリアルタイム・アプリケーションにおいて、アンカーフリーの物体検出がいかに優れているかを見てきました。このアプローチにより、YOLO11 さまざまなオブジェクトのサイズや複雑なシーンにより容易に適応することができ、多様な環境においてより優れたパフォーマンスを発揮します。

コンピュータビジョンが進化し続けるにつれて、物体検出はより高速、より柔軟、より効率的になるだけです。

AIに関する最新情報を入手するには、GitHubリポジトリをご覧いただき、活気あるコミュニティにご参加ください。製造業農業など、ビジョンAIが各分野にどのような影響を与えているかをご覧ください。

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる