YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024

画像処理におけるエッジ検出の理解

Abirami Vina

5分で読めます

2025年8月25日

画像処理におけるエッジ検出。Sobel、Canny、およびその他のエッジ検出アルゴリズムを学習して、エッジを正確に検出し、堅牢なエッジ認識を実現します。

人間として、画像を見るとき、オブジェクトのエッジを自然に認識し、その曲線をたどり、表面のテクスチャに気づきます。しかし、コンピュータの場合、理解は個々のピクセルのレベルから始まります。

ピクセルは、デジタル画像の最小単位であり、単一のポイントで色と明るさを格納します。画像全体のこれらのピクセル値の変化を追跡することにより、コンピューターは主要な詳細を明らかにするパターンを検出できます。

特に、画像処理は、ピクセルデータを使用して、重要な特徴を強調し、気を散らすものを取り除きます。一般的な画像処理技術の1つはエッジ検出で、明るさや色が急激に変化する点を特定して、オブジェクトの輪郭を描き、境界をマークし、構造を追加します。

これにより、コンピューターは形状の分離、寸法の測定、シーンの構成要素のつながりを解釈できます。エッジ検出は、高度な画像解析における最初のステップとなることがよくあります。

図1. さまざまなエッジ検出手法による出力とオリジナルの画像を並べて示した例。(出典

この記事では、エッジ検出とは何か、それがどのように機能するのか、そしてその実際の応用例を見ていきます。それでは、始めましょう!

エッジ検出の概念

エッジ検出は、画像内で明るさや色が一点から次の点へと顕著に変化する場所を探すことに焦点を当てています。変化が小さい場合、領域は滑らかに見えます。変化が急な場合、多くの場合、2つの異なる領域間の境界を示します。

ピクセルの変化が発生する理由を以下に示します。

  • 表面法線の不連続性: 壁の角や箱の縁のように、2つの面がある角度で接する場合、この急激な方向の変化が画像にはっきりとした境界線を生じさせます。
  • 深度の不連続性: オブジェクトがカメラから異なる距離にある場合に発生し、システムがそれらを区別するのに役立つ目に見える分離を生成します。
  • 表面の色またはテクスチャの変化: これは、ある領域が隣接する領域とは異なる色またはテクスチャを持ち、目に見える分離を作成する場合に発生します。
  • 照明の変化:表面の影やハイライトなど、照明の変化から生じ、表面自体が滑らかまたは連続している場合でも、目に見える分離が生じます。
図2. 画像におけるエッジの不連続性の異なる種類。(出典

エッジ検出認識の仕組み

エッジ検出は通常、カラー画像をグレースケール画像に変換することから始まります。これにより、各点が輝度のみを示すようになり、アルゴリズムが色ではなく明暗の差に集中しやすくなります。

次に、特殊なフィルターが画像をスキャンして、明るさが急激に変化する場所を見つけます。これらのフィルターは、明るさの変化の度合い(勾配と呼ばれます)を計算します。勾配が高いほど、近くの点間の差が大きくなり、エッジを示すことがよくあります。

次に、アルゴリズムは画像を改良し続け、小さなディテールを取り除き、最も重要な線と形状のみを保持します。その結果、明確なアウトラインと出力画像が得られ、さらなる分析に使用できます。

エッジ検出と画像処理の進化

エッジ検出についてより詳しく掘り下げる前に、それがどのように発展してきたかについて説明しましょう。

画像処理は、画像をクリーンアップして改善するための閾値処理やフィルタリングのような、単純なルールベースの手法から始まりました。アナログ時代には、これは光学フィルター、拡大鏡、または化学処理を使用して写真やフィルムを操作し、細部を引き出すことを意味しました。 

コントラスト調整、ノイズ除去、画像強度の調整、基本的なエッジ検出などの手法は、入力画像をより鮮明にし、形状とテクスチャを強調するのに役立ちました。1960年代から70年代にかけて、アナログ処理からデジタル処理への移行により、天文学、医用画像処理、衛星監視などの分野で最新の分析への道が開かれました。

1980年代から90年代にかけて、コンピューターの高速化により、特徴抽出、形状検出、基本的な物体認識など、より複雑なタスクに取り組むことが可能になりました。Sobel演算子やCannyなどのアルゴリズムは、より正確なエッジ検出を提供し、パターン認識は、産業オートメーションから光学文字認識による印刷テキストの読み取りまで、あらゆる分野で応用されました。

21世紀のエッジ検出とコンピュータビジョン

今日、テクノロジーの着実な進歩により、コンピュータビジョンの開発につながりました。ビジョンAI、またはコンピュータビジョンは、機械に視覚情報を解釈して理解させることに焦点を当てたAIの一分野です。 

二重閾値処理(強いエッジを保持し、弱いエッジを除去することで画像を鮮明にする)やエッジ検出のような従来の画像処理は、固定されたルールに従い、特定のタスクしか処理できませんでしたが、コンピュータビジョンは、例から学習し、新しい状況に適応できるデータ駆動型モデルを使用します。 

今日、画像処理システムは、単に画像を強調したり、エッジを検出したりするだけでなく、オブジェクトを認識し、動きを追跡し、シーン全体のコンテキストを理解することができます。 

これを可能にする主要な技術の1つは、畳み込みです。畳み込み演算は、小さなフィルター(カーネルとも呼ばれます)が画像をスキャンして、エッジ、コーナー、テクスチャなどの重要なパターンを見つけるプロセスです。これらのパターンは、コンピュータビジョンモデルがオブジェクトを認識して理解するために使用する構成要素になります。

例えば、Ultralytics YOLO11のようなコンピュータビジョンモデルは、これらの畳み込みベースの特徴を使用して、インスタンスセグメンテーションなどの高度なタスクを実行します。インスタンスセグメンテーションでは、画像内の各オブジェクトの境界線を正確に描く必要があるため、これはエッジ検出と密接に関連しています。 

エッジ検出は、オブジェクトのエッジをマークするためにエッジピクセル内の強度変化を見つけることに焦点を当てていますが、インスタンスセグメンテーションはそのアイデアに基づいて、エッジを検出し、各オブジェクトを分類して、独自の領域に分離します。

図3. YOLO11とインスタンスセグメンテーションの活用例。(出典

エッジ検出アルゴリズムとアプローチ

コンピュータビジョンの成長にもかかわらず、画像処理は依然として多くのアプリケーションにおいて重要な部分です。それは、コンピュータビジョンが基本的な画像前処理ステップに基づいて構築されることが多いためです。 

オブジェクトを検出したり、シーンを理解したりする前に、システムは通常、画像をクリーンアップし、ノイズを低減し、エッジを見つけて、重要な詳細を目立たせます。これらの手順により、高度なモデルの精度と効率が向上します。

次に、エッジの検出に使用される最も一般的な画像処理アルゴリズムとその仕組みについて説明します。 

Sobel エッジ検出

Sobel エッジ検出は、画像内のオブジェクトの輪郭を見つけるために使用される重要な手法です。すべての詳細を一度に分析するのではなく、あるピクセルから隣接するピクセルへの明るさの変化が急激な領域に焦点を当てます。 

これらの急激な変化は通常、あるオブジェクトが終わり、別のオブジェクトが始まる点、またはオブジェクトが背景と出会う点を示します。これらのエッジを分離することにより、Sobel変換は複雑な画像を、動きの追跡、形状の検出、またはオブジェクトの認識などのタスクのために他のシステムが処理しやすい、よりクリーンなアウトラインに変換します。

Sobelエッジ検出は、画像全体の輝度の変化を測定する勾配検出器と考えることができます。その中核となるのは、畳み込み演算です。これは、カーネルと呼ばれる小さな行列を画像上でスライドさせ、隣接するピクセル値の重み付き和を計算することによって機能します。 

これらのカーネルは、水平方向および垂直方向の明るさの変化を強調するように設計されています。データからカーネルが学習される深層学習モデルとは異なり、Sobelは固定カーネルを使用して、トレーニングを必要とせずにエッジを効率的に強調表示します。

Sobelエッジ検出法の仕組みについて詳しく見ていきましょう。

  • 2つの3×3フィルターの使用: この方法では、フィルターと呼ばれる2つの小さな3×3のグリッドを使用します。これらは、水平方向(x方向)および垂直方向(y方向)に画像上をスライドするステンシルのようなものと考えてください。一方のグリッドは水平方向のエッジを見つけるように設計されており、もう一方のグリッドは垂直方向のエッジを見つけるように設計されています。

  • 勾配の計算: 各フィルターは、明るさがどれだけ速く変化するか、および勾配の方向を検出します。大きな変化は、エッジの可能性があることを意味します。

  • 結果の組み合わせ:水平方向と垂直方向の結果を組み合わせて、各ピクセルでの全体的なエッジの強度と方向を決定します。

  • エッジの検出: 勾配の大きさが大きいピクセルは、強いエッジとしてマークされます。

  • 境界の概説: これらのエッジは、オブジェクトの形状を定義し、画像内の異なる領域を分離するのに役立ちます。
図4. Sobelエッジ検出は、入力画像の主な輪郭を強調表示し、エッジマップを生成できます。(出典) 

Cannyエッジ検出

Cannyエッジ検出は、画像内のエッジを見つけるためのもう1つの一般的な方法です。クリーンで正確な輪郭を生成することで知られています。基本的なエッジ検出技術とは異なり、ノイズを除去し、境界線を鮮明にし、最も重要なエッジに焦点を当てるための一連の慎重に設計された手順に従います。 

Cannyエッジ検出器の仕組みを簡単にご紹介します。

  • 画像の平滑化: 画像は最初にガウスフィルターでぼかされます。これは、ノイズやエッジと間違われる可能性のある小さなディテールを減らす平滑化手法です。
  • 明るさの変化の検出: アルゴリズムは、明るさの急激な変化を検出し、勾配計算を用いて変化の強さと方向を測定します。

  • エッジの細線化: 検出された各線に沿って最も強い点のみが保持され、弱い点は削除されるため、鮮明でクリーンなエッジが得られます。

  • エッジの分類: 各ピクセルは、明るさの変化の閾値に基づいて、強いエッジ、弱いエッジ、またはエッジではないとしてラベル付けされます。

  • 最終的なクリーンアップ: 強力なエッジに接続された弱いエッジは保持されます。その他はすべて破棄され、明確に接続された境界のみが残ります。
図5. Cannyエッジ検出器を使用した後の元の画像とそれぞれの出力画像。(出典

Cannyエッジ検出は、ノイズを除去しながら正確な結果を提供するため、精度が重要な分野で広く使用されています。たとえば、医療画像処理、衛星マッピング、ドキュメントスキャン、ロボットビジョンなどの業界で使用されています。

勾配ベースのエッジ検出 vs. ガウスベースのエッジ検出

これまで見てきたエッジ検出の 2 つの例は、Sobel と Canny です。どちらもエッジを見つけることを目的としていますが、問題へのアプローチが異なります。

勾配ベースの手法(Sobel、Prewitt、Scharrなど)は、輝度の急激な変化(勾配)を探すことによってエッジを検出します。画像全体をスキャンし、この変化が最も強い場所を特定します。これらの手法はシンプルで高速であり、画像が鮮明な場合にはうまく機能します。ただし、ノイズには敏感で、輝度のわずかな変化をエッジと誤認する可能性があります。

ガウスベースの手法(CannyやLaplacian of Gaussianなど)は、この問題に対処するために、余分なステップを追加します。最初に画像をぼかすことです。この平滑化は、多くの場合ガウスフィルターで行われ、誤ったエッジを作成する可能性のある小さな変動を低減します。平滑化後も、これらの手法は依然としてシャープな明るさの変化を探しますが、ノイズの多い画像や低品質の画像では、結果がよりクリーンで正確になります。

図6。勾配ベースとガウスベースのエッジ検出。画像提供:著者。

エッジ検出の現実世界の応用

エッジ検出の仕組みをより深く理解した上で、それが実際の状況でどのように応用されているかを探ってみましょう。

エッジ検出を使用して亀裂を特定する

橋や高層ビルなどの大規模なコンクリート構造物の検査は、しばしば困難で危険な作業です。これらの構造物は長距離に及んだり、高い場所にまで達したりすることがあり、従来の検査は時間がかかり、費用がかかり、危険を伴います。また、これらの検査では通常、足場、ロープアクセス、手動での近接測定、または写真撮影が必要です。

2019年には興味深いアプローチが検討されました。研究者らは、高解像度カメラを搭載したドローンを使用してコンクリート表面の詳細な入力画像をキャプチャし、より安全で迅速な方法をテストしました。これらの画像は、さまざまなエッジ検出技術で処理され、亀裂を自動的に識別しました。

この調査では、この方法により、危険区域への直接的な人間のアクセスを大幅に削減し、検査を迅速化できることが示されました。ただし、その精度は、照明条件、画像の鮮明さ、安定したドローン操作などの要因に依然として依存していました。場合によっては、誤検出を除外するために、人間のレビューが依然として必要でした。

医用画像処理におけるエッジ検出の適用

X線やMRI画像には、ノイズと呼ばれる視覚的な乱れが含まれていることが多く、細部が見えにくくなることがあります。これは、医師が腫瘍の輪郭を特定したり、臓器の形状を追跡したり、経時的なわずかな変化を監視したりする際に課題となります。

最近の医用画像研究では、Sobel、Canny、Prewitt、Laplacianなどの一般的なエッジ検出法が、ノイズの多い画像をどの程度うまく処理できるかをテストしました。研究者らは、さまざまな種類とレベルのノイズを画像に追加し、各手法が重要な特徴をどの程度正確にアウトラインできるかを確認しました。

通常、Canny法はノイズが多い場合でも最も鮮明なエッジを生成しますが、全ての場合に最適とは限りません。特定の方法が特定のノイズパターンに対してより効果的な場合もあるため、完璧な単一のソリューションはありません。

図7。ノイズが増加すると、Canny(d~f)はSobel(g~i)よりも鮮明なエッジを提供する。(出典

このことは、コンピュータビジョンのようなテクノロジーが非常に重要である理由を強調しています。高度なアルゴリズムとVision AIモデルを組み合わせることで、このようなソリューションは、基本的なエッジ検出を超えて、困難な条件下でもより正確で信頼性の高い結果を提供できます。

エッジ検出の利点

エッジ検出と画像処理を使用する利点のいくつかを以下に示します。 

  • データ圧縮率の向上: エッジ検出により、主要な特徴のみを使用して画像を表すことができるため、ファイルサイズを縮小しながら、重要な情報を保持できます。これにより、ストレージと伝送の効率が向上します。

  • より正確なオブジェクトのローカリゼーション: オブジェクトの境界を正確に識別することにより、エッジ検出は、システムがオブジェクトを特定および追跡する能力を向上させ、ロボット工学におけるVision AIや自動運転車のようなアプリケーションに役立ちます。

  • マルチスケール特徴検出: エッジ検出技術は、異なるスケールで画像を分析し、小さな詳細と大きな形状の両方をキャプチャできます。この柔軟性は、テクスチャ分析からシーン理解まで、さまざまなタスクに役立ちます。

エッジ検出に画像処理を使用することの限界

画像処理におけるエッジ検出には多くのメリットがありますが、いくつかの課題も伴います。考慮すべき主な制限事項を以下に示します。

  • 複雑なテクスチャの問題点: 複雑なパターンや反復パターンを含む画像では、エッジ検出によって誤ったエッジや無関係なエッジが多数生成されることが多く、その後の分析が複雑になり、信頼性が低下します。

  • 照明に左右される: 明るさ、影、反射の変化により、エッジ検出器が照明の変化をオブジェクトの境界として誤って解釈し、一貫性のない結果につながる可能性があります。

  • オブジェクトの識別は行わない: エッジはオブジェクトの始まりと終わりを強調しますが、オブジェクトが何であるかを示すものではありません。検出されたエッジに意味やラベルを割り当てるには、追加の処理が必要です。

コンピュータビジョンをエッジ検出に使用できる場合

エッジ検出は、私たちの目と脳が協力して世界を認識する仕組みからヒントを得ています。人間の視覚においては、視覚皮質の特殊なニューロンがエッジ、線、境界線に非常に敏感です。 

これらの視覚的な手がかりは、あるオブジェクトがどこで終わり、別のオブジェクトがどこで始まるかをすばやく判断するのに役立ちます。単純な線画でさえすぐに認識できるのはこのためです。私たちの脳は、形状やオブジェクトを識別するためにエッジに大きく依存しています。

コンピュータビジョンは、この能力を模倣することを目指していますが、さらに一歩進んでいます。Ultralytics YOLO11のようなモデルは、基本的なエッジの強調表示や画像の強調を超えています。オブジェクトを検出し、正確に輪郭を描き、リアルタイムで動きを追跡できます。このより深いレベルの理解により、エッジ検出だけでは不十分なシナリオで不可欠になります。

エッジ検出精度向上のためのUltralytics YOLO11の利用

YOLO11がサポートする主要なコンピュータービジョンタスクをいくつかご紹介します。これらはエッジ検出を基盤とし、さらにその先へと進むものです。

  • 物体検出: 画像またはビデオ内の複数のオブジェクトを識別し、それぞれの周囲にバウンディングボックスを描画して位置を特定し、何が存在し、各オブジェクトがどこに配置されているかを明確に示します。

  • インスタンスセグメンテーション:これは、オブジェクトをピクセルレベルまで分解し、オブジェクトが重なり合ったり、不規則な形状をしている場合でも、クリーンで正確なアウトラインを生成します。

  • 姿勢推定: ここでの目標は、オブジェクトまたは人の位置、向き、または姿勢を特定することであり、動きの監視や経時的な構造変化の検出に役立ちます。

  • 物体追跡: このタスクは、オブジェクトがビデオフレーム内を移動する際に追跡し、正確な長期観測のために一貫した識別を保証します。

  • 画像分類: これは、視覚的な特徴に基づいてオブジェクトまたは画像全体にラベルを割り当てることで、大量のデータの整理と解釈を容易にします。

コンピュータビジョンによるインフラストラクチャのエッジの検出

従来のエッジ検出に依存していたアプリケーションをコンピュータビジョンが強化する良い例は、インフラストラクチャおよび産業資産の亀裂検出です。YOLO11のようなコンピュータビジョンモデルは、道路、橋、パイプラインの亀裂を正確に識別するようにトレーニングできます。同じ手法を航空機のメンテナンス、建物の検査、製造品質管理にも適用して、検査を迅速化し、安全性を向上させることができます。

図8。亀裂のセグメンテーションにYOLOv11を使用する例。(出典

主なポイント

エッジ検出は、単純な初期の方法から、複雑な画像内の微妙な境界も見つけることができる高度な技術へと、長い道のりを歩んできました。重要な詳細を引き出し、主要な領域を強調し、より詳細な分析のために画像を準備するのに役立ち、画像処理の中核となっています。

コンピュータビジョンでは、エッジ検出は、形状の定義、オブジェクトの分離、および有用な情報の抽出において重要な役割を果たします。医療画像処理、産業検査、自動運転、セキュリティなど、多くの分野で使用され、正確で信頼性の高い視覚的理解を提供します。

コミュニティに参加し、GitHubリポジトリを探索して、AIについてさらに詳しく学びましょう。独自のVision AIプロジェクトを開始したい場合は、ライセンスオプションをご確認ください。ソリューションページでは、ヘルスケア分野におけるAI小売業におけるVision AIなどのアプリケーションについて詳しくご紹介しています。

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる
クリップボードにコピーしました