画像処理におけるエッジ検出を理解する

アビラミ・ヴィナ

5分で読める

2025年8月25日

画像処理におけるエッジ検出。エッジを正確に検出し、ロバストなエッジ認識を実現するために、Sobel、Canny、その他のエッジ検出アルゴリズムを学びます。

人間であれば、画像を見て物体のエッジを認識し、曲線を追い、表面のテクスチャーに気づくのが自然だ。しかし、コンピュータにとっては、個々のピクセルのレベルから理解が始まる。

デジタル画像の最小単位であるピクセルは、一点の色と明るさを保存する。画像全体のピクセル値の変化を追跡することで、コンピュータは重要な詳細を明らかにするパターンを検出することができる。

特に画像処理では、ピクセルデータを使って、必要な特徴を強調し、邪魔なものを取り除く。一般的な画像処理手法のひとつにエッジ検出があり、明るさや色が急激に変化する箇所を特定することで、物体の輪郭を描いたり、境界を示したり、構造を追加したりする。

これにより、コンピュータは形状を分離し、寸法を測定し、シーンの一部がどのようにつながっているかを解釈することができる。エッジ検出は、高度な画像解析の最初のステップとなることが多い。

図1.異なるエッジ検出方法による出力と並んだ元画像を示す例。出典

この記事では、エッジ検出とは何か、どのように機能するのか、そして実際の用途について見ていきます。さっそく始めよう!

エッジ検出のコンセプト

エッジ検出は、明るさや色がある点から次の点へと顕著に変化する場所を画像から探すことに重点を置いている。変化が小さい場合、その領域は滑らかに見える。変化が鋭い場合は、2つの異なる領域の境界を示すことが多い。

このようなピクセルの変化が起こる理由をいくつか挙げてみよう:

  • 表面の法線の不連続性:壁の角や箱の縁のように、2つの面が斜めに接する場合、このように向きが急激に変わることで、画像に明確な境界が生じる。
  • 奥行きの不連続性:オブジェクトがカメラから異なる距離にある場合に現れ、目に見える分離を作り出し、システムがそれらを区別するのに役立ちます。
  • 表面の色や質感の変化:これは、ある部分が隣接する部分と異なる色や質感を持ち、目に見える分離が生じる場合に起こる。
  • 照明の変化:表面上の影やハイライトを含む照明の変化から生じ、表面そのものが滑らかで連続的であっても、目に見える分離が生じる。
図2.画像中のさまざまな種類のエッジの不連続性。(出典)

エッジ検出認識の仕組み

エッジ検出は通常、カラー画像をグレースケール画像に変換することから始める。こうすることで、アルゴリズムが色ではなく明暗差に着目しやすくなる。

次に、特殊なフィルターが画像をスキャンして、明るさが突然変化する場所を見つけることができる。これらのフィルターは、グラデーションと呼ばれる明るさの急な変化を計算する。勾配が高いほど、近くの点間の差が大きくなり、エッジを示すことが多い。

その後、アルゴリズムは画像を洗練し続け、小さなディテールを取り除き、最も重要な線と形だけを残す。その結果、明確な輪郭が得られ、さらなる分析に使用できる画像が出力される。

エッジ検出と画像処理の進化

エッジ検出について詳しく説明する前に、エッジ検出がどのように発展してきたかを説明しよう。

画像処理は、閾値処理やフィルタリングのようなシンプルでルールに基づいた手法から始まり、画像をクリーンアップして改良してきた。アナログ時代には、光学フィルターや拡大鏡、化学処理などを使って写真やフィルムを加工し、ディテールを引き出していた。 

コントラスト調整、ノイズ除去、画像強度の調整、基本的なエッジ検出などの技術は、入力画像をより鮮明にし、形状やテクスチャを強調するのに役立った。1960年代から70年代にかけては、アナログ処理からデジタル処理への移行が進み、天文学、医療画像、衛星モニタリングなどの分野で現代的な分析への道が開かれた。

1980年代から90年代にかけて、より高速なコンピュータによって、特徴抽出、形状検出、基本的な物体認識など、より複雑なタスクに取り組むことが可能になった。ソーベル演算子やキャニーのようなアルゴリズムは、より正確なエッジ検出を提供し、パターン認識は、産業オートメーションから光学式文字認識による印刷されたテキストの読み取りまで、あらゆる分野に応用されるようになった。

21世紀のエッジ検出とコンピュータビジョン

今日、技術の着実な進歩により、コンピュータービジョンの開発が進んでいる。ビジョンAI(コンピュータービジョン)は、視覚情報を解釈し理解することを機械に教えることに焦点を当てたAIの一分野である。 

二重閾値処理(強いエッジを残し、弱いエッジを取り除くことで画像をより鮮明にする)やエッジ検出のような従来の画像処理は、固定されたルールに従ったものであり、特定のタスクにしか対応できなかった。 

今日、画像処理システムは単に画像を強調したり、エッジを検出したりするだけではありません。物体を認識し、動きを追跡し、シーン全体の文脈を理解することができる。 

これを可能にする重要なテクニックのひとつがコンボリューションだ。畳み込み演算とは、小さなフィルター(カーネルとも呼ばれる)が画像をスキャンして、エッジ、コーナー、テクスチャーなどの重要なパターンを見つける処理である。これらのパターンは、コンピュータビジョンモデルが物体を認識・理解するために使用するビルディングブロックとなる。

例えば、Ultralytics YOLO11のようなコンピュータビジョンモデルは、インスタンスセグメンテーションのような高度なタスクを実行するために、これらの畳み込みベースの特徴を使用します。インスタンス・セグメンテーションでは、画像内の各オブジェクトの境界を正確にアウトライン化する必要があるため、これはエッジ検出と密接に関連している。 

エッジ検出が、オブジェクトのエッジをマークするためにエッジピクセルの強度変化を見つけることに焦点を当てているのに対し、インスタンス分割は、エッジを検出し、分類し、各オブジェクトをそれ自身の領域に分離するために、その考えに基づいて構築される。

図3.YOLO11とインスタンス・セグメンテーションの使用例。出典

エッジ検出アルゴリズムとアプローチ

コンピュータ・ビジョンが発展しても、画像処理は多くのアプリケーションで重要な役割を担っている。というのも、コンピュータ・ビジョンは基本的な画像前処理の上に成り立っていることが多いからです。 

物体を検出したり、シーンを理解したりする前に、システムは通常、画像をクリーンアップし、ノイズを減らし、重要なディテールを際立たせるためにエッジを見つける。これらのステップにより、高度なモデルはより正確で効率的になる。

次に、エッジを検出するために使用される最も一般的な画像処理アルゴリズムのいくつかと、それらがどのように機能するかを探ってみましょう。 

ソーベル・エッジ検出

ソーベル・エッジ検出は、画像中の物体の輪郭を見つけるために使われる重要な手法である。すべてのディテールを一度に分析するのではなく、あるピクセルから隣のピクセルまで明るさが急激に変化する部分に焦点を当てる。 

このような突発的なシフトは、通常、ある物体が終わり、別の物体が始まる点、または物体が背景と接する点を示す。このようなエッジを分離することで、ソベルは複雑な画像を、動きの追跡、形状の検出、物体の認識などのタスクで他のシステムが処理しやすい、よりきれいな輪郭に変換する。

ソーベル・エッジ検出は、画像全体の強度がどのように変化するかを測定する勾配検出器と考えることができる。カーネルと呼ばれる小さな行列を画像上でスライドさせ、隣接するピクセル値の重み付き和を計算する。 

これらのカーネルは、水平方向と垂直方向に沿った明るさの変化を強調するように設計されている。カーネルがデータから学習されるディープラーニングモデルとは異なり、ソーベルは固定カーネルを使用することで、トレーニングを必要とせずに効率的にエッジを強調する。

ここでは、ソーベル・エッジ検出法がどのように機能するかを詳しく見てみよう:

  • 3×3のフィルターを2つ使うこの方法は、フィルターと呼ばれる3×3の小さなグリッドを2つ使う。水平方向(x方向)と垂直方向(y方向)に画像の上をスライドするステンシルのようなものだと考えてほしい。一方のグリッドは水平方向のエッジを見つけるためのもので、もう一方は垂直方向のエッジを見つけるためのものだ。

  • グラデーションの計算:各フィルターは明るさの変化の速さとグラデーションの方向を求める。大きな変化はエッジの可能性を意味する。

  • 結果の結合:水平方向と垂直方向の結果が組み合わされ、各ピクセルにおける全体的なエッジの強さと方向が決定される。

  • エッジの検出:グラデーションの大きさが大きいピクセルは強いエッジとしてマークされる。

  • アウトライン境界:これらのエッジは、オブジェクトの形状を定義し、画像内の異なる領域を分離するのに役立ちます。
図4.ソーベルエッジ検出は、入力画像の主な輪郭を強調し、エッジマップを生成することができる。(出典) 

エッジ検出

Cannyエッジ検出は、画像内のエッジを見つけるためのもう一つの一般的な方法である。クリーンで正確な輪郭を作り出すことで知られている。基本的なエッジ検出技術とは異なり、ノイズをフィルタリングし、境界をシャープにし、最も重要なエッジにフォーカスするために、慎重に設計された一連のステップに従います。 

ここでは、キャニー・エッジ検出器の仕組みについて簡単に説明する:

  • 画像を滑らかにする:画像はまずガウシアンフィルターでぼかされる。これはノイズやエッジと間違われるような小さなディテールを減らすスムージング技術である。
  • 明るさの変化の検出:アルゴリズムは次に、明るさの急激な変化をスキャンし、グラデーション計算を使ってその変化の強さと方向を測定する。

  • エッジを薄くする:検出された線に沿った強い点だけが残され、弱い点は取り除かれるため、鮮明できれいなエッジが得られます。

  • エッジの分類:各ピクセルは、輝度変化の閾値に基づいて、強い、弱い、またはエッジでないとしてラベル付けされる。

  • 最終的なクリーンアップ:強いエッジに接続された弱いエッジは維持され、それ以外のエッジはすべて破棄される。
図5.オリジナル画像とCannyエッジ検出器使用後の出力画像。(出典)

Cannyエッジ検出は、ノイズをフィルタリングしながら正確な結果を提供するため、精度が重要な分野で広く使用されている。例えば、医療画像、衛星マッピング、文書スキャン、ロボットビジョンなどの産業で使用されている。

勾配ベースとガウシアンベースのエッジ検出

これまで、エッジ検出の2つの例として、SobelとCannyを見てきた。どちらもエッジを見つけることを目的としているが、問題へのアプローチは異なる。

勾配ベースの手法(Sobel、Prewitt、Scharrなど)は、勾配として知られる明るさの鋭い変化を探すことでエッジを検出する。画像をスキャンし、この変化が最も強い場所をマークする。これらの方法はシンプルで高速であり、画像が鮮明であればうまく機能する。しかし、ノイズの影響を受けやすく、明るさのわずかな変化をエッジと勘違いしてしまうことがある。

ガウシアンベースの手法(CannyやLaplacian of Gaussianなど)は、この問題に対処するために、まず画像をぼかすという追加のステップを加えます。このスムージングは、多くの場合ガウシアンフィルタで行われ、偽のエッジを作る可能性のある小さな変化を減らします。スムージング後も、これらの方法はシャープな明るさの変化を探しますが、結果はよりクリーンで、ノイズの多い画像や低画質の画像に対してより正確です。

図6.勾配ベースとガウシアンベースのエッジ検出。画像は筆者による

エッジ検出の実世界での応用

エッジ検出の仕組みについて理解を深めたところで、実際の場面でエッジ検出がどのように応用されているのかを探ってみよう。

エッジ検出による亀裂の特定

橋や高層ビルなどの大型コンクリート構造物の検査は、しばしば困難で危険な作業である。これらの構造物は、長い距離をまたいだり、高所に達することがあるため、従来の検査では時間がかかり、費用もかかり、危険も伴う。また、これらの検査には通常、足場、ロープアクセス、手作業によるクローズアップ測定、写真撮影などが必要です。

2019年、研究者たちが高解像度カメラを搭載したドローンを使ってコンクリート表面の詳細な入力画像を撮影し、より安全で迅速な方法をテストしたところ、興味深いアプローチが模索された。その後、これらの画像をさまざまなエッジ検出技術で処理し、ひび割れを自動的に特定した。

調査の結果、この方法は危険区域に人間が直接立ち入る必要性を大幅に減らし、検査を迅速化することがわかった。しかし、その精度は、照明条件、画像の鮮明さ、ドローンの安定稼働などの要因に依存していた。場合によっては、誤検知を排除するために人間による確認が必要なこともあった。

医療用画像処理におけるエッジ検出の応用

X線やMRIにはノイズと呼ばれる視覚障害が含まれていることが多く、細かい部分が見えにくくなることがある。これは、腫瘍の縁を見つけたり、臓器の輪郭をなぞったり、経時的な微妙な変化をモニターしたりする際に、医師にとって難題となる。

最近の医用画像の研究では、Sobel、Canny、Prewitt、Laplacianのような一般的なエッジ検出法が、ノイズの多い画像をどの程度処理できるかがテストされた。研究者たちは、画像にさまざまな種類とレベルのノイズを加え、各手法がどれだけ正確に重要な特徴の輪郭を描けるかをチェックした。

Cannyは通常、ノイズが多いときでも最もきれいなエッジを作るが、すべてのケースでベストというわけではなかった。特定のノイズパターンでより良く機能する方法もあり、唯一の完璧な解決策はありません。

図7.Canny(d-f)はSobel(g-i)に比べ、ノイズが増えるにつれてエッジが明瞭になる。(出典)

これは、コンピュータビジョンのような技術が非常に重要である理由を浮き彫りにしています。高度なアルゴリズムとビジョンAIモデルを組み合わせることで、このようなソリューションは基本的なエッジ検出を超え、厳しい条件下でもより正確で信頼性の高い結果を提供することができます。

エッジ検出の長所

ここでは、エッジ検出と画像処理を使用する利点のいくつかを紹介します: 

  • より優れたデータ圧縮:エッジ検出により、主要な特徴のみを使用して画像を表現できるため、必要な情報を保持したままファイルサイズを削減できます。これにより、保存と転送の効率が向上します。

  • より正確な物体位置特定:エッジ検出は、物体の境界を正確に識別することで、システムが物体の位置を特定し追跡する能力を向上させ、ロボット工学や自律走行車におけるビジョンAIのようなアプリケーションに役立ちます。

  • マルチスケール特徴検出:エッジ検出技術は、異なるスケールで画像を分析し、小さな詳細と大きな形状の両方を捉えることができる。この柔軟性は、テクスチャ解析からシーン理解まで、さまざまなタスクに役立ちます。

画像処理によるエッジ検出の限界

画像処理におけるエッジ検出には多くの利点がある一方で、いくつかの課題もある。ここでは、考慮すべき主な制限をいくつか紹介する:

  • 複雑なテクスチャの問題:複雑なパターンや繰り返しパターンを持つ画像では、エッジ検出はしばしば多くの偽または無関係なエッジを生成し、さらなる分析を複雑にし、信頼性を低下させます。

  • 照明に敏感:明るさ、影、反射の変化により、エッジ検出器が照明の変化をオブジェクトの境界と誤認し、一貫性のない結果になることがあります。

  • 物体の識別ができない:エッジは物体の始点と終点を強調するが、その物体が何であるかは表示しない。検出されたエッジに意味やラベルを付けるには、追加の処理が必要です。

エッジ検出にコンピュータ・ビジョンが使える場合

エッジ検出は、私たちの目と脳がどのように連携して世界を理解するかにヒントを得ている。人間の視覚に関して言えば、視覚野にある特殊なニューロンは、エッジ、線、境界線に非常に敏感である。 

これらの視覚的な手がかりは、ある物体がどこで終わり、別の物体がどこで始まるかを素早く判断するのに役立つ。私たちの脳は、形や物体を識別するためにエッジに大きく依存しているのだ。

コンピュータ・ビジョンはこの能力を模倣することを目的としているが、さらに一歩進んでいる。Ultralytics YOLO11のようなモデルは、基本的なエッジハイライトや画像強調の域を超えている。物体を検出し、正確に輪郭を描き、リアルタイムで動きを追跡することができる。このような深いレベルの理解は、エッジ検出だけでは十分でないシナリオで不可欠となる。

Ultralytics YOLO11を使用してエッジをより正確に検出

YOLO11がサポートする、エッジ検出をベースとし、それを超える主要なコンピュータビジョンタスクをいくつか紹介する:

  • オブジェクト検出:画像やビデオ内の複数のオブジェクトを識別し、それぞれのオブジェクトの周りにバウンディングボックスを描画して位置を特定します。

  • インスタンスのセグメンテーション:これは、オブジェクトをピクセルレベルまで分解し、オブジェクトが重なっていたり、不規則な形をしていたりしても、きれいで正確なアウトラインを作成する。

  • 姿勢推定:ここでの目的は、物体や人物の位置、向き、姿勢を決定することであり、動きの監視や経時的な構造変化の検出に役立つ。

  • 物体追跡:このタスクは、ビデオフレーム内を移動する物体を追跡し、正確な長期観測のための一貫した識別を保証する。

  • 画像分類:視覚的な特徴に基づいてオブジェクトや画像全体にラベルを割り当て、大規模なデータセットの整理と解釈を容易にします。

コンピュータ・ビジョンによるインフラのエッジ検出

従来エッジ検出に頼っていたアプリケーションをコンピュータ・ビジョンで強化した好例として、インフラや産業資産のひび割れ検出があります。YOLO11のようなコンピュータビジョンモデルは、道路、橋、パイプラインのひび割れを正確に識別するように訓練することができます。同じ技術は航空機の整備、建物の検査、製造業の品質管理にも応用でき、検査の迅速化と安全性の向上に役立ちます。

図8.き裂分割にYOLO11を使用した例。(出典)

要点

エッジ検出は、初期のシンプルな手法から、複雑な画像の微妙な境界も検出できる高度なテクニックまで、長い道のりを歩んできました。エッジ検出は、重要なディテールを浮き彫りにし、重要なエリアを強調し、画像をより深く分析するための準備に役立ち、画像処理の核となる部分です。

コンピュータビジョンにおいて、エッジ検出は形状の定義、物体の分離、有用な情報の抽出において重要な役割を果たす。医療画像、工業検査、自律走行、セキュリティなど多くの分野で使用され、正確で信頼性の高い視覚的理解を実現している。

私たちのコミュニティに参加して、GitHubリポジトリを探索し、AIについてもっと発見してください。ビジョンAIのプロジェクトを始めたい方は、 ライセンスオプションをご覧ください。ヘルスケアにおけるAIや 小売業におけるビジョンAIのようなアプリケーションについては、ソリューションのページをご覧ください。

AIの未来
を一緒に作りましょう!

機械学習の未来への旅を始めよう

無料で始める
クリップボードにコピーされたリンク