このガイドでは、画像処理における閾値処理について説明します。閾値処理とは何か、大津の閾値処理を含むさまざまな画像の閾値処理技術について学んでください。

このガイドでは、画像処理における閾値処理について説明します。閾値処理とは何か、大津の閾値処理を含むさまざまな画像の閾値処理技術について学んでください。
私たち人間は、画像を首尾一貫した意味のある絵として見ているが、コンピュータはデジタル画像の最小構成要素である小さなピクセルのグリッドとして見ている。画像処理と呼ばれるプロセスでは、これらのピクセルを調整または分析して画像を改善し、有用な情報を抽出することができる。
一般的な画像処理技術として、画像閾値処理がある。この方法は、各ピクセルを設定された値と比較することで、グレースケール画像(各ピクセルがグレーの濃淡を表す)を白黒画像に変換する。これにより、重要な領域と背景が明確に分離される。
閾値処理は、画像を意味のある領域に分割して分析を容易にする技術である、画像セグメンテーションでよく使われる。これは通常、機械が視覚データを解釈するための最初のステップの1つである。この記事では、閾値処理とは何か、どのように機能するのか、実際のシナリオでどのように適用されるのかを見ていきます。始めよう!
閾値処理の仕組みに入る前に、まずその背景にある基本的な考え方と、画像処理でどのように使われているかを詳しく見てみよう。
ある画像を使っていて、その中の物体を背景から分離したいとしよう。これを行う方法のひとつが閾値処理だ。これは画像を単純化し、すべてのピクセルが真っ黒か真っ白のどちらかになるようにする。その結果、各ピクセルの値が0(黒)か255(白)の2値画像となる。このステップは、画像の重要な部分をはっきりと際立たせるので、画像処理ではよく役に立ちます。
同様に、明るさの値が画像全体にどのように分布しているかを理解したい場合は、ヒストグラムが役立ちます。これは、黒(0)から白(255)までの各ピクセルの強度がどのくらいの頻度で現れるかを示すグラフです。
ヒストグラムを見れば、画像が暗いのか、明るいのか、その中間なのかがわかる。このため、画像を白黒にするときに、パターンやコントラストレベルが一目でわかるので、しきい値を選びやすくなります。
画像が閾値処理されると、前景と背景の2つの部分に分けられます。前景は通常白で表示され、検出したいテキスト、図形、物体などの重要な要素を強調します。背景は黒色で表示され、それ以外のものです。このように分けることで、機械は画像内の重要な要素に集中することができます。
前述したように、セグメンテーションは、明るさやテクスチャなどの特徴に基づいて、画像を意味のある領域に分割する。閾値処理はこれを行う簡単な方法で、多くの場合、コンピュータビジョンパイプラインの最初のステップの1つです。
コンピュータ・ビジョンはAIの一分野であり、機械が人間のように視覚データを処理・解釈することを可能にする。プロセスの初期段階で閾値処理を使用することで、コンピュータ・ビジョン・システムは物体をその背景から分離することができ、検出や認識といった後のステップを正確に行うことが容易になる。
閾値処理とは何かについて理解を深めたところで、画像に閾値を設定する方法と、画像処理における閾値処理の種類を説明しよう。
例えば、大域的閾値処理は、2値画像を作成する最も簡単な方法の1つである。これは画像全体に単一の強度値を適用する。この閾値より明るいピクセルは白くなり、暗いピクセルは黒くなる。これにより、対象物と背景を分離することができる。
画像に均一な照明があり、強いコントラストがある場合に効果的です。しかし、不均一な照明や低コントラストの領域では、単一のスレッショルドは、詳細を見逃したり、エッジをぼかすことができます。
これを処理するために、大津の閾値処理のような方法が使われる。手動で値を設定する代わりに、大津の閾値処理の方法は、画像のヒストグラムを分析し、ピクセルの強度を前景と背景に最もよく分離する閾値を選択する。
グローバル閾値処理とは異なり、適応閾値処理またはローカル閾値処理は、画像の異なる部分に対して個別に閾値を計算します。このため、影のあるスキャン文書やテクスチャのある表面など、照明にムラのある画像に効果的です。
これは画像を小さな領域に分割し、各ブロックに対して局所的な閾値を計算することで機能し、前景と背景のコントラストを維持するのに役立つ。このアプローチは、文字認識、医療画像、表面検査など、照明が画像全体で変化するようなタスクで広く使われている。
画像処理における適応的閾値処理の一般的なアプローチには、適応的平均閾値処理と適応的ガウス閾値処理がある。適応平均閾値処理では、局所近傍の画素強度の平均が中心画素の閾値として使用されます。一方、適応ガウス閾値処理は、ガウス窓による加重平均を使用し、中心に近い画素をより重視します。
次に、画像閾値処理が実際のアプリケーションでどのように使われているかを調べてみよう。
古い本や手書きの手紙は、保存のためにスキャンされたり、OCR(Optical Character Recognition:光学式文字認識)という印刷や手書きの文字を読み取る技術を使ってデジタルテキストに変換されたりすることが多い。テキストを抽出する前に、通常、文書のクリーニングや前処理が必要である。スキャンされた画像には、影があったり、インクが薄くなっていたり、照明にムラがあったりすることが多く、文字認識が困難になることがあります。
鮮明度を向上させるため、閾値処理を使用してグレースケール画像を2値フォーマットに変換し、背景からテキストを分離します。文字のような暗い部分は黒くなり、明るい背景は白くなる。
同様に医用画像では、X線画像における骨や肺など、スキャン中の特定の構造を分離するために閾値処理が一般的に使用される。グレースケール画像を2値フォーマットに変換することで、関心領域を周辺組織から分離することが容易になり、さらなる解析のために画像を準備することができる。より複雑なケースでは、マルチレベル閾値処理を適用して画像を複数の異なる領域に分割し、異なるタイプの組織や構造を同時に識別できるようにすることができる。
画像処理で閾値処理を使用する主な利点のいくつかを紹介しよう:
画像の閾値処理は多くの場面で有用であるが、一定の制限もある。ここでは、閾値処理に関連するいくつかの課題について説明します:
閾値処理は、制御された環境での単純なセグメンテーションタスクには有効である。しかし、複数のオブジェクトや背景ノイズを含む複雑な画像を扱う場合には、しばしば苦労する。閾値処理は固定されたルールに依存しているため、ほとんどの実世界のアプリケーションに必要な柔軟性に欠ける。
こうした限界を超えるために、現在では多くの最先端システムがコンピューター・ビジョンを使用している。閾値処理とは対照的に、ビジョンAIモデルは複雑なパターンや特徴を検出するように訓練されているため、はるかに正確で適応性が高い。
例えば、Ultralytics YOLO11のようなコンピュータビジョンモデルは、リアルタイムで物体を検出し、画像をセグメント化することができる。そのため、自律走行車における交通信号の発見や、農業における作物の問題の特定といったタスクに最適です。
特に、YOLO11は、画像内の各オブジェクトを個別にセグメンテーションするインスタンスセグメンテーションなど、さまざまなコンピュータビジョンタスクをサポートしている。また、姿勢推定(物体の位置や姿勢を決定する)や物体追跡(ビデオフレームを移動する物体を追跡する)など、他のビジョンベースのタスクも実行できる。
閾値処理は、単純なタスクや初期のアイデアをテストするのには適しているが、スピード、正確さ、柔軟性を必要とするアプリケーションは、通常、コンピュータ・ビジョンで処理する方が良い。
閾値処理は画像処理において非常に重要なツールである。スキャンした文書、医療画像、工場での製品欠陥のチェックなどに効果的です。
しかし、画像や動画がより複雑になると、画像の閾値処理のような基本的な画像処理方法では苦戦を強いられることがある。そこで、高度なコンピューター・ビジョン・モデルの出番となる。YOLO11のようなモデルは、より多くのタスクを理解し、実行することができ、一度に多くのオブジェクトを発見し、リアルタイムで動作するため、多くのユースケースで有用である。
AIについてもっと知りたいですか?私たちのコミュニティと GitHubリポジトリをチェックしてください。ロボット工学と 農業におけるコンピュータビジョンの AIについて学ぶために、当社のソリューションページをご覧ください。私たちのライセンスオプションを発見し、今日からコンピュータビジョンを使ってビルドを始めましょう!