画像処理における閾値処理とは何か?
このガイドで画像処理における閾値処理(スレッショルド処理)を探究します。閾値処理とは何か、大津の二値化を含むさまざまな画像閾値処理手法を学びます。

本記事で扱う概念の視覚的な解説については、以下の動画をご覧ください。
人間は画像をまとまりのある意味のある絵として認識しますが、コンピュータは画像を小さな画素(デジタル画像の最小単位であるピクセル)のグリッドとして認識します。画像処理というプロセスにおいて、これらのピクセルを調整または解析することで、画像を改善し、有用な情報を抽出することができます。
一般的な画像処理技術の一つに、画像閾値処理があります。この手法は、各ピクセルをあらかじめ設定した値と比較することで、グレースケール画像(各ピクセルがグレーの濃淡を表す画像)を白黒画像に変換します。これにより、重要な領域と背景の間に明確な境界が生まれます。
閾値処理は、画像を意味のある領域に分割して解析しやすくする手法である画像セグメンテーションによく用いられます。これは通常、マシンが視覚データを解釈する際の手始めとなるステップの一つです。本記事では、閾値処理とは何か、その仕組み、そして実際の現場でどのように応用されているかを見ていきます。それでは始めましょう!
Link to this section画像閾値処理における基本用語#
閾値処理の仕組みに入る前に、まずはその背景にある基本的な考え方と、画像処理での活用方法について詳しく見ていきましょう。
Link to this section二値画像閾値#
画像内のオブジェクトを背景から分離したい場合を考えてみましょう。これを行う方法の一つが閾値処理です。この手法により画像が単純化され、すべてのピクセルが完全に黒または完全に白になります。その結果として、各ピクセルが0(黒)または255(白)の値を持つ二値画像(バイナリ画像)が生成されます。このステップは、画像内の重要な部分をはっきりと際立たせることができるため、画像処理において非常に有用です。

図1. グレースケール画像と閾値処理後の二値画像。(出典: blog.devops.dev)
Link to this sectionヒストグラム#
同様に、画像全体における明るさの値がどのように分布しているかを把握したい場合、ヒストグラムが役立ちます。これは、黒(0)から白(255)までの各ピクセル強度がどのくらいの頻度で現れるかを示すグラフです。
ヒストグラムを見ることで、その画像が暗いのか、明るいのか、あるいはその中間なのかがわかります。これにより、パターンやコントラストのレベルを一目で把握できるため、画像を白黒に変換する際の適切な閾値を決定しやすくなります。
Link to this section前景と背景#
画像に閾値処理を適用すると、画像は前景と背景の二つに分かれます。通常、白で表示される「前景」は、テキスト、形状、検知したいオブジェクトなど、重要な要素を強調します。一方、黒で表示される「背景」はそれ以外のすべてを指します。この分離により、マシンは画像内の何が重要かという点に集中できるようになります。
Link to this sectionセグメンテーション#
先述の通り、セグメンテーションは明るさやテクスチャといった特徴に基づいて画像を意味のある領域に分割します。閾値処理はこれを実行する簡単な方法であり、コンピュータビジョンパイプラインの最初のステップとなることがよくあります。
コンピュータビジョンは、人間のようにマシンが視覚データを処理し解釈できるようにするAIの一分野です。処理の早い段階で閾値処理を用いることで、コンピュータビジョンシステムはオブジェクトを背景から分離でき、その後の検知や認識といった工程をより正確に実行できるようになります。
Link to this sectionグローバル閾値処理#
閾値処理についてより深く理解できたところで、次は画像の閾値処理の方法と、画像処理における様々なタイプの閾値処理について見ていきましょう。
例えば、グローバル閾値処理は二値画像を作成する最も簡単な方法の一つです。これは画像全体に対して単一の強度値を適用します。この閾値よりも明るいピクセルは白になり、暗いピクセルは黒になります。これにより、オブジェクトと背景の分離が促進されます。
これは照明が均一でコントラストが強い画像で最も効果を発揮します。しかし、照明が不均一な場合やコントラストが低い領域では、単一の閾値では詳細が失われたり、境界がぼやけたりすることがあります。
これに対応するため、大津の二値化(Otsu’s thresholding)のような手法が用いられます。手動で値を設定する代わりに、大津の二値化では画像のヒストグラムを解析し、ピクセル強度を前景と背景に最もよく分離できる閾値を選択します。

図2. 大津の二値化を適用する前後の土星の画像。(出典)
Link to this sectionローカル(適応的)閾値処理#
グローバル閾値処理とは異なり、適応的(アダプティブ)またはローカル閾値処理では、画像内の各部位ごとに個別の閾値が計算されます。これにより、影のかかったスキャン済み文書やテクスチャのある表面など、照明が不均一な画像に対してより効果的です。
この手法では、画像を小さな領域に分割し、それぞれのブロックごとにローカルな閾値を計算することで、前景と背景のコントラストを維持します。このアプローチは、テキスト認識、医療画像処理、表面検査など、画像全体で照明が変化するタスクで広く活用されています。
画像処理における適応的閾値処理の一般的なアプローチには、適応的平均閾値処理や適応的ガウス閾値処理があります。適応的平均閾値処理では、中心ピクセルの閾値として、その近傍の平均ピクセル強度が使用されます。一方、適応的ガウス閾値処理では、ガウスウィンドウを用いた加重平均が使用され、中心に近いピクセルに重きが置かれます。
Link to this section画像処理における閾値処理の実社会での応用#
次に、画像閾値処理が実社会のどのような場面で使用されているかを探っていきましょう。
Link to this section文書の二値化とOCRのための画像閾値処理#
古い書籍や手書きの手紙は、保存やOCR(光学文字認識)によるデジタルテキスト化のためにスキャンされることがよくあります。テキストを抽出する前には、通常、文書のクリーニングや前処理が必要です。スキャンされた画像には影やインクの掠れ、不均一な照明があることが多く、文字認識を困難にする原因となります。
明瞭度を向上させるため、閾値処理を用いてグレースケール画像を二値形式に変換し、背景からテキストを分離しやすくします。文字のような暗い領域は黒くなり、明るい背景は白くなるため、OCRシステムがテキストを読み取りやすくなります。

図3. 歴史的文書とその閾値処理された画像の例。(出典)
Link to this section医療画像処理における閾値処理の利用#
同様に、医療画像処理においても、X線画像における骨や肺などの特定の構造を分離するために閾値処理が一般的に使用されます。グレースケール画像を二値形式に変換することで、周囲の組織から関心領域を分離し、その後の解析に備えることが容易になります。より複雑なケースでは、多段階の閾値処理を適用して画像をいくつかの異なる領域に分割し、複数の種類の組織や構造を同時に特定することも可能です。

図4. 胸部X線画像への多段階閾値処理手法の適用。(出典: sciencedirect.com)
Link to this section画像処理における閾値処理の利点と欠点#
画像処理に閾値処理を用いることの主な利点は以下の通りです。
- リソースの軽量化: 閾値処理は低電力デバイスで良好に動作し、クラウドアクセスやハイエンドなハードウェアを必要としないため、組込みシステムやオフライン環境に適しています。
- 解釈が容易: シンプルなロジックであるため、閾値処理の出力結果は理解やデバッグが容易であり、透明性が求められるヘルスケアや文書処理などの分野において極めて重要です。
- 迅速なテスト: 閾値処理を活用することで、チームはより複雑なモデルに移行する前のプロジェクトの初期段階において、セグメンテーションのアイデアを素早く検証できます。
画像閾値処理は多くの場面で有用ですが、いくつかの制限も存在します。考慮すべき閾値処理に関連する課題を挙げます。
- 適応性の欠如: 閾値処理は固定されたルールに従うため、手動で調整しない限り、新しい照明条件やデータの変化に対応できません。
- ノイズへの弱さ: 影や反射によるわずかな明るさの変化が結果を損なう可能性があり、特に詳細やテクスチャの多い画像を扱う際にその傾向が顕著です。
- 静的でルールベース: AIモデルとは異なり、閾値処理はデータから学習したり、時間の経過とともに改善したりすることはありません。設計された特定の条件下でのみ機能します。
Link to this section画像閾値処理の先へ:いつコンピュータビジョンが適切なツールとなるか#
閾値処理は、制御された環境下での単純なセグメンテーションタスクには適しています。しかし、複数のオブジェクトが存在したり背景ノイズがあるような複雑な画像を扱う場合には、苦戦することが多々あります。固定されたルールに依存するため、閾値処理には実社会の多くのアプリケーションで必要とされる柔軟性が欠けています。
こうした限界を超えるため、現在、多くの最先端システムではコンピュータビジョンが利用されています。閾値処理とは対照的に、ビジョンAIモデルは複雑なパターンや特徴を検知するように訓練されているため、圧倒的に高い精度と適応性を備えています。
例えば、Ultralytics YOLO11のようなコンピュータビジョンモデルは、リアルタイムでオブジェクトの検知や画像のセグメンテーションを行うことができます。これにより、自動運転車での信号機検知や、農業における作物トラブルの特定といったタスクに理想的なツールとなります。
特にYOLO11は、インスタンスセグメンテーションなど幅広いコンピュータビジョンタスクをサポートしており、画像内の各オブジェクトを個別にセグメント化します。他にも、姿勢推定(オブジェクトの姿勢や位置を決定する)やオブジェクトトラッキング(動画フレーム内で移動するオブジェクトを追跡する)といったビジョンベースのタスクも実行可能です。

図5. YOLO11はオブジェクトの検知とセグメンテーションを簡単にします。(出典)
閾値処理は単純なタスクや初期のアイデアの検証にはうまく機能しますが、スピード、精度、柔軟性が求められるアプリケーションにおいては、コンピュータビジョンを用いる方がより適切です。
Link to this section重要なポイント#
閾値処理は、オブジェクトを背景から分離するために高速かつ簡単に使用できるため、画像処理における重要なツールです。スキャンされた文書、医療画像、工場の製品欠陥チェックなどでうまく機能します。
しかし、画像や動画がより複雑になるにつれ、画像閾値処理のような基本的な画像処理手法では対応しきれなくなることがあります。そこで進化したコンピュータビジョンモデルの出番です。YOLO11のようなモデルは、より多くのタスクを理解・実行し、一度に多数のオブジェクトを認識し、かつリアルタイムで動作できるため、多くのユースケースで役立ちます。
AIについてもっと知りたいですか?私たちのコミュニティとGitHubリポジトリをチェックしてください。ロボティクスにおけるAIや農業におけるコンピュータビジョンについて学ぶには、ソリューションページを探索してください。ライセンスのオプションを確認し、今日からコンピュータビジョンで構築を始めましょう!






