什么是图像处理中的阈值处理?

5 分钟阅读

2025 年 8 月 12 日

通过本指南探索图像处理中的阈值处理。了解什么是阈值化、不同的图像阈值化技术,包括大津阈值化。

作为人类,我们将图像视为连贯、有意义的图片,而计算机则将其视为由微小像素组成的网格,即数字图像的最小组成部分。在称为图像处理的过程中,可以对这些像素进行调整或分析,以改善图像并提取有用信息。

一种常见的图像处理技术叫做图像阈值处理。这种方法通过将每个像素与设定值进行比较,将灰度图像(每个像素代表一种灰度)转换为黑白图像。它能将重要区域和背景清晰地区分开来。

阈值处理常用于图像分割,这是一种将图像分割成有意义的区域以便于分析的技术。它通常是帮助机器解释视觉数据的第一步。在本文中,我们将了解什么是阈值处理、它是如何工作的,以及它在实际场景中的应用。让我们开始吧!

图像阈值处理的基本术语

在深入了解阈值处理的工作原理之前,让我们先仔细了解一下阈值处理背后的基本理念以及它在图像处理中的应用。

二值图像阈值

比方说,你正在处理一幅图像,想要将其中的物体与背景分离开来。其中一种方法就是阈值化。它可以简化图像,使每个像素要么全黑,要么全白。这样就得到了二值图像,其中每个像素的值为 0(黑色)或 255(白色)。这一步在图像处理中通常很有用,因为它能使图像的重要部分清晰突出。

图 1.灰度图像及其阈值化后的二进制输出。(资料来源) 

柱状图

同样,如果您想了解亮度值在图像中的分布情况,直方图也可以帮助您。直方图显示了从黑色(0)到白色(255)每个像素强度出现的频率。 

通过查看直方图,您可以了解图像是暗还是亮,或者是介于两者之间。这样,在将图像转换成黑白图像时,就能更容易地选择一个好的阈值,因为你可以一眼看出图像的模式和对比度水平。

前景和背景

图像经过阈值处理后,会被分为前景和背景两部分。前景通常以白色显示,突出重要元素,如文字、形状或要检测的对象。背景显示为黑色,是其他所有内容。这种分离有助于机器将注意力集中在图像中重要的内容上。

细分

如前所述,分割是根据亮度或纹理等特征将图像划分为有意义的区域。阈值处理是一种简单的方法,通常是计算机视觉管道的第一步。 

计算机视觉是人工智能的一个分支,它能让机器像人类一样处理和解释视觉数据。通过在处理过程的早期使用阈值处理,计算机视觉系统可以将物体从其背景中分离出来,从而使后面的步骤(如检测或识别)更容易准确地进行。

全局阈值

既然我们已经对什么是阈值处理有了更好的了解,下面就让我们来了解一下如何对图像进行阈值处理,以及图像处理中不同类型的阈值处理。

例如,全局阈值处理是创建二值图像的最简单方法之一。它在整个图像中应用一个单一的强度值。亮度高于该阈值的像素变为白色,而暗淡的像素变为黑色。这有助于将物体从背景中分离出来。

当图像光线均匀、对比度强时,它的效果最好。但在光线不均或对比度低的区域,单一阈值可能会错过细节或模糊边缘。

为了解决这个问题,我们采用了大津阈值法等方法。大津的阈值处理方法不需要手动设置数值,而是通过分析图像的直方图,选择一个能最好地将像素强度分为前景和背景的阈值。 

图 2.应用大津阈值处理前后的土星图像。(资料来源)

局部(自适应)阈值处理

与全局阈值处理不同,自适应或局部阈值处理是针对图像的不同部分分别计算阈值。这使得它对光照不均匀的图像更有效,例如带有阴影或纹理表面的扫描文件。

它的工作原理是将图像划分成小区域,并为每个区块计算局部阈值,从而帮助保持前景和背景之间的对比度。这种方法被广泛应用于文字识别、医学成像和表面检测等任务中,因为在这些任务中,整个图像的光照都会发生变化。

图像处理中常用的自适应阈值处理方法包括自适应平均阈值处理和自适应高斯阈值处理。在自适应平均阈值法中,局部邻域的平均像素强度被用作中心像素的阈值。另一方面,自适应高斯阈值法使用的是高斯窗口的加权平均值,更重视靠近中心的像素。

阈值法在图像处理中的实际应用

接下来,让我们探讨一下图像阈值处理在现实世界中的应用。

用于文件二值化和 OCR 的图像阈值处理

旧书和手写信件通常会被扫描以保存下来,或使用OCR(光学字符识别)将其转换为数字文本,OCR 是一种读取印刷或手写字符的技术。在提取文本之前,通常需要对文档进行清理或预处理。扫描图像通常会有阴影、墨迹褪色或光照不均,这都会给字符识别带来困难。

为了提高清晰度,阈值处理被用来将灰度图像转换成二进制格式,从而帮助将文字从背景中分离出来。字母等颜色较深的区域会变成黑色,而颜色较浅的背景则会变成白色,从而使 OCR 系统更容易读取文字。

图 3.历史文献及其阈值化图像的示例。(资料来源)

在医学图像处理中使用阈值法 

同样,在医学成像中,阈值处理通常用于分离扫描中的特定结构,如 X 射线图像中的骨骼或肺部。通过将灰度图像转换为二进制格式,可以更容易地将感兴趣的区域从周围组织中分离出来,为进一步分析图像做好准备。在更复杂的情况下,可采用多级阈值法将图像分成几个不同的区域,从而同时识别不同类型的组织或结构。

图 4.在胸部 X 光片上使用多级阈值法。(资料来源)

阈值法在图像处理中的利弊

以下是在图像处理中使用阈值处理的一些主要优势:

  • 节省资源:
  • 易于解释:其简单的逻辑使阈值输出易于理解和调试,这在医疗保健或文档处理等透明度要求较高的领域至关重要。
  • 快速测试:阈值处理使团队能够在早期项目中快速探索细分想法,然后再转向更复杂的模型。

虽然图像阈值处理在很多情况下都很有用,但它也有一定的局限性。以下是与阈值处理有关的一些挑战,值得考虑:

  • 缺乏适应性:
  • 对噪点敏感:阴影或反射造成的微小亮度变化会影响效果,尤其是在处理细节或纹理图像时。
  • 静态和基于规则:与人工智能模型不同,阈值法不会从数据中学习,也不会随着时间的推移而改进。它只能在其设计的狭窄条件下工作。

超越图像阈值:当计算机视觉成为正确的工具时

在受控环境下,阈值法能很好地完成简单的分割任务。然而,在处理具有多个物体或背景噪声的复杂图像时,阈值法往往会陷入困境。由于阈值法依赖于固定的规则,因此缺乏大多数实际应用所需的灵活性。

为了超越这些限制,许多尖端系统现在都采用了计算机视觉技术。与阈值法相比,视觉人工智能模型经过训练,可以检测复杂的模式和特征,因此准确性和适应性更高。

例如,Ultralytics YOLO11等计算机视觉模型可以实时检测物体并分割图像。这使它们成为自动驾驶汽车发现交通信号或识别农业作物问题等任务的理想选择。 

YOLO11 尤其支持一系列计算机视觉任务,如实例分割,即对图像中的每个物体进行单独分割。它还能执行其他基于视觉的任务,包括姿态估计(确定物体的位置或姿态)和物体跟踪(跟踪物体在视频帧中的移动)。

图 5.YOLO11 可轻松检测和分割物体(资料来源)

虽然阈值法对于简单任务或测试早期想法非常有效,但对于需要速度、准确性和灵活性的应用,计算机视觉通常能更好地处理。

主要收获

阈值处理是图像处理中的一个重要工具,因为它可以快速、方便地将物体从背景中分离出来。它在扫描文件、医疗图像和检查工厂产品缺陷方面都有很好的效果。 

然而,随着图像和视频变得越来越复杂,图像阈值处理等基本图像处理方法就显得力不从心了。这时,先进的计算机视觉模型就能发挥作用。像 YOLO11 这样的模型可以理解和执行更多任务,一次发现许多物体,并且可以实时工作,因此在许多应用案例中都非常有用。

想了解有关人工智能的更多信息?查看我们的社区GitHub 存储库。浏览我们的解决方案页面,了解机器人中的人工智能 农业中的计算机视觉。了解我们的许可选项,现在就开始使用计算机视觉进行构建!

让我们共同打造人工智能的未来

开始您的未来机器学习之旅

免费开始
链接复制到剪贴板