遇见 YOLO26: 下一代视觉 AI。
Ultralytics
指南

什么是图像处理中的阈值处理?

通过本指南探索图像处理中的阈值处理。学习什么是阈值处理,以及包括大津算法 (Otsu's thresholding) 在内的不同图像阈值处理技术。

ABAbirami Vina
5 min read
使用阈值处理将灰度图像转换为黑白图像

想要直观地了解本文涵盖的概念,请观看下方的视频。

作为人类,我们将图像视为连贯、有意义的画面,而计算机将其视为微小像素的网格,这是数字图像的最小组成部分。在所谓的图像处理过程中,这些像素可以被调整或分析,以改善图像并提取有用的信息。

一种常见的图像处理技术称为图像阈值处理。该方法通过将每个像素与设定值进行比较,将灰度图像(其中每个像素代表一种灰度)转换为黑白图像。它在重要区域和背景之间创建了清晰的分离。

阈值处理通常用于图像分割,这是一种将图像拆分为有意义区域的技术,以便于分析。它通常是帮助机器解读视觉数据的首要步骤之一。在本文中,我们将了解什么是阈值处理、它如何工作以及它在现实场景中的应用。让我们开始吧!

Link to this section图像阈值处理中的基本术语#

在我们深入探讨阈值处理的工作原理之前,让我们先仔细了解一下其背后的基本概念以及它在图像处理中的使用方式。

Link to this section二值图像阈值#

假设你正在处理一张图像,并希望将其中的对象与背景分离。实现这一目标的方法之一就是阈值处理。它简化了图像,使得每个像素要么完全为黑色,要么完全为白色。结果是一幅二值图像,其中每个像素的值为 0(黑色)或 255(白色)。这一步骤在图像处理中通常很有用,因为它使图像中的重要部分清晰地凸显出来。

一张灰度图像及其经过阈值处理后的二值化输出

图 1. 一张灰度图像及其经过阈值处理后的二值输出。(来源:blog.devops.dev)

Link to this section直方图#

同样,如果你想了解亮度值在图像中是如何分布的,直方图可以提供帮助。它是一张显示每个像素强度出现频率的图表,范围从黑色(0)到白色(255)。

通过查看直方图,你可以判断图像是偏暗、偏亮还是介于两者之间。这使得在将图像转换为黑白时选择一个好的阈值变得更加容易,因为你可以一眼看出其中的模式和对比度水平。

Link to this section前景和背景#

一旦图像经过阈值处理,它就会被分为两个部分:前景和背景。前景通常以白色显示,用于突出显示重要元素,例如你想要检测的文本、形状或对象。背景以黑色显示,是其他所有内容。这种分离有助于机器专注于图像中重要的内容。

Link to this section分割#

如前所述,分割根据亮度或纹理等特征将图像划分为有意义的区域。阈值处理是实现此目的的一种简单方法,通常是计算机视觉流水线中的首要步骤之一。

计算机视觉是人工智能的一个分支,它使机器能够像人类一样处理和解读视觉数据。通过在流程早期使用阈值处理,计算机视觉系统可以将对象与其背景分离开来,从而使后续步骤(如检测或识别)能够更准确地工作。

Link to this section全局阈值处理#

既然我们对什么是阈值处理有了更好的了解,让我们来看看如何对图像进行阈值处理,以及图像处理中不同类型的阈值处理。

例如,全局阈值处理是创建二值图像的最简单方法之一。它在整个图像上应用单一的强度值。比此阈值亮的像素变为白色,而较暗的像素变为黑色。这有助于将对象与背景分离开来。

当图像光照均匀且对比度高时,它的效果最好。但在光照不均匀或对比度较低的区域,单一的阈值可能会漏掉细节或导致边缘模糊。

为了解决这个问题,通常使用诸如 Otsu 阈值处理之类的方法。Otsu 阈值处理方法不是手动设置值,而是分析图像的直方图并选择一个最能将像素强度分离为前景和背景的阈值。

应用 Otsu 阈值处理前后的土星图像

图 2. 应用 Otsu 阈值处理前后的土星图像。(来源)

Link to this section局部(自适应)阈值处理#

与全局阈值处理不同,自适应或局部阈值处理会为图像的不同部分分别计算阈值。这使得它对于光照不均匀的图像(例如带有阴影的扫描文档或纹理表面)更有效。

它的工作原理是将图像划分为小区域,并为每个块计算局部阈值,这有助于保持前景和背景之间的对比度。这种方法广泛用于文本识别、医学影像和表面检测等任务,其中光照会在图像中发生变化。

图像处理中一些常见的自适应阈值处理方法包括自适应均值阈值处理和自适应高斯阈值处理。在自适应均值阈值处理中,局部邻域内的平均像素强度被用作中心像素的阈值。另一方面,自适应高斯阈值处理使用带有高斯窗口的加权平均值,从而更重视靠近中心的像素。

Link to this section图像处理中阈值处理的现实应用#

接下来,让我们探讨图像阈值处理在哪些现实应用中使用。

Link to this section用于文档二值化和 OCR 的图像阈值处理#

古籍和手写信件通常会被扫描以进行保存,或者使用 OCR(光学字符识别)转换为数字文本,这是一种读取打印或手写字符的技术。在提取文本之前,文档通常需要进行清理或预处理。扫描图像通常存在阴影、字迹褪色或光照不均匀的问题,这会使字符识别变得困难。

为了提高清晰度,阈值处理被用于将灰度图像转换为二值格式,从而有助于将文本与背景隔离。较暗的区域(如字母)变为黑色,而较亮的背景变为白色,这使得 OCR 系统更容易读取文本。

一份历史文档及其经阈值处理后的图像

图 3. 一份历史文档及其经过阈值处理后的图像示例。(来源)

Link to this section在医学图像处理中使用阈值处理#

同样,在医学影像中,阈值处理常用于分离扫描中的特定结构,例如 X 射线图像中的骨骼或肺部。通过将灰度图像转换为二值格式,可以更容易地将感兴趣的区域与周围组织分离,并为进一步分析做好准备。在更复杂的情况下,可以应用多级阈值处理将图像划分为多个不同的区域,从而允许同时识别不同类型的组织或结构。

在胸部 X 光片上使用多级阈值处理方法

图 4. 在胸部 X 射线中使用多级阈值处理方法。(来源:sciencedirect.com)

Link to this section图像处理中阈值处理的优缺点#

以下是在图像处理中使用阈值处理的一些主要优势:

  • 资源占用少: 阈值处理在低功耗设备上运行良好,不需要云访问或高端硬件,非常适合嵌入式系统和离线设置。
  • 易于解释: 其简单的逻辑使得阈值处理的输出易于理解和调试,这在医疗保健或文档处理等透明度至关重要的领域尤为重要。
  • 快速测试: 阈值处理使团队能够在项目早期阶段快速探索分割思路,然后再转向更复杂的模型。

虽然图像阈值处理在许多场景中很有用,但它也有一定的局限性。以下是一些需要考虑的阈值处理挑战:

  • 缺乏适应性: 阈值处理遵循固定规则,如果不进行手动调整,它无法适应新的光照条件或数据变化。
  • 对噪声敏感: 来自阴影或反射的微小亮度变化可能会导致结果偏差,特别是在处理细节丰富或有纹理的图像时。
  • 静态且基于规则: 与人工智能模型不同,阈值处理不会从数据中学习或随时间改进。它仅在设计的窄条件下工作。

Link to this section超越图像阈值处理:何时使用计算机视觉才是正确的工具#

阈值处理适用于受控环境下的简单分割任务。然而,在处理具有多个对象或背景噪声的复杂图像时,它往往力不从心。由于依赖于固定规则,阈值处理缺乏大多数现实应用所需的灵活性。

为了突破这些局限,许多尖端系统现在使用计算机视觉。与阈值处理相比,视觉人工智能模型经过训练可以检测复杂的模式和特征,使其更加精确和灵活。

例如,像 Ultralytics YOLO11 这样的计算机视觉模型可以实时检测对象并分割图像。这使得它们非常适合自动驾驶汽车中的交通信号识别或农业中的作物问题识别等任务。

特别是,YOLO11 支持一系列计算机视觉任务,例如实例分割,其中图像中的每个对象都被单独分割。它还可以执行其他基于视觉的任务,包括姿态估计(确定对象的位置或姿势)和对象跟踪(在视频帧中跟随移动的对象)。

YOLO11 在图像中检测并分割对象

图 5. YOLO11 使检测和分割对象变得简单。(来源)

虽然阈值处理适用于简单的任务或测试早期想法,但需要速度、准确性和灵活性的应用通常最好通过计算机视觉来处理。

Link to this section关键要点#

阈值处理是图像处理中的一个关键工具,因为它在将对象与背景分离方面快速且易于使用。它在处理扫描文档、医学图像以及检查工厂中的产品缺陷方面效果很好。

然而,随着图像和视频变得越来越复杂,基本的图像处理方法(如图像阈值处理)可能会遇到困难。这时候,先进的计算机视觉模型就可以派上用场了。像 YOLO11 这样的模型可以理解并执行更多任务,同时识别多个对象,并实时运行,使其对许多应用案例非常有用。

想了解更多关于 AI 的信息吗?请查看我们的社区GitHub 仓库。浏览我们的解决方案页面,了解机器人领域的 AI农业计算机视觉。探索我们的许可选项,并立即开始构建计算机视觉应用!

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅