遇见 YOLO26: 下一代视觉 AI。
Ultralytics
指南

了解图像处理中的边缘检测

图像处理中的边缘检测。学习 Sobel、Canny 和其他边缘检测算法,以准确检测边缘并实现稳健的边缘识别。

ABAbirami Vina
5 min read
图像处理中的边缘检测

作为人类,我们在观察图像时会自然地识别物体的边缘,追踪它们的曲线,并注意到它们表面的纹理。然而对于计算机而言,理解是从单个像素的层面开始的。

像素是数字图像的最小单位,它存储了单个点的颜色和亮度。通过追踪图像中这些像素值的变化,计算机可以检测出揭示关键细节的模式。

特别是图像处理利用像素数据来强调关键特征并去除干扰。边缘检测是一种常见的图像处理技术,它通过识别亮度或颜色急剧变化的点来勾勒物体、标记边界并增加结构。

这使得计算机能够分割形状、测量尺寸并解释场景各部分之间的联系。边缘检测通常是高级图像分析的第一步。

原始图像以及各种边缘检测方法的输出

图 1. 显示原始图像与不同边缘检测方法输出的示例。(来源)

在本文中,我们将深入了解什么是边缘检测、它是如何工作的,以及它的实际应用。让我们开始吧!

Link to this section边缘检测概念#

边缘检测专注于寻找图像中亮度或颜色从一点到另一点出现显著变化的位置。如果变化很小,该区域看起来是平滑的。如果变化剧烈,它通常标志着两个不同区域之间的边界。

以下是这些像素变化发生的部分原因:

  • 表面法线不连续性:当两个表面以一定角度相遇时,如墙角或盒子边缘,这种方向上的急剧变化会在图像中产生清晰的边界。
  • 深度不连续性:它们出现在物体与摄像机距离不同的地方,产生可见的分离,帮助系统区分它们。
  • 表面颜色或纹理变化:当一个区域与相邻区域具有不同的颜色或纹理时,就会发生这种情况,从而产生可见的分离。
  • 照明变化:它源于光照变化,包括表面上的阴影或高光,即使表面本身是平滑或连续的,也会产生可见的分离。

图像中不同类型的边缘不连续性

图 2. 图像中不同类型的边缘不连续性。(来源)

Link to this section边缘检测识别是如何工作的#

边缘检测通常从将彩色图像转为灰度图像开始,因此每个点仅显示亮度。这使得算法更容易专注于明暗差异而非颜色。

接下来,特殊滤波器可以扫描图像以找到亮度突然变化的地方。这些滤波器计算亮度变化的陡峭程度,即梯度。更高的梯度是由邻近点之间的更大差异引起的,这通常预示着边缘。

然后算法继续优化图像,去除细小细节,只保留最重要的线条和形状。结果是一个清晰的轮廓和输出图像,可用于进一步分析。

Link to this section边缘检测与图像处理的演变#

在更详细地探讨边缘检测之前,让我们讨论一下它随着时间的发展历程。

图像处理始于简单的基于规则的方法,如阈值处理和滤波,以清理和改善图片。在模拟时代,这意味着利用光学滤镜、放大镜或化学处理来处理照片或胶片,以呈现细节。

诸如对比度调整、降噪、调整图像强度和基本边缘检测等技术,帮助使输入图像更清晰,并突显形状和纹理。在 20 世纪 60 年代和 70 年代,从模拟处理向数字处理的转变,为天文学、医学成像和卫星监测等领域的现代分析铺平了道路。

到了 20 世纪 80 年代和 90 年代,更快的计算机使得处理诸如特征提取、形状检测和基本物体识别等更复杂的任务成为可能。诸如 Sobel 算子和 Canny 等算法提供了更精确的边缘检测,而模式识别在从工业自动化到通过光学字符识别读取印刷文本的各个领域找到了应用。

Link to this section21 世纪的边缘检测与计算机视觉#

如今,技术的持续进步推动了计算机视觉的发展。视觉 AI 或计算机视觉,是 AI 的一个分支,专注于教机器解释和理解视觉信息。

虽然传统的图像处理(如双阈值处理,通过保留强边缘并去除弱边缘来使图像更清晰)和边缘检测遵循固定规则且只能处理特定任务,但计算机视觉使用数据驱动的模型,能够从示例中学习并适应新情况。

如今,成像系统远远超出了单纯的图像增强或边缘检测。它们能够识别物体、追踪运动并理解整个场景的语境。

实现这一目标的关键技术之一是卷积。卷积运算是一个过程,其中小滤波器(也称为核)扫描图像以找到重要的模式,如边缘、角落和纹理。这些模式成为计算机视觉模型用于识别和理解物体的构建块。

例如,像Ultralytics YOLO11这样的计算机视觉模型利用这些基于卷积的特征来执行高级任务,例如实例分割。这与边缘检测密切相关,因为实例分割需要准确勾勒出图像中每个物体的边界。

虽然边缘检测专注于在边缘像素处寻找强度变化以标记物体边缘,但实例分割在此基础上更进一步,能够检测边缘、分类并将每个物体分离到其自身的区域中。

使用 YOLO11 和实例分割的概览

图 3. 使用 YOLO11 和实例分割的概览。(来源)

Link to this section边缘检测算法与方法#

尽管计算机视觉有所发展,但图像处理仍然是许多应用的重要组成部分。这是因为计算机视觉通常建立在基本的图像预处理步骤之上。

在检测物体或理解场景之前,系统通常会清理图像、减少噪声并寻找边缘,以使关键细节突显出来。这些步骤使高级模型更加准确和高效。

接下来,让我们探讨一些用于检测边缘的最常见图像处理算法以及它们的工作原理。

Link to this sectionSobel 边缘检测#

Sobel 边缘检测是用于寻找图像中物体轮廓的关键方法。它不是一次分析所有细节,而是专注于亮度从一个像素到相邻像素剧烈变化的地方。

这些突然的偏移通常标志着一个物体结束、另一个物体开始的位置,或者物体与背景相遇的地方。通过隔离这些边缘,Sobel 将复杂的图像转换为更简洁的轮廓,便于其他系统处理,用于追踪运动、检测形状或识别物体等任务。

你可以将 Sobel 边缘检测视为测量图像中强度如何变化的梯度检测器。其核心在于通过卷积运算来实现:在图像上滑动被称为核的小矩阵,并计算邻近像素值的加权和。

这些核被设计用于强调水平和垂直方向上的亮度变化。与从数据中学习核的深度学习模型不同,Sobel 使用固定核来高效地突出边缘,而无需训练。

以下是关于 Sobel 边缘检测方法如何工作的详细说明:

  • 使用两个 3×3 滤波器: 该方法使用两个微小的 3×3 网格,称为滤波器。可以把它们想象成在图像上沿水平(x 方向)和垂直(y 方向)移动的模板。一个网格旨在寻找水平边缘,另一个用于垂直边缘。
  • 计算梯度: 每个滤波器查找亮度变化的速度以及梯度方向。巨大的变化意味着可能是边缘。
  • 结合结果: 水平和垂直结果被结合起来,以确定每个像素处的整体边缘强度和方向。
  • 检测边缘: 具有高梯度幅值的像素被标记为强边缘。
  • 勾勒边界: 这些边缘有助于定义物体形状并分离图像中的不同区域。

突出显示输入图像主要轮廓的 Sobel 边缘检测

图 4. Sobel 边缘检测可以突出显示输入图像的主要轮廓并生成边缘图。(来源)

Link to this sectionCanny 边缘检测#

Canny 边缘检测是寻找图像边缘的另一种流行方法。它以产生简洁且精确的轮廓而闻名。与基本边缘检测技术不同,它遵循一系列精心设计的步骤来过滤噪声、锐化边界并聚焦于最重要的边缘。

以下是 Canny 边缘检测器工作原理的快速概述:

  • 平滑图像: 图像首先用高斯滤波器进行模糊处理,这是一种减少噪声和可能被误认为是边缘的细小细节的平滑技术。
  • 检测亮度变化: 然后算法扫描亮度的突然变化,使用梯度计算来测量这些变化的强度和方向。
  • 细化边缘: 仅保留每条检测到的线上的最强点,而较弱的点被去除,从而产生清脆、简洁的边缘。
  • 分类边缘: 每个像素根据亮度变化的阈值被标记为强边缘、弱边缘或非边缘。
  • 最终清理: 保留连接到强边缘的弱边缘;所有其他边缘都被丢弃,只留下清晰、相连的边界。

原始图像及其使用 Canny 边缘检测器后的输出

图 5. 使用 Canny 边缘检测器后的原始图像及其相应的输出图像。(来源)

因为它在过滤掉噪声的同时提供准确的结果,Canny 边缘检测被广泛应用于对精度有要求的领域。例如,它用于医学成像、卫星测绘、文档扫描和机器人视觉等行业。

Link to this section基于梯度 vs. 基于高斯的边缘检测#

到目前为止,我们查看的两个边缘检测示例是 Sobel 和 Canny。虽然它们都旨在寻找边缘,但它们解决问题的方法不同。

基于梯度的方法(如 Sobel、Prewitt 和 Scharr)通过寻找亮度上的剧烈变化(即梯度)来检测边缘。它们扫描图像并标记这种变化最强的地方。这些方法简单、快速,并且在图像清晰时效果很好。然而,它们对噪声敏感——亮度的微小变化可能被误认为是边缘。

基于高斯的方法(如 Canny 或高斯拉普拉斯)增加了一个额外步骤来处理此问题:先模糊图像。这种平滑(通常使用高斯滤波器完成)减少了可能产生假边缘的微小变化。平滑后,这些方法仍然寻找剧烈的亮度变化,但对于噪声大或低质量的图像,结果更清晰、更准确。

基于梯度的边缘检测与基于高斯的边缘检测对比

图 6. 基于梯度 vs. 基于高斯的边缘检测。图片由作者提供。

Link to this section边缘检测的实际应用#

在更好地理解了边缘检测的工作原理后,让我们探讨它在实际场景中是如何应用的。

Link to this section使用边缘检测识别裂缝#

检查桥梁和高层建筑等大型混凝土结构通常是一项充满挑战且危险的任务。这些结构跨度长或高度高,使得传统检查缓慢、昂贵且有风险。这些检查通常还需要脚手架、绳索作业、手动近距离测量或摄影。

2019 年探索了一种有趣的方法,研究人员测试了一种更安全、更快速的方法,利用配备高分辨率摄像头的无人机来捕获混凝土表面的详细输入图像。然后,这些图像通过各种边缘检测技术进行处理,以自动识别裂缝。

该研究表明,这种方法显著减少了对危险区域直接人工访问的需求,并加快了检查速度。然而,其准确性仍然取决于光照条件、图像清晰度和无人机操作稳定性等因素。在某些情况下,仍需要人工审查以消除误报。

Link to this section在医学成像中应用边缘检测#

X 光片和核磁共振图像通常包含称为噪声的视觉干扰,这会使精细细节难以辨认。当医生试图发现肿瘤边缘、追踪器官轮廓或监测随时间变化的细微差异时,这成了一个挑战。

最近一项医学成像研究测试了常见的边缘检测方法(如 Sobel、Canny、Prewitt 和 Laplacian)处理噪声图像的能力。研究人员在图像中添加了不同类型和级别的噪声,并检查了每种方法勾勒关键特征的准确程度。

即使噪声很重,Canny 通常也能产生最干净的边缘,但它并非在所有情况下都是最好的。有些方法在某些噪声模式下效果更好,因此没有一种完美的万能解决方案。

随着噪声增加,Canny 提供的边缘比 Sobel 更清晰

图 7. 随着噪声增加,Canny (d–f) 提供的边缘比 Sobel (g–i) 更清晰。(来源)

这凸显了为什么像计算机视觉这样的技术如此重要。通过结合高级算法和视觉 AI 模型,此类解决方案可以超越基础的边缘检测,即使在极具挑战性的条件下也能提供更准确、更可靠的结果。

Link to this section边缘检测的优点#

以下是使用边缘检测和图像处理的一些好处:

  • 更好的数据压缩: 边缘检测允许仅使用关键特征来表示图像,在保留必要信息的同时减小文件大小。这使得存储和传输更加高效。
  • 更精确的物体定位: 通过准确识别物体边界,边缘检测提高了系统定位和跟踪物体的能力,有利于机器人 AI 和自动驾驶车辆等应用。
  • 多尺度特征检测: 边缘检测技术可以分析不同尺度的图像,同时捕捉微小细节和较大形状。这种灵活性在从纹理分析到场景理解的各种任务中都很有用。

Link to this section使用图像处理进行边缘检测的局限性#

虽然边缘检测在图像处理中有许多好处,但它也伴随着一些挑战。以下是需要考虑的一些主要局限性:

  • 复杂纹理问题: 在具有复杂或重复图案的图像中,边缘检测通常会产生许多错误或无关的边缘,这使后续分析变得复杂并降低了可靠性。
  • 对光照敏感: 亮度、阴影和反射的变化可能导致边缘检测器误将光照变化解释为物体边界,从而导致结果不一致。
  • 无物体识别: 虽然边缘突显了物体开始和结束的地方,但它们并不展示物体是什么。需要额外的处理来为检测到的边缘分配含义或标签。

Link to this section何时可以使用计算机视觉进行边缘检测#

边缘检测受到我们眼睛和大脑协同工作以感知世界的方式的启发。就人类视觉而言,视觉皮层中的专用神经元对边缘、线条和边界高度敏感。

这些视觉线索帮助我们快速确定一个物体在哪里结束、另一个在哪里开始。这就是为什么即使是简单的线条画也能被瞬间识别的原因——我们的大脑严重依赖边缘来识别形状和物体。

计算机视觉旨在模仿这种能力,但更进一步。像 Ultralytics YOLO11 这样的模型超越了基本的边缘突出显示和图像增强。它们可以检测物体、精确勾勒轮廓并实时跟踪运动。这种更深层次的理解使它们在仅靠边缘检测不足的场景中变得必不可少。

Link to this section使用 Ultralytics YOLO11 更准确地检测边缘#

以下是一些由 YOLO11 支持的、建立在边缘检测之上并超越边缘检测的关键计算机视觉任务

  • 物体检测:它通过在图像或视频中的每个物体周围绘制边界框来识别和定位多个物体,清晰呈现出当前存在的内容以及每个物体的位置。
  • 实例分割:这涉及将物体细分到像素级别,即使在物体重叠或形状不规则时,也能产生简洁、精确的轮廓。
  • 姿态估计:此任务的目标是确定物体或人员的位置、方向或姿态,有助于监测运动或检测随时间发生的结构变化。
  • 目标跟踪:此任务会在视频帧中跟随目标移动,确保在长期的观察中保持一致的身份识别。
  • 图像分类:根据视觉特征为物体或整幅图像分配标签,从而更轻松地组织和解读大型数据集。

Link to this section利用计算机视觉检测基础设施中的边缘#

计算机视觉增强传统边缘检测应用的一个很好的例子是基础设施和工业资产的裂缝检测。像 YOLO11 这样的计算机视觉模型经过训练后,可以准确识别道路、桥梁和管道上的裂缝。同样的技术也适用于飞机维护、建筑检查和制造质量控制,有助于加快检查速度并提高安全性。

使用 YOLO11 进行裂缝分割的示例

图 8. 使用 YOLO11 进行裂缝分割的示例。(来源)

Link to this section关键要点#

边缘检测已经取得了长足的进步,从早期的简单方法发展到能够发现复杂图像中细微边界的高级技术。它有助于显现重要细节、突出关键区域并为深入分析准备图像,使其成为图像处理的核心部分。

在计算机视觉中,边缘检测在定义形状、分离物体和提取有用信息方面发挥着重要作用。它被广泛应用于医学影像、工业检测、自动驾驶和安防等多个领域,以提供准确可靠的视觉理解。

加入我们的社区并探索我们的 GitHub 仓库以了解更多关于 AI 的信息。如果你想开始自己的视觉 AI 项目,请查看我们的许可选项。通过访问我们的解决方案页面,了解更多关于医疗保健中的 AI零售业中的视觉 AI 等应用。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅