遇见 YOLO26: 下一代视觉 AI。
Ultralytics
指南

什么是模板匹配?快速指南

探索被称为模板匹配 (template matching) 的图像处理技术、其工作原理及其在计算机视觉历史中的意义。

ABAbirami Vina
5 min read
图像处理中模板匹配的示例

图像中往往包含许多人类可以轻松识别的细微细节。然而,对于机器来说,这项任务并非如此简单。机器将数字图像感知为像素值的网格,即使光照、角度、比例或清晰度发生轻微变化,也可能导致识别困惑。

机器的图像分析能力通常源于两个密切相关的计算机科学领域:图像处理和计算机视觉。尽管它们经常协同工作,但其核心目的却有所不同。

图像处理将图像视为原始数据。它可以增强图像,但不会尝试理解图像内容。而这正是计算机视觉的用武之地。计算机视觉是人工智能 (AI) 的一个分支,它使机器能够理解图像和视频。

基础的图像处理已经存在多年,但尖端的计算机视觉创新则更为新近。了解该领域历史的一个好方法是回顾我们过去如何使用更传统的方法来解决这些问题。

图像匹配为例。这是一项常见的视觉任务,系统需要找出特定对象或模式是否存在于更大的图像中。

如今,借助 AI 和深度学习,这项任务可以轻松且准确地完成。然而,在 2010 年代现代神经网络兴起之前,首选方法是一种称为模板匹配的简单技术。

模板匹配示例

图 1. 模板匹配示例 (来源)

模板匹配是一种图像处理技术,将一个小模板图像在较大的图像上逐像素滑动。这种类似卷积的滑动过程使算法能够找到与特定模式最匹配的位置。

在本文中,我们将探讨什么是模板匹配,以及现代改进如何使其在实际情况中变得更加可靠。让我们开始吧!

Link to this section什么是模板匹配?#

模板匹配也可以被称为经典的计算机视觉技术,这意味着它直接处理图像像素(数字图像的最小单位)。它用于在较大的图像中查找较小的模式。

此类方法通过几何、光学和数学规则来定义,而不是通过在海量数据集上训练大型模型来实现。换句话说,模板匹配系统会比较两个输入之间的亮度、颜色和其他像素信息:输入图像(较大的图像)和较小的模板图像(要查找的模式)。

作为模板示例的图像 A 和图像 B

图 2. 图像 A 和图像 B 是模板的示例。(来源)

模板匹配的主要目标是定位模板在较大场景中出现的位置,并衡量它与图像中不同区域的匹配程度。模板匹配算法通过在较大图像上滑动模板并计算每个位置的相似度分数来实现这一点。

得分较高的区域被视为最佳匹配,意味着它们与模板非常相似。由于此方法依赖于逐像素比较,因此它在对象外观不发生变化的受控环境中效果最好。

例如,模板匹配可用于质量控制中的标签验证任务。它可以轻松地将标签的模板图像与成品图像进行匹配,以检查标签是否存在。

Link to this section模板匹配的工作原理#

以下是模板匹配工作原理的逐步概述:

  • 第 1 步 - 准备图像: 该过程首先加载输入图像和模板图像,然后将两者转换为灰度图像。由于模板匹配依赖于比较像素值,因此去除颜色信息可以减少噪声并加快图像处理速度。

  • 第 2 步 - 在图像上滑动模板: 接下来,模板匹配算法在较大图像上逐像素滑动模板(从左上角开始)。这种移动中的每一步都是一次迭代,算法会从源图像中提取与模板大小相同的图像块。

  • 第 3 步 - 衡量匹配效果: 使用数学匹配方法将每个图像块与模板进行比较,从而为每个可能的位置生成相关度度量或相关值。常见方法包括平方差(测量像素强度之间的数值距离以计算总不匹配度)、归一化互相关(通过相乘像素值来确定明暗模式的对齐程度),以及相关系数(减去平均亮度以确保即使在光照略有变化时匹配仍保持准确)。

  • 第 4 步 - 识别最佳匹配: 评估所有位置后,算法会根据所使用的方法通过查找最大值或最小值来选择最佳匹配。通常会对这些结果应用阈值,以确保仅接受具有足够高置信度分数的匹配,从而过滤掉微弱或错误的检测。

  • 第 5 步 - 突出显示结果: 最后,将检测到的位置映射回原始图像。通常会在匹配区域周围绘制一个边界框,清晰地显示模板出现的位置。

Link to this section动手实践模板匹配#

虽然基于图像处理的模板匹配由于其自身缺陷,通常不会用于动态的实际计算机视觉解决方案部署中,但如果你有兴趣进行测试,Python 库(如 OpenCV)使该过程变得非常简单,并且还提供易于遵循的教程。它内置了 matchTemplate 函数,可以处理复杂的数学比较。

此外,它还支持其他函数,有助于执行简单任务,例如使用 imread 函数加载图像,以及使用 cvtColor 函数进行颜色转换以将图像转换为灰度。颜色转换是一个关键步骤,因为将图像简化为单个强度通道可以使 matchTemplate 中的数学比较快得多,并且对颜色噪声的敏感度较低。

生成相似度图后,OpenCV 还包含一个 minMaxLoc 函数来最终确定检测结果。它可用于扫描整个图以识别全局最小值和最大值及其精确坐标。根据所使用的匹配方法,minMaxLoc 让你通过查找数据中的最高相关性或最低误差值,能够立即精确定位最佳匹配的位置。

除了 OpenCV 之外,NumPy 等库对于处理图像数组和对结果应用阈值至关重要,而 Matplotlib 通常用于可视化相似度图和最终检测结果。这些工具共同提供了一个完整的环境,用于构建和调试模板匹配解决方案。

Link to this section模板匹配的实际应用#

现在我们已经更好地了解了模板匹配的工作原理,让我们仔细看看它在现实场景中的应用。

Link to this section识别传统建筑风格#

文化遗产和建筑研究中,研究人员必须分析历史建筑、寺庙和古迹的照片,以了解设计模式如何在不同区域间变化。在高级计算机视觉模型被广泛采用之前,他们使用图像匹配技术来研究这些结构。

模板匹配允许研究人员专注于特定的建筑线索,如屋顶轮廓、窗户布置或墙面图案。通过在较大图像上滑动模板或参考图像,他们可以识别重复出现的形状,并减少可能耗费数小时的手动图像分析工作。

一个有趣的例子来自一项关于印尼传统房屋的研究。研究人员制作了特征属性的小模板,并将它们与全尺寸照片进行了比较。此方法用于突出显示与模板高度匹配的图像区域,并对不同区域的建筑风格进行分类。

使用模板匹配对印度尼西亚的传统房屋进行分类

图 3. 使用模板匹配对印尼传统房屋进行分类 (来源)

Link to this section工业视觉系统中的对象检测#

工业环境可以受益于能够快速检测组件、验证组装或发现缺陷的视觉系统。在深度学习在制造业普及之前,许多团队尝试使用图像匹配方法来自动化这些任务。

简单来说,组件参考模板可用于扫描生产线上的图像,并突出显示与模板匹配的区域。当零件出现在一致的位置且光照稳定时,这种方法效果很好。

Link to this section用于肺部肿瘤检测的模板匹配#

即使尖端技术在医疗保健领域产生了影响,通过医学成像(如 CT 扫描)诊断健康问题仍然具有挑战性。传统上,放射科医生必须手动检查每个扫描切片,这是一个需要极高精度并耗费大量时间的过程。

在深度学习应用于医疗保健之前,研究人员尝试使用模板匹配来简化工作流程并协助识别异常。该技术的一个典型例子与肺部肿瘤或结节的检测有关。

在这种方法中,研究人员创建了代表肿瘤典型形状和强度的参考模板。系统随后在患者扫描图上滑动这些模板,在每个坐标处测量相似度。

使用模板匹配检测肺部肿瘤

图 4. 使用模板匹配进行肺部肿瘤检测 (来源)

Link to this section模板匹配的优缺点#

以下是使用模板匹配的一些主要好处:

  • 直观且简单:模板匹配易于理解和实现,使其成为 AI 和计算机视觉初学者的理想切入点。
  • 在受控条件下可靠:它在一致光照下的灰度图像上表现良好,当模式和背景稳定时可产生准确的结果。
  • 易于集成:使用 Python 库(如 OpenCV),模板匹配可以快速应用于实际项目,无需复杂的设置或繁重的计算。

虽然模板匹配提供了许多好处,但它也有局限性。以下是需要牢记的几个挑战:

  • 对比例和旋转敏感:模板的大小或方向的变化可能会降低准确性。
  • 光照和对比度依赖性: 模板和图像之间的光照或对比度变化可能导致错误的匹配或使模板更难检测。
  • 适应性有限:与基于 AI 的方法不同,模板匹配无法从数据中学习或随着时间推移进行改进。它在受控或重复的环境中效果最佳。

Link to this section关键要点#

计算机视觉是一个广阔的领域,涵盖了各种技术。了解传统的图像处理技术(例如模板匹配)是理解图像分析如何工作的绝佳起点。尖端的视觉 AI 创新建立在相同的核心概念之上,并解决类似的问题。

想探索更多关于 AI 的内容吗?加入我们的社区并查看我们的 GitHub 存储库。了解零售 AI制造业视觉 AI 如何推动变革。立即探索我们的许可选项以利用视觉 AI 进行构建!

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅