什么是机器视觉? 了解这种 AI 学科如何实现工业自动化、质量控制和机器人技术。 探索它与计算机视觉的主要区别。
机器视觉是一种使机器能够自动“看到”和解释视觉世界的技术领域。它结合了摄像头、照明和软件来捕获和分析图像,从而使系统能够根据该视觉信息做出决策或执行任务。机器视觉主要用于工业和自动化环境,其主要目标是以比人类操作员更高的速度、准确性和一致性来执行特定的、通常是重复性的检查和指导任务。它是推动制造业、物流和机器人等领域自动化的关键组成部分。
典型的机器视觉系统集成了多个硬件和软件组件才能发挥作用。该过程从高速相机和专用照明开始,旨在捕获清晰、一致的物体或场景图像。此步骤称为图像采集,对于可靠的性能至关重要。然后,捕获的图像由软件处理,该软件使用算法来分析视觉数据。传统上,这些系统依赖于基于规则的图像处理技术。然而,现代机器视觉系统越来越多地采用机器学习 (ML)和深度学习 (DL)来处理更复杂和可变的任务。最后一步涉及系统做出决策(例如,通过或未通过零件)或引导机器人手臂。整个工作流程通常在从工业 PC 到边缘设备的处理硬件上实时执行。
虽然术语机器视觉和计算机视觉 (CV)经常互换使用,但它们有不同的侧重点。计算机视觉是一个更广泛的科学领域,关注如何使计算机能够从数字图像或视频中获得高层次的理解。它涵盖了广泛的应用,从面部识别到自动驾驶汽车。
相比之下,机器视觉通常被认为是工程学科,是计算机视觉的一个子集,专注于实际应用,尤其是在工业自动化中。它的应用通常是特定于任务的,并且在高度受控的环境中执行。计算机视觉是关于从广义上理解图像,而机器视觉是关于从图像中提取特定信息以执行任务。有关差异的更多详细信息,您可以浏览此计算机视觉与图像处理之间的比较。
机器视觉是现代工业自动化的基石。它执行高速、高精度视觉任务的能力使其在许多领域都具有重要价值。
深度学习的集成彻底改变了机器视觉。虽然传统系统受到基于规则的算法的限制,但深度学习模型,特别是卷积神经网络 (CNN),可以从大量数据中学习。这使它们能够识别缺陷和特征,其细微之处和灵活性是以前不可能实现的。像 YOLOv8 和 YOLO11 这样的模型可以在自定义数据集上进行训练,以识别各种各样的对象和异常,这使得它们非常适合在生产线上进行实例分割等任务。像 Ultralytics HUB 这样的平台简化了训练和部署这些高级模型的过程。诸如 PyTorch 和 TensorFlow 之类的框架为构建这些复杂的系统提供了基础,从而实现了更强大和智能的机器视觉解决方案。