什么是机器视觉?了解这一人工智能学科如何实现工业自动化、质量控制和机器人技术。了解机器视觉与计算机视觉的主要区别。
机器视觉是一个能让机器自动 "看见 "和解读视觉世界的技术领域。它将摄像头、照明和软件结合起来,捕捉和分析图像,使系统能够根据视觉信息做出决策或执行任务。机器视觉主要用于工业和自动化环境,其主要目标是以比人类操作员更快的速度、更高的精度和更稳定的方式执行特定的、通常是重复性的检测和引导任务。它是推动制造、物流和机器人等行业自动化的关键组成部分。
典型的机器视觉系统由多个硬件和软件组件组成。整个过程从高速摄像机和专用照明开始,目的是捕捉物体或场景清晰、一致的图像。这一步骤被称为图像采集,是实现可靠性能的关键。捕捉到的图像随后由软件进行处理,软件使用算法分析视觉数据。传统上,这些系统依赖于基于规则的图像处理技术。不过,现代机器视觉系统越来越多地采用机器学习(ML)和深度学习(DL)技术来处理更复杂多变的任务。最后一步涉及系统做出决策,例如通过或不通过某个部件,或引导机械臂。整个工作流程通常在从工业 PC 到边缘设备等处理硬件上实时执行。
机器视觉(Machine Vision)和计算机视觉(Computer Vision,CV)这两个术语经常被互换使用,但它们的侧重点却截然不同。计算机视觉是一个更广泛的科学领域,涉及如何让计算机从数字图像或视频中获得高层次的理解。它涵盖了从面部识别到自动驾驶汽车的广泛应用。
相比之下,机器视觉通常被认为是一门工程学科,是计算机视觉的一个分支,侧重于实际应用,尤其是工业自动化领域。其应用通常针对特定任务,并在高度受控的环境中进行。计算机视觉是关于理解一般意义上的图像,而机器视觉则是关于从图像中提取特定信息以执行任务。有关两者区别的更多详情,请参阅计算机视觉与图像处理之间的比较。
机器视觉是现代工业自动化的基石。机器视觉能够执行高速、高精度的视觉任务,因此在许多领域都具有重要价值。
深度学习的整合给机器视觉带来了革命性的变化。传统系统受限于基于规则的算法,而深度学习模型,尤其是卷积神经网络(CNN),可以从海量数据中学习。这使它们能够识别缺陷和特征,其细微程度和灵活性在以前是不可能实现的。像YOLOv8和YOLO11这样的模型可以在自定义数据集上进行训练,以识别各种对象和异常情况,因此非常适合生产线上的实例分割等任务。Ultralytics HUB等平台简化了训练和部署这些高级模型的过程。PyTorch和TensorFlow等框架为构建这些复杂的系统奠定了基础,使机器视觉解决方案更加强大和智能。