什么是机器视觉? 了解这种 AI 学科如何实现工业自动化、质量控制和机器人技术。 探索它与计算机视觉的主要区别。
机器视觉是一门工程学科和技术,通过分析图像实现自动检测、过程控制和 通过分析图像实现自动检测、过程控制和机器人引导的工程技术。它就像工业自动化的 "眼睛",将光 硬件与精密软件相结合,解释视觉输入并触发物理动作。虽然它在很大程度上依赖于 计算机视觉 (CV) 尽管机器视觉依赖于计算机视觉(CV)的理论原理,但其与众不同之处在于 机器视觉与计算机视觉(CV)不同,它侧重于在结构化环境中的实际应用。这项技术是 工业 4.0 的基石,使智能工厂能够 以比人类操作员更高的速度、精度和一致性运行。
典型的机器视觉系统集成了多个关键组件,以可靠地执行特定任务。其 该过程从图像采集开始。 工业相机和专用镜头捕捉视觉 数据。最重要的是,这些系统利用工程设计的 照明技术 突出相关特征,如表面纹理或边缘,同时抑制噪音。
图像被捕获后,将由一个计算单元(通常是边缘计算设备或智能相机)进行处理。 边缘计算设备或智能相机运行先进算法 高级算法进行处理。从历史上看,这些都是基于规则的系统(例如,计算像素),但现代应用 越来越依赖于 人工智能(AI)和 深度学习(DL)。像 Ultralytics YOLO11等模型分析图像以识别模式、 detect 缺陷或测量尺寸。然后,系统会做出决定--例如接收产品或引导机械臂--并将决定传达给人工智能系统。 然后将其传递给可编程逻辑控制器 (PLC)。 可编程逻辑控制器 (PLC)。
虽然这两个术语经常互换使用,但重要的是要将机器视觉与更广泛的计算机视觉领域区分开来。 计算机视觉。计算机视觉是一个科学领域,专注于使计算机能够 "理解 "一般图像,通常处理社交媒体照片或监控录像等非结构化数据。 图像,通常处理社交媒体照片或监控录像等非结构化数据。它 包括从 图像分类到生成式人工智能。
而机器视觉则是应用这些技术来解决工业问题。 机器视觉系统通常在受控环境中运行,具有一致的照明和相机定位,以确保高可靠性。 以确保高可靠性。例如,计算机 视觉模型可能会努力识别公园里的一只狗,而机器视觉系统则是为了detect 高速移动的活塞环上的微小划痕。 活塞环上的微小划痕。
机器视觉通过自动化视觉任务,提高了众多行业的效率。
现代机器视觉通常利用最先进的神经网络来实现强大的性能。下面的示例
演示了如何使用 ultralytics Python 软件包来加载一个
YOLO11 型号 并进行推理,这是
这是在生产线上验证部件的常见步骤。
from ultralytics import YOLO
# Load a pre-trained YOLO11 model (or a custom-trained industrial model)
model = YOLO("yolo11n.pt")
# Run inference on an image of a manufactured component
# This step identifies objects and checks for defects based on training
results = model("production_part.jpg")
# Display the results to visualize detections and confidence scores
results[0].show()
这一简单的工作流程是复杂系统的基础,在复杂系统中 实时推理决定快速生产线上产品的即时 实时推理决定快速生产线上产品的即时命运,最大限度地减少推理延迟,以跟上生产进度。 推理延迟,以跟上生产 速度。