利用计算机视觉释放 AI 的潜力!探索它在物体检测、医疗保健、自动驾驶汽车等领域的应用。立即了解更多!
计算机视觉(CV)是人工智能(AI)的一个变革性领域。 人工智能 (AI) 使计算机能够感知、解释和理解视觉世界。通过处理数字图像、视频和其他视觉输入 机器可以提取有意义的信息,并根据分析结果采取行动或提出建议。 分析。人类视觉依靠眼睛和大脑来即时理解周围环境,而计算机视觉则 则采用先进的软件和 机器学习 (ML)算法来复制这种能力,使系统能够自动 计算机视觉利用先进的软件和机器学习(ML)算法复制这种能力,使系统能够自动执行以前需要人眼才能完成的任务。
计算机视觉的核心是 模式识别技术来理解视觉 数据。早期的尝试包括手动编码规则来定义对象,但现代计算机视觉是由 深度学习(DL)和大量训练数据的驱动。 数据的驱动。目前最常用的架构是 卷积神经网络 (CNN),它逐个像素地处理图像。这些网络可在初始层识别边缘和纹理等低层次特征,并将其与复杂的图像识别结合起来。 这些网络在初始层中识别边缘和纹理等低层次特征,然后将它们结合起来,在更深的层中识别复杂的概念,如人脸或车辆。这一过程 需要大量标注数据集来教模型如何有效区分不同类别。 有效区分不同类别。
计算机视觉不是一个单一的动作,而是一系列解决不同问题的具体任务:
计算机视觉与数字图像处理 数字图像处理相混淆,但它们的目的是不同的。图像处理侧重于对输入图像进行处理,以提高图像质量或提取信息,而不一定要 "理解 "图像。 或提取信息,而不一定要 "理解 "图像。常见的例子包括调整亮度、 应用滤镜或降噪。与此形成鲜明对比的是 CV 侧重于图像理解,其目标是模仿人类认知来解释图像所代表的内容。
计算机视觉的应用几乎遍及所有行业,提高了效率和安全性:
开发人员可以使用 ultralytics Python 软件包。下面的示例
演示了如何加载 YOLO11 型号-的最新
最新稳定版本,建议用于所有标准使用情况,以detect 图像中的物体。
from ultralytics import YOLO
# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")
# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results to see bounding boxes and labels
results[0].show()
CV 生态系统由强大的开源库提供支持。 OpenCV是一个基础库,为实时计算机视觉提供了数千种算法。 实时计算机视觉。在构建和训练深度学习模型方面,诸如 PyTorch和 TensorFlow等框架是行业 标准。Ultralytics 在这些基础上提供了易于部署的先进模型。 展望未来,Ultralytics Ultralytics 平台提供了一个 展望未来,Ultralytics 平台将为管理从数据管理到部署的整个 Vision AI 生命周期提供全面的环境。

