词汇表

计算机视觉 (CV)

利用计算机视觉释放 AI 的潜力！探索它在物体检测、医疗保健、自动驾驶汽车等领域的应用。立即了解更多！

计算机视觉（CV）是人工智能（AI）的一个变革性领域。人工智能 (AI) 使计算机能够感知、解释和理解视觉世界。通过处理数字图像、视频和其他视觉输入机器可以提取有意义的信息，并根据分析结果采取行动或提出建议。分析。人类视觉依靠眼睛和大脑来即时理解周围环境，而计算机视觉则则采用先进的软件和机器学习 (ML)算法来复制这种能力，使系统能够自动计算机视觉利用先进的软件和机器学习（ML）算法复制这种能力，使系统能够自动执行以前需要人眼才能完成的任务。

计算机视觉的工作原理

计算机视觉的核心是模式识别技术来理解视觉数据。早期的尝试包括手动编码规则来定义对象，但现代计算机视觉是由深度学习（DL）和大量训练数据的驱动。数据的驱动。目前最常用的架构是卷积神经网络 (CNN)，它逐个像素地处理图像。这些网络可在初始层识别边缘和纹理等低层次特征，并将其与复杂的图像识别结合起来。这些网络在初始层中识别边缘和纹理等低层次特征，然后将它们结合起来，在更深的层中识别复杂的概念，如人脸或车辆。这一过程需要大量标注数据集来教模型如何有效区分不同类别。有效区分不同类别。

计算机视觉的核心任务

计算机视觉不是一个单一的动作，而是一系列解决不同问题的具体任务：

物体检测：这项任务包括识别和定位图像或视频流中的物体。它绘制在检测到的物体周围画出边界框，并为其分配一个类标签，如 "人 "或 "自行车"。类标签，如 "人 "或 "自行车"。
图像分类：该系统会分析整幅图像，并根据图像的主要内容为其指定一个标签。例如将照片分类为 "风景 "或 "肖像"。
实例分割：比检测更深入，它能精确地识别每个对象的完美像素轮廓，将同一类别的单个实例从背景中分离出来。从背景中分离出来。
姿势估计：这种技术可检测人物身上的特定关键点，如人体上的关节，以实时track 运动和姿势。

计算机视觉与图像处理

计算机视觉与数字图像处理数字图像处理相混淆，但它们的目的是不同的。图像处理侧重于对输入图像进行处理，以提高图像质量或提取信息，而不一定要 "理解 "图像。或提取信息，而不一定要 "理解 "图像。常见的例子包括调整亮度、应用滤镜或降噪。与此形成鲜明对比的是 CV 侧重于图像理解，其目标是模仿人类认知来解释图像所代表的内容。

实际应用

计算机视觉的应用几乎遍及所有行业，提高了效率和安全性：

医疗诊断： 医疗专业人员使用 CV 分析 X 射线、核磁共振成像和 CT 扫描。算法可以detect 异常情况，如肿瘤高精度，通常可帮助医生进行早期诊断。
智慧农业：农民利用无人机图像和 CV 模型监测作物健康状况、detect 害虫并自动收割。系统包括实时作物监测等系统有助于优化产量，减少资源浪费。
自动驾驶汽车： 自动驾驶汽车在很大程度上依赖 CV 来导航道路。它们处理来自多个摄像头的输入，以执行交通标志检测、行人跟踪和车道保持。
生产质量控制： 装配线上的自动检测系统能比人工检测人员更快、更准确地识别产品缺陷更准确地识别出产品中的缺陷，确保始终如一的质量控制。

使用YOLO11实现计算机视觉

开发人员可以使用 ultralytics Python 软件包。下面的示例演示了如何加载 YOLO11 型号-的最新最新稳定版本，建议用于所有标准使用情况，以detect 图像中的物体。

from ultralytics import YOLO

# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")

# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results to see bounding boxes and labels
results[0].show()

关键工具和库

CV 生态系统由强大的开源库提供支持。 OpenCV是一个基础库，为实时计算机视觉提供了数千种算法。实时计算机视觉。在构建和训练深度学习模型方面，诸如 PyTorch和 TensorFlow等框架是行业标准。Ultralytics 在这些基础上提供了易于部署的先进模型。展望未来，Ultralytics Ultralytics 平台提供了一个展望未来，Ultralytics 平台将为管理从数据管理到部署的整个 Vision AI 生命周期提供全面的环境。

计算机视觉 (CV)

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

计算机视觉的工作原理

计算机视觉的核心任务

计算机视觉与图像处理

实际应用

使用YOLO11实现计算机视觉

关键工具和库

阅读更多此类别的内容

理解为何人机协同标注至关重要

什么是数据集蒸馏？快速概述

Oakley Meta AI眼镜正以视觉人工智能技术重新定义眼镜行业

加入Ultralytics 社区