遇见 YOLO26: 下一代视觉 AI。
Ultralytics
指南

关于 2025 年计算机视觉你需要了解的一切

探索计算机视觉如何通过目标检测、图像分类和姿态估计等 AI 驱动的任务改变各行各业。

ABAbirami Vina
5 min read
各行业的计算机视觉应用

二十年前,机器和计算机能够看见并理解世界的想法还只是科幻小说。如今,得益于人工智能(AI)的进步,这一概念已成为现实。特别是计算机视觉(CV),作为人工智能的一个分支,使机器能够理解并分析图像和视频。无论是实时识别物体、改进安全系统,还是实现复杂任务的自动化,其潜力都在不断拓展可能性的边界。

计算机视觉正在迅速塑造技术的未来,各行各业都在探索采用其独特能力的各种途径。全球计算机视觉市场规模在 2024 年达到了 198.3 亿美元,预计在未来几年将以每年 19.8% 的速度增长。

全球计算机视觉市场规模图表

图 1。全球计算机视觉市场规模。

在本文中,我们将更深入地了解计算机视觉,涵盖它的定义、演变过程以及今天的工作原理。我们还将探讨它的一些最有趣的应用。让我们开始吧!

Link to this section什么是计算机视觉?#

计算机视觉是人工智能的一个子领域,它利用机器学习和神经网络来教导计算机理解视觉数据的内容,例如图像或视频文件。从处理后的图像中收集的见解可用于做出更好的决策。例如,计算机视觉可用于零售业,通过分析货架图像来跟踪库存水平,或通过自动化结账系统增强购物体验。许多企业已经在使用计算机视觉技术进行各种应用,范围从给智能手机照片添加滤镜等任务到制造业中的质量控制。

你可能想问:为什么对计算机视觉解决方案有如此大的需求?对于人类来说,需要持续关注的任务(例如发现缺陷或识别模式)可能很困难。眼睛会疲劳,细节可能会被遗漏,尤其是在快节奏或复杂的环境中。

虽然人类擅长识别不同尺寸、颜色、光照或角度下的物体,但他们在压力下往往难以保持一致性。相比之下,计算机视觉解决方案可以不间断地工作,快速且准确地处理大量视觉数据。例如,它可以实时分析交通状况以检测拥堵、优化信号灯时长,甚至比人类观察者更快地识别事故。

Link to this section了解计算机视觉的历史#

多年来,计算机视觉已从一个理论概念演变为推动各行业创新的可靠技术。让我们来看看定义其发展的关键里程碑:

  • 1950 年代 - 1960 年代: 研究人员开始开发处理和分析视觉数据的算法,但由于计算能力有限,进展缓慢。

  • 1970 年代: 这个十年见证了算法的重大改进,例如霍夫变换(Hough Transform),它改善了图像中线条和几何形状的检测。光学字符识别(OCR)也随之出现,使机器能够读取打印文本成为可能。

  • 1980 年代 - 1990 年代: 机器学习开始在计算机视觉中发挥作用,为更先进的功能和未来的突破铺平了道路。

  • 2000 年代 - 2010 年代: 深度学习为计算机视觉带来了新的维度,使机器能够更有效地解释视觉数据。它增强了物体识别、运动分析和复杂任务执行等能力。

如今,计算机视觉正在迅速进步,并正在改变我们在医疗保健、自动驾驶汽车和智慧城市等领域解决问题的方式。Ultralytics YOLO (You Only Look Once) 模型专为实时计算机视觉任务而设计,使各行各业能够更轻松、更准确地实施视觉 AI。随着 AI 和硬件的不断改进,这些模型正在帮助企业利用高级视觉数据分析做出更明智的决策并简化运营。

Link to this section解析计算机视觉的工作原理#

计算机视觉系统通过使用神经网络(受人脑工作方式启发的算法)来分析图像。一种被称为卷积神经网络(CNN)的特定类型,在识别图像中的边缘和形状等模式方面特别出色。

为了简化视觉数据,池化(pooling)等技术专注于图像中最重要的部分,而额外的层则处理这些信息以执行识别特征或检测物体等任务。像Ultralytics YOLO11这样专为速度和准确性而设计的先进模型,使实时图像处理成为可能。

使用 Ultralytics YOLO11 进行目标检测

图 2。使用 Ultralytics YOLO11 进行物体检测的示例。

一个典型的计算机视觉应用程序涉及多个步骤,以将原始图像转化为有用的见解。以下是四个主要阶段:

  • 图像采集:使用摄像机或传感器收集视觉数据,图像的质量取决于所使用的传感器类型。

  • 图像处理:然后通过减少噪点和突出边缘等预处理技术对收集到的数据进行增强,使其更易于分析。

  • 特征提取:挑选出重要的细节(如形状和纹理),专注于图像中最重要的部分。

  • 模式识别:使用机器学习对识别出的特征进行分析,以完成诸如检测物体、跟踪运动或识别模式等任务。

Link to this section探索计算机视觉任务#

你可能已经注意到,在谈论计算机视觉的工作原理时,我们提到了计算机视觉任务。像 Ultralytics YOLO11 这样的模型旨在支持这些任务,为现实世界的应用提供快速且准确的解决方案。从检测物体到跟踪其运动,YOLO11 都能高效处理这些任务。让我们探索它支持的一些关键计算机视觉任务及其工作原理。

Link to this section目标检测#

物体检测是一项关键的计算机视觉任务,用于识别图像中的目标物体。物体检测任务的输出是一组边界框(矩形框选图像中检测到的物体),以及类别标签(每个物体的类别或类型,例如“汽车”或“行人”)和置信度分数(一个表示模型对每次检测确定程度的数值)。例如,物体检测可用于识别并精确定位街道上的行人或交通中的车辆。

YOLO11 在图像中检测对象

图 3。正在使用 YOLO11 检测物体。

Link to this section图像分类#

图像分类的主要目标是根据输入图像的整体内容为其分配预定义的标签或类别。此任务通常涉及识别图像中的主要物体或特征。例如,图像分类可用于确定图像中包含的是猫还是狗。像 YOLO11 这样的计算机视觉模型甚至可以进行自定义训练以分类猫或狗的单个品种,如下图所示。

使用 YOLO11 对不同猫品种进行分类

图 4。使用 YOLO11 分类不同的猫品种。

Link to this section实例分割#

实例分割是另一种在各种应用中使用的关键计算机视觉任务。它涉及将图像分解为多个部分并识别每个单独的物体,即使存在多个相同类型的物体。与物体检测不同,实例分割更进一步,勾勒出每个物体的精确边界。例如,在汽车制造和维修中,实例分割可以帮助分别识别和标记每个汽车零件,使过程更加准确和高效。

使用 YOLO11 进行汽车零件分割

图 5。 使用 YOLO11 进行汽车零件分割。

Link to this section姿态估计#

姿态估计的目标是通过预测手部、头部和肘部等关键点的位置,来确定人或物体的方位和姿态。这在需要实时理解物理动作的应用场景中特别有用。人体姿态估计常用于体育分析、动物行为监测以及机器人技术等领域。

使用 YOLO11 进行人体姿态估计

图 6。 YOLO11 可以辅助进行人体姿态估计。

要探索 YOLO11 支持的其他计算机视觉任务,你可以参考官方 Ultralytics 文档。它提供了关于 YOLO11 如何处理目标跟踪和旋转边界框(OBB)物体检测等任务的详细信息。

Link to this section当今流行的计算机视觉模型#

尽管市面上有许多计算机视觉模型,但 Ultralytics YOLO 系列因其强大的性能和多功能性而脱颖而出。随着时间的推移,Ultralytics YOLO 模型不断改进,变得更快、更准确,并且能够处理更多的任务。当Ultralytics YOLOv5推出时,借助 PyTorch 等视觉 AI 框架,部署模型变得更加容易。它让更广泛的用户能够使用先进的视觉 AI,将高精度与易用性相结合。

接下来,Ultralytics YOLOv8通过增加实例分割、姿态估计和图像分类等新能力,使这些功能更进一步。同时,最新版本 YOLO11 在多个计算机视觉任务中实现了顶级性能。与 YOLOv8m 相比,参数减少了 22%,YOLO11m 在 COCO 数据集上实现了更高的平均精度均值(mAP),这意味着它可以更精确、更高效地检测物体。无论你是经验丰富的开发者还是 AI 新手,YOLO11 都能为你的计算机视觉需求提供强大的解决方案。

Link to this section计算机视觉在日常生活中的作用#

早些时候,我们讨论了像 YOLO11 这样的计算机视觉模型如何应用于广泛的行业。现在,让我们探索更多正在改变我们日常生活的用例。

Link to this section医疗保健中的视觉 AI#

医疗保健中的计算机视觉有广泛的应用。物体检测和分类等任务被用于医学影像中,以使疾病检测更快、更准确。在 X 射线分析中,计算机视觉可以识别对于人眼来说可能过于细微的模式。

它还用于癌症检测,将癌细胞与健康细胞进行比较。同样,在 CT 扫描和 MRI 方面,计算机视觉可用于以接近人类的精度分析图像。它帮助医生做出更好的决策,并最终拯救更多的生命。

YOLO11 分析医疗扫描结果

图 7。正在使用 YOLO11 分析医学扫描图。

Link to this section汽车行业的 AI#

计算机视觉对于自动驾驶汽车至关重要,帮助它们检测道路标志和交通信号灯等物体。诸如光学字符识别 (OCR)之类的技术使汽车能够读取道路标志上的文字。它还用于行人检测,即物体检测任务实时识别人员。

此外,计算机视觉甚至可以发现路面上的裂缝和坑洼,从而更好地监测不断变化的道路状况。总的来说,计算机视觉技术在改善交通管理、提高交通安全和支持智慧城市规划方面可以发挥关键作用。

使用 YOLO11 理解交通状况

图 8。 使用 YOLO11 理解交通。

Link to this section农业中的计算机视觉#

假设农民可以自动播种、浇水并按时收获庄稼,而无需担心任何事情。这正是计算机视觉为农业带来的变化。它促进了实时的作物监测,使农民能够比人类更准确地检测出诸如疾病或营养缺乏之类的问题。

除了监测之外,集成计算机视觉的 AI 驱动自动除草机可以识别并清除杂草,从而降低人工成本并提高作物产量。这种技术的结合帮助农民优化资源、提高效率并保护他们的庄稼。

在农业中使用 YOLO11

图 9。在农业中使用 YOLO11 的示例。

Link to this section用 AI 自动化制造过程#

在制造业中,计算机视觉有助于自动监控生产、检查产品质量并跟踪工人。视觉 AI使该过程更快、更准确,同时减少了错误,从而降低了成本。

具体而言,对于质量保证,物体检测和实例分割被普遍使用。缺陷检测系统对成品进行最后检查,以确保只有最好的产品才能到达客户手中。任何有凹痕或裂缝的产品都会被自动识别并拒绝。这些系统还实时跟踪和计数产品,在装配线上提供持续监控。

使用计算机视觉监控装配线

图 10。 使用计算机视觉监控装配线。

Link to this section计算机视觉让教育更具影响力#

计算机视觉在课堂上使用的方式之一是通过手势识别——它通过检测学生的动作来个性化学习。像 YOLO11 这样的模型非常适合这项任务。它们可以实时准确地识别举手或困惑表情等手势。

当检测到此类手势时,可以通过提供额外帮助或修改内容来调整正在进行的课程,以更好地适应学生的需求。这创造了一个更具活力和自适应的学习环境,帮助教师专注于教学,同时系统支持每个学生的学习体验。

Link to this section计算机视觉的最新趋势#

既然我们已经探索了计算机视觉在各行各业中的一些应用,让我们深入了解推动其进步的关键趋势。

主要的趋势之一是边缘计算,这是一种将数据处理得更接近其来源的分布式计算框架。例如,边缘计算使摄像机和传感器等设备能够直接处理视觉数据,从而带来更快的响应时间、减少延迟并提高隐私性。

计算机视觉的另一个关键趋势是合并现实(merged reality)的使用。它将物理世界与数字元素结合起来,使用计算机视觉使虚拟物体与真实世界平滑融合。它可用于改善游戏、教育和培训中的体验。

Link to this section计算机视觉的优缺点#

以下是计算机视觉可以为各行各业带来的一些主要好处:

  • 成本节约: 使用计算机视觉实现任务自动化有助于降低运营成本、提高生产率并最大限度地减少错误。

  • 可扩展性: 一旦实施,计算机视觉系统可以轻松扩展以处理大量数据,使其适用于成长型企业或大规模运营。

  • 特定于应用程序的自定义: 计算机视觉模型可以使用你的数据集进行微调,为你提供满足你的应用程序要求的、高度专业化的解决方案。

虽然这些好处突出了计算机视觉如何影响各行各业,但考虑其在实施过程中涉及的挑战也很重要。以下是一些关键挑战:

  • 数据隐私问题: 视觉数据的使用,特别是在监视或医疗保健等敏感领域,可能会引发隐私问题和安全担忧。

  • 环境限制: 在光线不足、图像质量低或背景复杂等充满挑战的环境中,计算机视觉系统可能难以正常发挥作用。

  • 高昂的初始成本: 由于需要专业的硬件、软件和专业知识,开发和实施计算机视觉系统可能会很昂贵。

Link to this section关键要点#

计算机视觉正在通过让机器像人类一样观察和理解世界,重新塑造机器与世界交互的方式。它已经应用于许多领域,例如提高自动驾驶汽车的安全性、帮助医生更快地诊断疾病、使购物更加个性化,甚至协助农民进行作物监测。

随着技术的不断进步,边缘计算和合并现实等新趋势正在开启更多的可能性。虽然存在一些挑战,如偏差和高成本,但计算机视觉有潜力在未来对许多行业产生巨大的积极影响。

想要了解更多信息,请访问我们的 GitHub 存储库 并与我们的 社区 进行交流。在我们的解决方案页面上探索自动驾驶汽车中的 AI农业中的计算机视觉 等领域的创新。🚀

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅