遇见 YOLO26: 下一代视觉 AI。
Ultralytics
Ultralytics YOLO

目标检测和 Ultralytics YOLO 模型的演变

加入我们,回顾目标检测的演变。我们将重点关注 YOLO(You Only Look Once)模型在过去几年中是如何发展的。

ABAbirami Vina
4 min read
目标检测和 YOLO 模型的演变

计算机视觉是人工智能 (AI) 的一个子领域,专注于教导机器观察和理解图像及视频,就像人类感知现实世界一样。虽然识别物体识别动作对人类来说是第二天性,但这些任务对于机器而言,需要特定的、专门的计算机视觉技术。例如,计算机视觉中的一个关键任务是物体检测,它涉及在图像或视频中识别并定位物体。

Since the 1960s, researchers have been working on improving how computers can detect objects. Early methods, like template matching, involved sliding a predefined template across an image to find matches. While innovative, these approaches struggled with changes in object size, orientation, and lighting. Today, we have advanced models like Ultralytics YOLO11 that can detect even small and partially hidden objects, known as occluded objects, with impressive accuracy.

随着计算机视觉的不断演进,回顾这些技术的发展历程非常重要。在本文中,我们将探讨物体检测的演变,并聚焦于 YOLO (You Only Look Once) 模型的转型。让我们开始吧!

Link to this section计算机视觉的起源#

在深入探讨物体检测之前,让我们先看看计算机视觉是如何起步的。计算机视觉的起源可以追溯到 20 世纪 50 年代末和 60 年代初,当时科学家们开始探索大脑处理视觉信息的方式。在对进行的实验中,研究人员 David Hubel 和 Torsten Wiesel 发现大脑会对边缘和线条等简单图案做出反应。这构成了特征提取背后的理念基础——即视觉系统在处理更复杂的图案之前,会先检测并识别图像中的基本特征(如边缘)的概念。

启发了计算机视觉中特征提取的猫脑实验

图 1. 了解猫脑如何对光条做出反应,有助于开发计算机视觉中的特征提取技术。

大约在同一时期,能够将物理图像转化为数字格式的新技术出现,引发了人们对机器如何处理视觉信息的兴趣。1966 年,麻省理工学院 (MIT) 的夏季视觉项目将研究推向了深入。虽然该项目并未完全成功,但其目标是创建一个能够将图像中的前景与背景分离的系统。对于视觉 AI 社区中的许多人来说,该项目标志着计算机视觉作为一门科学领域的正式开端。

Link to this section了解物体检测的历史#

随着 20 世纪 90 年代末和 21 世纪初计算机视觉的进步,物体检测方法从模板匹配等基础技术转向了更先进的方法。一种流行的方法是 Haar Cascade,它被广泛用于人脸检测等任务。它的工作原理是使用滑动窗口扫描图像,检查图像每个部分中边缘或纹理等特定特征,然后组合这些特征来检测物体,如人脸。Haar Cascade 比以前的方法快得多。

使用Haar Cascade进行人脸检测

图 2. 使用 Haar Cascade 进行人脸检测。

除了这些方法之外,定向梯度直方图 (HOG) 和支持向量机 (SVM) 等方法也被引入。HOG 使用滑动窗口技术来分析图像小部分中光影的变化,从而有助于根据物体的形状识别物体。随后,SVM 对这些特征进行分类以确定物体的身份。这些方法虽然提高了准确性,但在现实环境中表现依然吃力,且与当今的技术相比速度较慢。

Link to this section对实时物体检测的需求#

2010 年代,深度学习卷积神经网络 (CNN) 的兴起带来了物体检测的重大转变。CNN 使计算机能够从海量数据中自动学习重要特征,从而使检测变得更加准确。

早期的模型如 R-CNN (区域卷积神经网络)精度上有了很大提高,有助于比旧方法更准确地识别物体。

然而,这些模型处理速度较慢,因为它们分多个阶段处理图像,这使得它们在自动驾驶汽车视频监控等实时应用领域中变得不切实际。

为了提高速度,人们开发了效率更高的模型。Fast R-CNN 和 Faster R-CNN 等模型通过优化感兴趣区域的选择方式,并减少检测所需的步骤数,从而提供了帮助。虽然这加快了物体检测的速度,但对于许多需要即时结果的现实应用来说,速度仍然不够快。对实时检测日益增长的需求推动了更快速、更高效解决方案的开发,这些方案能够在速度和准确性之间取得平衡。

比较R-CNN、Fast R-CNN和Faster R-CNN的速度

图 3. 比较 R-CNN、Fast R-CNN 和 Faster R-CNN 的速度。

Link to this sectionYOLO (You Only Look Once) 模型:一个重要的里程碑#

YOLO 是一种物体检测模型,它实现了图像和视频中多个物体的实时检测,从而重新定义了计算机视觉,这使得它与以前的检测方法截然不同。YOLO 的架构不是单独分析每个检测到的物体,而是将物体检测视为一项单一任务,利用 CNN 一次性预测物体的位置和类别。

该模型的工作原理是将图像划分为网格,每个部分负责检测其所在区域内的对象。它会对每个部分进行多次预测,并过滤掉置信度较低的结果,只保留准确的预测结果。

YOLO工作原理概览

图 4. YOLO 工作原理概述。

将 YOLO 引入计算机视觉应用,使得物体检测比早期模型更快、更高效。由于其速度和准确性,YOLO 迅速成为制造业、医疗保健和机器人等行业实时解决方案的热门选择。

另一个值得注意的重要点是,由于 YOLO 是开源的,开发人员和研究人员能够不断改进它,从而产生了更先进的版本。

Link to this section从 YOLO 到 YOLO11 的历程#

YOLO 模型随着时间的推移不断稳步改进,并在此基础上不断发展。除了性能提升外,这些改进还使得不同技术水平的用户更容易使用这些模型。

例如,当 Ultralytics YOLOv5 推出时,部署模型通过 PyTorch 变得更加简单,使更广泛的用户能够使用先进的 AI。它兼顾了准确性和易用性,使更多的人无需成为编程专家就能实现物体检测。

YOLO模型的演变

图 5. YOLO 模型的演进。

Ultralytics YOLOv8 通过增加对实例分割等任务的支持并使模型更加灵活,延续了这一进程。现在,将 YOLO 用于基础和更复杂的应用变得更加容易,使其在各种场景中都很有用。

凭借最新的模型 Ultralytics YOLO11,我们进行了进一步的优化。通过减少参数的同时提高准确性,它现在在实时任务中更加高效。无论你是经验丰富的开发人员还是刚接触 AI,YOLO11 都提供了一种易于使用且先进的物体检测方法。

Link to this section了解 YOLO11:新功能与改进#

在 Ultralytics 年度混合活动 YOLO Vision 2024 (YV24) 上发布的 YOLO11,支持与 YOLOv8 相同的计算机视觉任务,如物体检测、实例分割、图像分类和姿态估计。因此,用户可以轻松切换到这个新模型,而无需调整工作流程。此外,YOLO11 的升级架构使预测更加精确。实际上,与 YOLOv8m 相比,YOLO11m 在 COCO 数据集上以少了 22% 的参数实现了更高的平均精度均值 (mAP)。

YOLO11 还旨在实现跨一系列平台的高效运行,从智能手机和其他边缘设备到功能更强大的云系统。这种灵活性确保了跨不同硬件设置的实时应用都能获得流畅的性能。最重要的是,YOLO11 更快、更高效,从而降低了计算成本并加快了推理时间。无论你是使用 Ultralytics Python 软件包还是无代码的 Ultralytics HUB,都能轻松将 YOLO11 集成到你现有的工作流程中。

Link to this sectionYOLO 模型与物体检测的未来#

先进的物体检测对实时应用和边缘 AI 的影响已经在各行各业显现。随着石油和天然气、医疗保健和零售等行业越来越依赖 AI,对快速、精确的物体检测的需求持续增长。YOLO11 旨在通过实现即使在计算能力有限的设备上也能进行高性能检测来响应这一需求。

随着边缘 AI 的发展,像 YOLO11 这样的物体检测模型很可能会在对速度和准确性要求极高的环境中,变得对实时决策至关重要。随着设计和适应性的不断改进,物体检测的未来看起来将带来更多跨各种应用的创新。

Link to this section关键要点#

物体检测已经走过了漫长的道路,从简单的方法演变为我们今天所见的先进深度学习技术。YOLO 模型一直是这一进步的核心,在不同行业中提供了更快、更准确的实时检测。YOLO11 继承了这一传统,提高了效率、降低了计算成本并增强了准确性,使其成为各种实时应用的可靠选择。随着 AI 和计算机视觉的持续进步,物体检测的未来一片光明,在速度、精度和适应性方面仍有进一步提升的空间。

对 AI 感兴趣吗?加入我们的社区保持学习!查看我们的 GitHub 仓库,探索我们如何利用 AI 在制造业医疗保健等行业创造创新解决方案。🚀

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅