目标检测
探索目标检测的强大功能——使用 YOLO 等尖端模型识别和定位图像或视频中的目标。探索实际应用!
目标检测是计算机视觉 (CV)中的一项基本任务,涉及识别和定位图像或视频中的一个或多个物体。其目标不仅是对物体进行分类,还要确定它们的位置,通常通过在每个物体周围绘制一个边界框来实现。这项技术是许多先进的人工智能 (AI)应用的基础,使机器能够高度理解地感知和解释其物理环境。
目标检测的工作原理
目标检测模型通常使用深度学习 (DL) 构建,特别是卷积神经网络 (CNN)。该过程包括将图像输入到网络中,然后网络输出检测到的物体列表,每个物体都有一个类别标签(例如,“人”、“汽车”、“狗”)、一个置信度分数及其边界框的坐标。
现代目标检测架构由两个主要部分组成:一个主干网络 (backbone),用于从输入图像中提取特征;一个检测头 (detection head),用于预测边界框和类别。 这些架构通常分为单阶段检测器或两阶段检测器。
目标检测与其它 CV 任务对比
区分目标检测与其他相关的计算机视觉任务非常重要:
- 图像分类: 为整个图像分配一个标签(例如,“这是一张猫的照片”)。它不定位物体。
- 图像分割: 对图像中的每个像素进行分类,从而提供物体的精确轮廓。实例分割区分同一对象类的不同实例,而 语义分割将一个类的所有实例视为一个实体。
- 目标跟踪: 目标检测的扩展,它跟踪视频中多个帧中的特定对象,从而随着时间的推移保持其身份。 您可以在我们的视频中跟踪移动对象指南中了解更多信息。
实际应用
目标检测是一项变革性技术,已应用于许多行业。
- 自动驾驶汽车: 在自动驾驶汽车中,物体检测对于识别行人、骑自行车的人、其他车辆和交通信号以安全导航至关重要。像 Waymo 和 Tesla 这样的公司已经大力投资于这项技术,以支持他们的自主系统。
- 制造业中的人工智能: 在装配线上,检测模型会自动发现缺陷或验证组件是否正确组装。这提高了质量控制并提高了生产效率。
- 安全与监控: 自动化系统使用目标检测技术来实时识别未经授权的人员、遗弃的包裹或异常活动,详情请参阅我们构建安全警报系统的指南。
- 医疗保健中的人工智能: 在医学图像分析中,模型通过检测和突出显示X射线和CT扫描中的肿瘤或骨折等异常情况来协助放射科医生。您可以在我们的博客中阅读有关使用YOLO11进行肿瘤检测的文章。
- 农业中的人工智能: 配备目标检测功能的无人机和地面机器人可以高精度地监测作物健康状况、识别害虫并估算产量。
工具与训练
开发和部署目标检测模型涉及丰富的工具和技术生态系统。