深圳尤洛视觉
深圳
立即加入

SharkEye使用Ultralytics YOLOv8进行对象检测

Abirami Vina

5 分钟阅读

2025年1月28日

了解在 YOLO Vision 2024 上展示的 SharkEye 如何利用 Ultralytics YOLOv8 进行实时目标检测和海滩安全。

监测动物在其自然栖息地中的行为(无论是农场里吃草的牛还是在海岸附近移动的鲨鱼)对于它们的**安全和福祉**一直非常重要。 然而,手动观察它们并非易事。 这通常需要数小时的耐心和专注,因为观察员必须密切关注行为或运动的任何变化。 即使这样,也很容易错过细微但重要的迹象。

得益于人工智能 (AI) 的介入,这一过程正变得更快、更智能、效率更高,从而减轻了人工观察员的压力,同时提高了准确性。特别是,计算机视觉可用于跟踪动物、发现危险并实时做出决策。过去需要数小时才能完成的任务现在只需几分钟即可完成,从而开辟了了解动物行为的新途径。

在 YOLO Vision 2024 (YV24) 上,专家和创新者齐聚一堂,探讨 AI 如何应对日常挑战。YOLO Vision 2024 (YV24) 是由 Ultralytics 主办的年度混合活动。展示的主题包括实时目标检测和动物监测的进展,展示了 AI 如何提高各个领域的安全性和效率。

本次活动的亮点之一是 AI Master Group 创始人 Jim Griffin 的演讲,他展示了 视觉 AI 如何通过在鲨鱼过于靠近海岸之前检测到它们,从而使海滩更安全。他解释了他们如何使用 Ultralytics YOLOv8(一种先进的计算机视觉模型)来实时准确地识别鲨鱼,即使在波涛汹涌、眩光和水下障碍物等具有挑战性的条件下也是如此。

在本文中,我们将仔细研究 SharkEye 项目,并分享 Jim 演讲中的有趣见解。

了解 SharkEye:一个计算机视觉应用程序

Jim 在演讲开始时介绍了帕达罗海滩,这是加利福尼亚州著名的冲浪胜地,冲浪者和鲨鱼经常在那里共享同一片水域。在强调鲨鱼检测的真正挑战时,他分享道:“当然,如果鲨鱼咬了你,很容易检测到鲨鱼,所以我们想做的是提前识别鲨鱼。”

__wf_reserved_inherit
图 1. Jim 在 YOLO Vision 2024 大会上登台演讲。

SharkEye的创建是为了解决这个问题,并得到了加州大学圣巴巴拉分校的支持。Jim描述了如何使用带有高分辨率AI相机的无人机在水面上方约200英尺处飞行,实时扫描海洋。

如果检测到鲨鱼,短信警报会发送给大约 80 人,包括救生员、冲浪商店老板和任何注册接收更新的人。 Jim 指出,这些即时通知如何实现快速响应,从而在鲨鱼靠近海岸时确保海滩游客的安全。

Jim还提到,SharkEye 具有一个实时仪表板,用户可以在其中查看鲨鱼检测统计数据。例如,在 12 周内,该系统识别出两条大型鲨鱼和 15 条较小的鲨鱼,平均每周略多于一条鲨鱼。

然后,他介绍了 Neil Nathan,这位科学家领导了 SharkEye 背后的工作。尽管 Nathan 拥有环境研究背景,而非计算机科学背景,但他成功地领导了这个项目。Jim 强调,像 SharkEye 中使用的那些现代人工智能工具,其设计宗旨是易于访问,使非技术背景的人员也能够开发有影响力的解决方案。

使用 Ultralytics YOLOv8 检测鲨鱼

Jim 进一步详细阐述了 SharkEye 的内部原理,以及鲨鱼检测解决方案不仅仅涉及简单的 目标检测 任务。 它必须处理动态的、不可预测的条件,例如容易被误认为是鲨鱼的漂浮海藻。 与发现静止物体不同,识别鲨鱼需要精确性和适应性,这使得 YOLOv8 成为理想的选择。

YOLOv8 的另一个优点是它可以部署在无人机上,而无需依赖云服务器。 Jim 解释了这种方法如何使 SharkEye 能够发送即时警报 - 这是确保在不可预测的海洋条件下及时响应的重要组成部分。

仅用六行代码实现物体检测

在强调了 SharkEye 的工作原理以及其背后的协作努力之后,Jim 展示了一个现场演示。

Jim Griffin 通过一个大家熟悉的例子开始了现场演示——一个 Ultralytics YOLO 模型的“hello world”代码片段。仅用六行 Python 代码,他就展示了预训练的 Ultralytics YOLOv8 模型如何轻松地检测图像中的公共汽车。 

__wf_reserved_inherit
图 2. Jim 在 YOLO Vision 2024 上的演示。

他的演示使用了 YOLOv8 Nano 模型,这是一种用于无人机等低功耗设备的轻量级版本。同样的模型也被用于 SharkEye 中,用于实时鲨鱼检测。 

为了提供更多背景信息,Jim 提到演示中的模型正在 COCO128 上进行训练,COCO128 是广泛使用的 COCO 数据集 的一个较小子集。 COCO 数据集包含 80 个不同对象类别中的 20,000 多张图像。 虽然 COCO128 非常适合快速演示,但他指出 SharkEye 需要更强大的东西——一个特定于应用的鲨鱼检测数据集,可以处理现实场景的复杂性。

用于 SharkEye 的 YOLOv8 自定义训练 

据 Jim 介绍,SharkEye 项目中最困难的部分不是训练 AI 模型,而是收集正确的数据。他评论道:“这个项目的主要工作不是 AI,而是五年时间里驾驶无人机,从视频中筛选图像,并进行适当的标记。”

他描述了团队如何在帕达罗海滩收集了 15,000 张图像。每张图像都必须手动标记,以区分鲨鱼、海藻和水中的其他物体。虽然这个过程缓慢且要求高,但它为之后的一切奠定了基础。

__wf_reserved_inherit
图 3. 使用无人机捕获鲨鱼图像以进行实时目标检测。

一旦数据集准备就绪,Ultralytics YOLOV8 就在其上进行了自定义训练。Jim 说:“实际的训练并不是最难的部分——在 T4 GPU [图形处理单元] 上只花了 20 个小时。”他还补充说,如果使用更强大的硬件(如 A100 GPU),时间可以缩短到 5 个小时。

评估 SharkEye:精度高于召回率

然后,Jim讨论了SharkEye的性能是如何评估的。他说明了关键指标是精度——系统识别实际鲨鱼的准确程度。SharkEye实现了令人印象深刻的92%的精度,证明该模型在复杂的海洋环境中能够高效准确地识别鲨鱼。

吉姆深入探讨了精确率的重要性,并阐明了为什么在这种情况下精确率比召回率更重要。“大多数时候,人们对召回率更感兴趣,尤其是在医疗保健等领域,因为遗漏阳性病例可能会非常严重。但在这个案例中,我们不知道有多少鲨鱼在那里,所以我们关心的是精确率,”他解释说。SharkEye 通过专注于精确率来确保最大限度地减少误报,从而使救生员和其他响应人员能够快速采取行动。

__wf_reserved_inherit
图 4. Jim 在 YOLO Vision 2024 上展示 SharkEye。

他总结发言时,将人工智能与人类的表现进行了比较,指出 SharkEye 的 92% 精度远远超过了人类专家 60% 的准确率。他强调了这种差距,并说:“这是因为我们是人类。无论你或我多么专业,如果我们要整天坐在屏幕前寻找鲨鱼,最终,我们会让自己的思绪游离。” 与人类不同,人工智能模型不会疲劳或分心,使其成为需要持续监控任务的可靠解决方案。

Ultralytics YOLO11:最新的 YOLO

Jim Griffin 在演讲中引用了一句耐人寻味的引言,“六行代码有一天可以挽救你的生命”,完美地概括了人工智能已经变得多么先进但又易于访问。Ultralytics YOLO 模型在创建时就考虑到了这一点,使各种规模的开发人员和企业都可以使用最先进的计算机视觉技术。Ultralytics YOLO11 在此基础上构建,具有更快的推理速度和更高的准确性。 

以下是 YOLO11 与众不同之处的快速概览:

  • 重新设计的架构:其增强的骨干和颈部架构能够更好地提取特征并提高精度。
  • 易於使用:可以通過 Python 編碼或像 Ultralytics HUB 這樣的無程式碼工具來存取它。
  • 跨任务的灵活性:YOLO11 支持计算机视觉任务,如对象检测、实例分割、图像分类、跟踪、姿势估计和定向边界框 (OBB)。
  • 提高准确性:在 COCO 数据集上,YOLO11 实现了比 YOLOv8m 高 22% 的平均精度均值 (mAP),从而提供更精确的检测。

这些特性使 YOLO11 非常适合在动态环境中(无论是在农场还是在野外)进行动物行为追踪。

主要要点

视觉 AI 的进步通过为各个领域提供实用的工具,使应对现实世界的挑战变得更加容易。例如,像 YOLO11 这样的计算机视觉模型可用于实时监测和跟踪动物,即使在恶劣的条件下也是如此。 

Jim Griffin 在 YV24 的主题演讲中阐述了如何使用最少的代码,通过 YOLOv8 解决复杂问题。SharkEye 项目将无人机与 AI 结合,用于实时鲨鱼检测,展示了技术如何提高海滩安全性。 

这是一个引人入胜的案例研究,说明了易于访问的人工智能如何使来自不同背景的人们能够创建有效的解决方案。随着人工智能的不断发展,它正在改变各行各业,并使个人能够利用其潜力,使世界变得更安全、更智能、更高效。

加入我们的社区,探索我们的GitHub 仓库,深入了解人工智能。从农业中的计算机视觉自动驾驶汽车中的人工智能,了解这些技术如何推动创新。查看我们的许可选项,立即开始您的人工智能项目!

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板