遇见 YOLO26: 下一代视觉 AI。
Ultralytics
活动

SharkEye 使用 Ultralytics YOLOv8 进行目标检测

了解在 YOLO Vision 2024 上展示的 SharkEye 如何利用 Ultralytics YOLOv8 实现实时目标检测和海滩安全。

ABAbirami Vina
5 min read
SharkEye 使用 Ultralytics YOLOv8 进行鲨鱼检测

监测自然栖息地中的动物,无论是农场中吃草的牛还是在海岸附近游动的鲨鱼,对它们的安全性与福祉而言始终至关重要。然而,手动观察并不容易。这通常需要数小时的耐心和专注,因为观察者必须仔细留意行为或动作的任何变化。即便如此,也很容易错过细微但重要的迹象。

得益于人工智能 (AI) 的介入,这一过程正变得更快、更智能、更高效,既减轻了人工观察员的负担,又提高了准确性。特别是 computer vision 可用于实时追踪动物、发现危险并做出决策。曾经需要数小时的任务现在几分钟内即可完成,这为理解动物行为开辟了新途径。

在 Ultralytics 主办的年度混合活动 YOLO Vision 2024 (YV24) 上,专家和创新者们齐聚一堂,共同探讨 AI 如何应对日常挑战。展示的部分主题包括实时目标检测和 animal monitoring 的进展,展示了 AI 如何提升各领域的安全性和效率。

活动的一大亮点是 AI Master Group 创始人 Jim Griffin 的演讲,他演示了 vision AI 如何在鲨鱼靠近海岸之前将其检测出来,从而使海滩更加安全。他解释了他们如何使用尖端计算机视觉模型 Ultralytics YOLOv8 在复杂条件下(如波浪破碎、强光和水下障碍物)准确地实时识别鲨鱼。

在本文中,我们将深入了解 SharkEye project 并分享 Jim 演讲中的有趣见解。

Link to this section了解 SharkEye:一种计算机视觉应用#

Jim 在演讲开头介绍了加利福尼亚州著名的冲浪胜地 Padaro Beach,那里冲浪者和鲨鱼经常共享同一片水域。在强调鲨鱼检测的实际挑战时,他分享道:“当然,如果鲨鱼咬了你,检测它很容易;所以我们想做的是提前识别出这些鲨鱼。”

Jim Griffin 在 YOLO Vision 2024 的舞台上

图 1. Jim 在 YOLO Vision 2024 舞台上。

SharkEye 是在加州大学圣塔芭芭拉分校的支持下为解决这一问题而创建的。Jim 描述了配备高分辨率 AI cameras 的无人机如何被用于在水面上方约 200 英尺处飞行,实时扫描海洋。

如果检测到鲨鱼,短信警报会发送给约 80 人,包括救生员、冲浪店老板以及任何订阅了更新的人。Jim 指出,这些即时通知能够实现快速响应,在鲨鱼靠近海岸时保护海滩游客的安全。

Jim 还提到 SharkEye 配备了一个实时仪表板,用户可以在其中查看鲨鱼检测统计数据。例如,在 12 周的时间里,该系统识别出了两条大鲨鱼和 15 条小鲨鱼,平均每周略多于一条。

随后,他介绍了领导 SharkEye 开发工作的科学家 Neil Nathan。尽管背景是环境研究而非计算机科学,Nathan 仍成功领导了该项目。Jim 强调了现代 AI 工具(如 SharkEye 中使用的那些)如何被设计为易于访问,使非技术背景的人员也能开发出具有影响力的解决方案。

Link to this section使用 Ultralytics YOLOv8 检测鲨鱼#

Jim 进一步阐述了 SharkEye 的底层技术,以及鲨鱼检测方案并非仅仅是一个简单的 object detection 任务。它必须应对诸如容易被误认为是鲨鱼的漂浮海藻等动态且不可预测的情况。与识别静止物体不同,识别鲨鱼需要精确度和适应性,这使得 YOLOv8 成为理想的选择。

YOLOv8 的另一个优势是它可以在 deployed on a drone 上运行,而无需依赖云服务器。Jim 解释了这种方法如何使 SharkEye 能够发送即时警报——这是确保在不可预测的海洋条件下及时响应的关键部分。

Link to this section仅用六行代码进行目标检测#

在强调了 SharkEye 的工作原理及其背后的协作努力后,Jim 进行了一场现场演示。

Jim Griffin 通过引导观众了解一个熟悉的示例——用于 Ultralytics YOLO models 的“hello world”代码片段,开始了现场演示。仅用六行 Python 代码,他就展示了预训练的 Ultralytics YOLOv8 模型如何轻松地检测图像中的公交车。

Jim 在 YOLO Vision 2024 的演示

图 2. Jim 在 YOLO Vision 2024 的演示。

他的演示使用了 YOLOv8 Nano 模型,这是一个针对无人机等低功耗设备设计的轻量级版本。同一个模型也被用于 SharkEye 进行实时鲨鱼检测。

为了提供更多背景信息,Jim 提到演示中的模型是在 COCO128 上训练的,这是广泛使用的 COCO dataset 的一个较小部分。COCO 数据集包含 80 个不同对象类别的超过 20,000 张图像。虽然 COCO128 非常适合快速演示,但他指出 SharkEye 需要更强大的功能——即能够处理现实场景复杂性的特定应用鲨鱼检测数据集。

Link to this section为 SharkEye 定制训练 YOLOv8#

据 Jim 说,SharkEye 项目最困难的部分不是训练 AI 模型,而是收集正确的数据。他评论道:“这个项目的主要工作不是 AI。这个项目的主要工作是五年来一直驾驶无人机,从视频中提取图像并进行适当的标记。”

他描述了团队如何在 Padaro Beach 收集了 15,000 张图像。每张图像都必须手动标注,以区分水中的鲨鱼、海藻和其他物体。虽然这个过程缓慢且艰巨,但它为随后的所有工作奠定了基础。

使用无人机拍摄鲨鱼图像以进行目标检测

图 3. 使用无人机捕获鲨鱼图像以进行实时目标检测。

数据集准备就绪后,Ultralytics YOLOv8 就在其上进行了 custom-trained。Jim 说:“实际训练并不是最难的部分——在 T4 GPU [图形处理单元] 上仅用了 20 个小时。” 他还补充说,使用更强大的硬件(如 A100 GPU),时间可以缩短到 5 小时。

Link to this section评估 SharkEye:精度高于召回率#

随后,Jim 讨论了如何评估 SharkEye 的性能。他说明关键指标是精度——即系统识别实际鲨鱼的准确程度。SharkEye 实现了令人印象深刻的 92% 的精度,证明该模型在复杂海洋环境中准确识别鲨鱼方面非常有效。

在深入探讨精度重要性时,Jim 阐明了为什么在这种情况下精度比召回率更重要。“大多数时候,人们对 recall 感兴趣,尤其是在医疗保健等领域,错过阳性病例可能至关重要。但在这种情况下,我们不知道外面有多少鲨鱼,所以我们关心的是精度,” 他解释道。SharkEye 通过专注于精度确保最大限度地减少误报,使救生员和其他响应者更容易采取快速行动。

Jim 在 YOLO Vision 2024 展示 SharkEye

图 4. Jim 在 YOLO Vision 2024 展示 SharkEye。

他在演讲结束时比较了 AI 与人类的表现,指出 SharkEye 92% 的精度远超人类专家 60% 的准确率。他强调了这一差距,说道:“这是因为我们是人类。无论你或我可能多么专业,如果我们必须整天坐在屏幕前寻找鲨鱼,最终我们的心思会游离。” 与人不同,AI 模型不会疲劳或分心,这使其成为需要持续监控的任务的可靠解决方案。

Link to this sectionUltralytics YOLO11:最新的 YOLO#

Jim Griffin 演讲中的一句有趣的话——“六行代码有一天可能会拯救你的生命”——完美地捕捉到了 AI 变得多么先进且易于访问。Ultralytics YOLO 模型的设计正是考虑到这一点,使得尖端计算机视觉技术对各种规模的开发者和企业都触手可及。Ultralytics YOLO11 在此基础上更进一步,提供了更快的推理速度和更高的准确性。

以下是 YOLO11 脱颖而出的简要概述:

  • 重新设计的架构:其增强的主干和颈部架构实现了更好的特征提取和更高的精度。
  • 易用性:可以通过 Python 编码或 Ultralytics HUB 等无代码工具来使用它。
  • 跨任务灵活性:YOLO11 支持诸如目标检测、实例分割、图像分类、追踪、姿态估计和旋转边界框 (OBB) 等 computer vision tasks
  • 准确性提升:YOLO11 在 COCO 数据集上的平均精度均值 (mAP) 比 YOLOv8m 高出 22%,可提供更精确的检测。

这些功能使得 YOLO11 非常适合在农场或野外等动态环境中的动物行为追踪。

Link to this section关键要点#

视觉 AI 的进步通过为各个领域提供实用的工具,使解决现实挑战变得更加容易。例如,像 YOLO11 这样的计算机视觉模型可用于实时监测和追踪动物,即使是在严苛的条件下也是如此。

Jim Griffin 在 YV24 的主题演讲展示了 YOLOv8 如何用于以极少的编码量解决复杂问题。结合无人机与 AI 进行实时鲨鱼检测的 SharkEye 项目,展示了技术如何提升海滩安全。

这是一个引人入胜的案例研究,展示了可访问的 AI 如何赋予不同背景的人们开发有效解决方案的能力。随着 AI 的不断演进,它正在重塑行业,并使个人能够利用其潜力使世界变得更安全、更智能、更高效。

加入 our community 并探索我们的 GitHub repository 以更深入地了解 AI。从 computer vision in agricultureAI in self-driving cars,看看这些技术如何推动创新。查看 our licensing options 立即开始你的 AI 项目吧!

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅