了解 Ultralytics YOLO11 如何使用定向边界框 (OBB) 增强目标检测,以及这种计算机视觉任务最适合哪些应用。

了解 Ultralytics YOLO11 如何使用定向边界框 (OBB) 增强目标检测,以及这种计算机视觉任务最适合哪些应用。
Ultralytics 的 年度混合活动,YOLO Vision 2024 (YV24),专注于讨论 AI 和计算机视觉 的最新突破。这是推出我们最新模型 Ultralytics YOLO11 的绝佳机会。该模型支持与 Ultralytics YOLOv8 相同的 计算机视觉任务,使用户可以轻松过渡到新模型。
假设您正在使用 YOLOv8 进行定向边界框 (OBB) 目标检测,以检测来自各个角度的物体。现在,您只需对代码进行少量更改即可切换到 YOLO11,并受益于 YOLO11 的改进,包括更高的准确性和效率以及更快的处理速度。如果您尚未用过YOLO11 等模型,OBB 检测是 YOLO11 如何应用于各个行业的绝佳示例,它提供了能够产生实际影响的实际解决方案。
在本文中,我们将了解 什么是 OBB 目标检测、其应用领域以及如何使用 YOLO11 检测 OBB。我们还将介绍 YOLO11 的新功能如何改进这些流程,以及如何运行推理和训练自定义模型,以充分利用其 OBB 检测功能。
OBB目标检测通过检测不同角度的物体,使传统目标检测更进一步。与始终与图像轴对齐的常规边界框不同,OBB会旋转以适应物体的方向。OBB目标检测可用于分析航拍或卫星图像,在这些图像中,物体并不总是笔直的。在城市规划、能源和交通运输等行业中,准确检测建筑物、车辆或基础设施等倾斜物体的能力可以构成具有实际效益的计算机视觉应用的基础。
YOLO11 支持 OBB 检测,并在 DOTA v1.0 数据集上进行了训练,可以从不同的角度检测飞机、船舶和储罐等物体。YOLO11 提供多种模型变体,以满足不同的需求,包括 YOLO11n-obb (Nano)、YOLO11s-obb (Small)、YOLO11m-obb (Medium)、YOLO11l-obb (Large) 和 YOLO11x-obb (Extra Large)。每种模型都提供不同的尺寸,具有不同级别的速度、准确性和计算能力。用户可以选择提供适合其应用的速度和准确性平衡的模型。
YOLO11 的目标检测能力,尤其是其对定向边界框的支持,为各行各业带来了更高的精度。接下来,我们将看几个例子,了解 YOLO11 和 OBB 检测如何在现实场景中使用,以使不同领域的过程更高效、更准确、更易于管理。
如果您曾经欣赏过城市的设计和布局,那要归功于城市规划和基础设施监控的详细工作。基础设施监控的其中一个方面是识别和管理重要的结构,如储罐、管道和工业场所。YOLO11 可以帮助城市规划者分析航拍图像,以快速准确地检测这些关键组件。
定向边界框对象检测在这里特别有用,因为它能够检测从各种角度观察到的对象(航空图像中经常出现这种情况)。精度在这里至关重要,可以跟踪工业区、管理环境影响并确保基础设施得到适当维护。OBB 使检测过程更加可靠,帮助规划人员就城市的增长、安全和可持续性做出明智的决策。使用 YOLO11 可以帮助规划人员监控和管理维持城市平稳运行的基础设施。
随着可再生能源和太阳能发电场等创新越来越受欢迎,定期检查变得越来越重要。需要检查太阳能电池板,以确保它们高效运行。随着时间的推移,裂缝、污垢堆积或未对准等问题会降低其性能。例行检查有助于及早发现这些问题,以便进行维护,使其保持平稳运行。
例如,可以使用与边缘 AI 集成的无人机和 YOLO11 来检查太阳能电池板的损坏情况。在边缘分析图像可以为检查过程带来更高的精度和效率。由于无人机的移动和视角,监控录像通常会从不同的角度拍摄太阳能电池板。在这些情况下,YOLO11 的 OBB 检测可以帮助无人机准确地识别太阳能电池板。
港口每周要处理数百艘船只,管理如此庞大的船队可能具有挑战性。当分析航空图像中的船只时,会增加难度;船只通常以不同的角度出现。这就是 YOLO11 对 OBB 检测的支持派上用场的地方。
与标准矩形框相比,OBB检测使模型能够更准确地检测各种角度的船舶。通过使用带有OBB的YOLO11,航运公司可以更容易地识别其船队的位置和状况,从而跟踪重要的细节,如船队移动和供应链物流。这种视觉解决方案有助于优化航线、减少延误并改善整个航运路线的船队管理。
如果您是一名希望使用 YOLO11 进行 OBB 检测的 AI 开发人员,那么有两种简单的入门选择。如果您习惯使用代码,那么 Ultralytics Python 包 是一个不错的选择。如果您喜欢具有云训练功能的用户友好型无代码解决方案,那么 Ultralytics HUB 就是为此而设计的内部平台。有关更多详细信息,您可以查看我们关于使用 Ultralytics HUB 训练和部署 Ultralytics YOLO11 的指南。
既然我们已经看到了 YOLO11 的 OBB 支持可以在哪些地方应用,那么让我们来探索 Ultralytics Python 包,看看如何使用它来运行推理和训练自定义模型。
首先,要在 Python 中使用 YOLO11,您需要安装 Ultralytics 包。根据您的偏好,您可以选择使用 pip、conda 或 Docker 安装它。有关分步说明,您可以参考我们的 Ultralytics 安装指南。如果您在安装过程中遇到任何挑战,我们的常见问题指南提供了有用的故障排除提示。
一旦您安装了 Ultralytics 软件包,使用 YOLO11 就非常简单了。运行推理是指使用训练好的模型对新图像进行预测的过程,例如实时检测 OBB 中的对象。它与模型训练不同,模型训练是指您教模型识别新对象或提高其在特定任务上的性能。当您想将模型应用于未见过的数据时,可以使用推理。
下面的示例将引导您了解如何加载模型并使用它来预测图像上的定向边界框。如需更多详细示例和高级使用技巧,请务必查看官方 Ultralytics 文档,以获取最佳实践和更多说明。
训练 YOLO11 模型意味着您可以针对特定的数据集和任务(例如定向边界框对象检测)微调其性能。虽然像 YOLO11 这样的预训练模型可以用于一般的对象检测,但当您需要模型检测独特的对象或优化特定数据集上的性能时,训练自定义模型至关重要。
在下面的代码片段中,我们介绍了训练用于 OBB 检测的 YOLO11 模型的步骤。
首先,使用预训练的 YOLO11 OBB 特定权重 (yolo11n-obb.pt) 初始化模型。然后,使用训练函数在自定义数据集上训练模型,其中包含参数,例如数据集配置文件、训练周期数、训练图像大小以及运行训练的硬件(例如,CPU 或 GPU)。训练完成后,将验证模型的性能,以检查准确性和损失等指标。
使用训练好的模型,您可以在新图像上运行推理,以使用 OBB 检测目标并将其可视化。此外,训练好的模型可以转换为 ONNX 等格式,以便使用 导出功能 进行部署。
Ultralytics YOLO11 通过支持定向边界框将目标检测提升到了一个新的水平。通过能够检测不同角度的目标,YOLO11 可用于不同行业的各种应用。例如,它非常适合城市规划、能源和航运等行业,在这些行业中,精度对于太阳能电池板检测或车队监控等任务至关重要。凭借更快的性能和更高的精度,YOLO11 可以帮助 AI 开发人员解决现实世界的挑战。
随着人工智能被更广泛地采用并融入我们的日常生活,像YOLO11这样的模型将塑造人工智能解决方案的未来。
要了解视觉 AI 的潜力,请加入我们不断壮大的社区并探索我们的 GitHub 存储库。我们正在通过重塑从医疗保健到自动驾驶汽车等行业来推动创新。