深圳Yolo 视觉
深圳
立即加入

什么是定向边界框旋转框检测)检测?

5 分钟阅读

2025年6月9日

探索在实际应用中,定向边界旋转框检测)检测如何通过精确识别图像中的旋转物体来增强物体检测。

识别物体,无论它们如何排列或朝向哪个方向,对我们人类来说都是很自然的事情。无论是十字路口的汽车还是港口中的船只,我们都可以轻松地分辨出它们是什么以及它们指向哪个方向。但是,对于 人工智能 (AI) 系统来说,这并非易事。

例如,计算机视觉是人工智能的一个分支,专注于理解图像和视频,它可以实现诸如目标检测之类的任务,从而帮助机器识别和定位场景中的目标。传统的目标检测依赖于轴对齐的边界框来在目标周围绘制框。这些框具有笔直的边和固定的直角。当目标直立且不太靠近时,这种方法效果很好。 

但当物体倾斜、旋转或靠近时,传统的物体检测往往难以准确捕捉。为了处理这些更复杂的情况,人们引入了定向边界框(旋转框检测)检测等技术。与标准边界框不同的是,旋转边界框可以根据物体的角度和形状进行旋转,从而实现更紧密、更精确的贴合。

计算机视觉模型,如 Ultralytics YOLO11旋转框检测 支持一系列实时应用,尤其是在空中监控等需要确定物体方向的场景中。此外,旋转框检测 还可用于医疗保健、农业和文档分析。

在本文中,我们将探讨什么是旋转框检测 、它是如何工作的,以及它在现实世界中的应用。让我们开始吧!

__wf_reserved_inherit
图 1.使用YOLO11 旋转框检测 船只的示例演示。

什么是 Oriented Bounding Box(定向边界框)?

定向边界框是一种计算机视觉中使用的矩形框,用于表示图像中检测到的对象。虽然标准边界框与图像的水平轴和垂直轴对齐,但 OBB 可以旋转以匹配对象的实际角度。

这种旋转能力带来了几个优势。OBB 可以更紧密地与对象的方向对齐,从而使框能够紧密地贴合对象的形状和方向。因此,检测变得更加准确和精确。

当物体不是完全直立时,OBB尤其有用,例如在航拍镜头中弯曲道路上转弯的汽车、桌子上倾斜的书籍或医学扫描中旋转的肿瘤。通过更准确地匹配物体的角度,OBB可以提高检测性能,减少背景干扰,并且特别适用于物体方向与其位置同样重要的应用。

__wf_reserved_inherit
图 2.物体检测与旋转框检测 检测的比较。

旋转框检测与物体检测

旋转框检测和传统的物体检测初看起来可能很相似,但它们的使用方式和应用场合却不尽相同。让我们通过一个例子来详细了解它们之间的比较。

计算机视觉模型(如YOLO11)经过训练后,可以在工业检测等各种实际应用中对物体进行detect 和classify 。在工厂装配线上,不同的机器零件沿着传送带移动。有些部件可能摆放整齐,但其他部件可能会因振动或速度而轻微旋转、倾斜或重叠。

传统的对象检测使用与图像水平和垂直边缘对齐的直立矩形框。因此,当零件旋转时,该框可能无法正确贴合 - 它可能会遗漏零件的一部分或包含过多的背景。这会降低检测的准确性,并使系统更难以自信地识别零件。

现在,假设您使用旋转框检测 。在这种情况下,模型可以绘制一个与每个部件的精确角度相匹配的旋转框。倾斜的齿轮或有角度的部件将被一个符合其形状和方向的方框紧紧包围。这意味着精度更高、误差更小、结果更可靠,尤其是在自动质量控制或机器人分拣等使用案例中。

热门旋转框检测 模型

既然我们已经对什么是旋转框检测 有了更好的了解,那就让我们来看看支持旋转框检测 的一些最广泛使用的视觉 AI 模型。

目前已开发出几种先进的计算机视觉模型,专门用于检测旋转或倾斜的物体。其中,Ultralytics YOLO 模型以其可靠、高效的旋转框检测 能力而著称。

早期版本,如 Ultralytics YOLOv5是专为标准物体检测而设计的。后来的迭代版本,如 Ultralytics YOLOv8和最新的YOLO11 都引入了对旋转框检测 的本地支持。尤其是YOLO11,在不影响速度的情况下提供了最先进的准确性,使其成为实时应用中极具影响力的选择。

预训练的YOLO11 旋转框检测 模型,如 YOLO11n-旋转框检测,是在 DOTAv1 等数据集上训练的。 

此外,这些型号还提供五种不同的尺寸,从纳米(n-旋转框检测)到超大(x-旋转框检测),以满足不同的性能需求。这种多功能性使它们能够应用于各行各业--从监控城市基础设施和检测机械到读取扫描文件中的歪斜文本。

用于定向边界框检测的定制训练YOLO11

在现实世界的许多情况下,您需要detect 的对象可能与标准训练数据集中的对象完全不同。例如,生产线上的工具、产品包装或电路板上的元件等物体可能会旋转、摆放不规则或形状不同。 

要准确detect 这些自定义对象,尤其是在方向非常重要的情况下,使用您自己的图像和标签来训练像YOLO11 这样的模型非常重要。这一过程被称为自定义训练。 

下面我们来详细了解一下YOLO11 旋转框检测 训练的逐步过程:

  • 图像采集:收集图像,从不同的角度、位置和真实环境展示您的目标对象。
  • 对象注释:使用支持旋转旋转框检测 的注释工具,使用旋转边界旋转框检测 (OBB) 标注每个对象,以捕捉其位置和方向。
  • 数据集准备:将图像和标签整理到YOLO 目录结构中,并创建包含类名和数据集路径的 YAML 配置文件。
  • 模型训练
  • 评估和部署: 在新图像上测试您训练的模型,评估其准确性,并将其部署到实际应用中,如制造业、空中监视或文档分析。

通过旋转框检测 实现的应用

偏离中心或倾斜的物体在现实生活中很常见。让我们举几个例子,看看旋转框检测 如何通过准确检测这些物体而发挥真正的作用。

利用旋转框检测 进行 X 射线图像分析

旋转框检测可以通过提高精确度使医学图像分析更进一步。医学图像通常包括解剖结构,如肿瘤、器官或骨骼。这些结构经常以不规则的形状和不同的方向出现。由于 OBB 可以根据物体的角度进行旋转,因此可以提供更精确的定位和测量,这对诊断和治疗计划至关重要。

这种方法在分析骨折的 X 射线图像时尤其有效,因为骨骼的位置和排列是关键因素。例如,旋转框检测 被用于分析小儿肘部 X 光片。通过调整骨骼的方向,它有助于提高检测的准确性。 

__wf_reserved_inherit
图 3. X 射线 (a, d) 与目标检测 (b, e) 和定向边界框检测 (c, f)。

由旋转框检测 提供动力的空中监视

空中监控是公共安全、环境监测和城市规划等领域的重要工具。无人机或卫星拍摄的图像有助于识别船只、车辆和建筑物等物体。然而,在这些图像中,物体往往看起来很小,角度也不寻常,因此更难准确detect 。

旋转框检测通过倾斜边界框以匹配每个物体的角度来解决这个问题。这样就能更准确地测量物体的大小和方位,为城市规划、国防、灾难响应和环境监测等领域提供更好的决策支持。

旋转框检测 的一个有趣例子是海上监视中的船只跟踪。由于天气、光照或运动等原因,卫星图像通常会捕捉到不同角度和大小的船只。OBB 能够适应这些变化,提高探测效率,尤其是对较小或部分被遮挡的船只。

__wf_reserved_inherit
图 4.使用旋转框检测 进行海上监视的情况。

在农业中使用旋转框检测

收获后对农作物进行分拣是确保农作物包装和上市前质量的关键步骤。虽然许多系统都能很好地处理苹果和橘子等圆形水果,但胡萝卜或茭白等狭长型作物却很难处理。它们的形状各不相同,而且经常以不同的角度出现,因此很难准确detect 和分拣。

为了解决这个问题,研究人员开发了一种系统,利用定向边界旋转框检测)检测来更准确地识别这些作物对其进行分级。该系统可以detect 一张图像中的多个作物,即使它们倾斜或重叠,也能实时评估它们的质量和位置。

旋转框检测 的利弊

以下是使用旋转框检测 的一些好处:

  • 改进下游任务的输入:诸如实例分割和目标跟踪等计算机视觉任务,若能获得更精确的目标检测结果,性能将会得到提升

  • 增强空间推理能力:通过捕获方向角,OBB 能够理解物体的对齐方式和方向。

  • 减少拥挤场景中的重叠: 即使在繁忙或杂乱的场景中,OBB 也能通过更紧密地拟合对象来减少歧义。

尽管旋转框检测 有助于提高复杂场景中的检测精度,但也有一些局限性需要考虑:

  • 对噪声的敏感度更高: 角度预测中的小错误会对检测精度产生更大的影响,尤其是在密集堆积或细长物体的情况下。
  • 需要专用工具: 由于并非所有标记和训练平台都原生支持 OBB,因此使用它们可能需要额外的工具或设置。

  • 可用数据集有限: 与标准物体检测相比,目前可公开获得的带有旋转框检测 注释的数据集较少,这使得开始使用或比较结果的难度略有增加。

主要要点

方位边界框检测使计算机视觉解决方案更容易识别并非完全平直或对齐的物体。通过捕捉物体的位置和方向,旋转框检测 提高了扫描医疗图像、监控农田或分析卫星照片等实际应用案例的准确性。

随着YOLO11 等型号的旋转框检测 技术的普及,它正成为许多行业的实用选择。无论您处理的是倾斜、重叠还是奇形怪状的物体,旋转框检测 都能为您带来额外的精确度,而标准方法往往会忽略这一点。

对 AI 感兴趣吗?浏览我们的 GitHub 仓库,与 我们的社区 建立联系,并查看我们的许可选项,以快速启动您的计算机视觉项目。在我们的解决方案页面上了解更多关于零售业中的 AI物流业中的计算机视觉等创新。

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始