遇见 YOLO26: 下一代视觉 AI。
Ultralytics
视觉 AI

探索视觉 AI 应用的多种数据类型

了解热成像、LiDAR 和红外图像等视觉数据类型如何赋能各行业的多元化计算机视觉应用。

ABAbirami Vina
4 min read
视觉 AI 应用的视觉数据类型

像无人机这样的技术曾经非常局限,只有研究人员和专家才能使用,但如今,尖端硬件正变得越来越普及。这种转变正在改变我们收集视觉数据的方式。随着技术的普及,我们现在可以从除传统相机之外的各种来源捕获图像和视频。

与此同时,由计算机视觉(人工智能的一个分支)支持的图像分析技术正在迅速发展,使机器能够更有效地解读和处理视觉数据。这一进展为自动化、目标检测和实时分析开辟了新的可能性。机器现在可以识别模式、跟踪运动并理解复杂的视觉输入。

一些关键的视觉数据类型包括 RGB(红、绿、蓝)图像(常用于目标识别)、热成像(有助于在弱光条件下检测热特征)以及深度数据(使机器能够理解 3D 环境)。每种数据类型在推动视觉 AI 的各种应用(从监控到医学影像)中都发挥着至关重要的作用。

在本文中,我们将探索视觉 AI 中使用的关键视觉数据类型,并探讨每种类型如何助力提高各行业的准确性、效率和性能。让我们开始吧!

Link to this section最常见的 AI 图像和视频数据集类型#

通常,当你使用智能手机拍照或查看闭路电视监控录像时,你处理的就是 RGB 图像。RGB 代表红色、绿色和蓝色,它们是数字图像中表示视觉信息的三个颜色通道。

RGB 图像和视频是计算机视觉中使用的紧密相关的视觉数据类型,它们都是通过标准相机捕获的。主要的区别在于,图像捕捉的是瞬间,而视频是展示事物随时间变化的帧序列。

RGB 图像通常用于计算机视觉任务,如目标检测、实例分割和姿态估计,并由像 Ultralytics YOLO11 这样的模型提供支持。这些应用依赖于识别单帧中的模式、形状或特定特征。

另一方面,当运动或时间成为一个因素时(例如手势识别、监控或动作跟踪),视频就显得尤为重要。由于视频可以被视为一系列图像,因此像 YOLO11 这样的计算机视觉模型会逐帧处理它们,以了解随时间推移的运动和行为。

例如,YOLO11 可用于分析 RGB 图像或视频,以检测农田中的杂草并统计作物数量。这增强了作物监测能力,并有助于跟踪生长周期的变化,从而实现更高效的农场管理。

YOLO11 正在检测并计数用于作物监测的植物

图 1。YOLO11 可以检测并统计作物,实现更智能的农作物监测。

Link to this section视觉 AI 中的深度数据:LiDAR 与 3D 感知#

深度数据通过指示物体距离相机或传感器的远近,为视觉信息增加了第三个维度。与仅捕捉颜色和纹理的 RGB 图像不同,深度数据提供了空间背景。它展示了物体与相机之间的距离,使得解释场景的 3D 布局成为可能。

这种类型的数据是使用 LiDAR、立体视觉(使用两个相机来模拟人类深度感知)和飞行时间(测量光线往返于物体所需的时间)相机等技术捕获的。

其中,LiDAR(激光雷达)通常是深度测量中最可靠的技术。它的工作原理是发射快速激光脉冲并测量它们反弹回来的时间。结果是一个极其精确的 3D 地图(称为点云),它能实时突显物体的形状、位置和距离。

Link to this sectionLiDAR 在视觉 AI 系统中日益增长的作用#

LiDAR 技术可分为两大类,每类专为特定应用和环境而设计。以下是对这两种类型的详细介绍:

  • 机载 LiDAR: 机载 LiDAR 扫描仪通常用于大面积测绘,安装在无人机或飞机上,以捕获用于大规模地形测绘的高分辨率数据。它是勘测地形、森林和景观的理想选择。
  • 地面 LiDAR: 这种类型的 LiDAR 数据是从安装在车辆或固定平台上的传感器收集的,适用于基础设施监测、建筑和室内测绘等应用。它为较小、局部的区域提供了极其详细的数据,使其在城市规划和特定结构测量等任务中非常有用。

LiDAR 数据的一个重要应用是在自动驾驶车辆中,它在车道检测、防碰撞和识别附近物体等任务中起着关键作用。LiDAR 生成环境的详细、实时 3D 地图,使车辆能够看到物体、计算距离并安全行驶。

LiDAR 使自动驾驶汽车能够绘制深度图并检测物体

图 2。LiDAR 技术使自动驾驶车辆能够映射深度并检测物体。

Link to this section在 AI 应用中使用热成像和红外数据#

RGB 图像捕捉的是我们在可见光谱中看到的内容;然而,其他成像技术(如热成像和红外成像)超越了这一点。红外成像捕捉物体发射或反射的红外光,使其在弱光条件下非常有用。

相比之下,热成像检测物体发出的热量并显示温差,使其能够在完全黑暗或穿透烟雾、雾气及其他障碍物的情况下工作。这种数据类型对于监测和检测问题特别有用,尤其是在温度变化可能预示潜在问题的行业中。

一个有趣的例子是使用热成像来监测电气组件是否有过热迹象。通过检测温差,热像仪可以在问题导致设备故障、火灾或昂贵的损失之前识别出问题。

用于监控电气组件的热成像技术

图 3。使用热成像监测电气组件的一个示例。

同样,红外图像可以通过识别指示气体或液体泄漏的温差来帮助检测管道或绝缘层的泄漏,这对于预防危险情况和提高能源效率至关重要。

Link to this sectionAI 中的多光谱和高光谱成像#

虽然红外和热成像捕捉的是电磁光谱的特定方面,但多光谱成像收集来自几个选定波长范围的光,每个波长都经过精心选择以用于特定目的,例如检测健康植被或识别表面材料。

高光谱成像则更进一步,它捕捉数百个非常窄且连续的波长范围内的光。这为图像中的每个像素提供了详细的光特征,从而对所观察到的任何材料提供更深入的了解。

比较多光谱与高光谱成像

图 4。比较多光谱和高光谱成像。

多光谱和高光谱成像都使用特殊的传感器和滤光片来捕捉不同波长的光。然后将这些数据组织成一种称为光谱立方体的 3D 结构,每一层代表一个不同的波长。

AI 模型可以分析这些数据,以检测普通相机或人眼无法看到的特征。例如,在植物表型分析中,高光谱成像可用于通过检测叶片或茎部的细微变化(如营养缺乏或压力)来监测植物的健康和生长。这有助于研究人员评估植物健康状况并优化农业实践,而无需使用侵入性方法。

Link to this section使用 AI 分析雷达和声纳成像#

雷达和声纳成像技术通过发送信号并分析其反射来检测和映射物体,类似于 LiDAR。与依靠光波捕捉视觉信息的 RGB 成像不同,雷达使用电磁波(通常是无线电波),而声纳使用声波。雷达和声纳系统都会发射脉冲并测量信号从物体反弹回来的时间,从而提供有关其距离、大小和速度的信息。

雷达成像在能见度较差时(如大雾、雨天或夜间)特别有用。因为它不依赖光线,所以可以在完全黑暗的情况下检测飞机、车辆或地形。这使得雷达成为航空、天气监测和自主导航中的可靠选择。

相比之下,声纳成像通常用于光线无法到达的水下环境。它利用在水中传播并从水下物体反弹的声波,从而实现潜艇检测、海底测绘和执行水下救援任务。计算机视觉的进步现在正通过将声纳数据与智能分析相结合,进一步增强水下检测能力,以改善检测和决策过程。

声纳系统如何利用超声波脉冲测量海深

图 5。 声纳系统如何使用超声波脉冲测量海深。

Link to this section用于 AI 模型训练的合成和模拟视觉数据#

到目前为止,我们讨论的不同数据类型都是可以从现实世界中收集的。然而,合成和模拟视觉数据都属于人工内容。合成数据是使用 3D 建模或生成式 AI 从零开始生成的,以制作出看起来逼真的图像或视频。

合成生成图像一览

图 6。合成生成图像一瞥。

模拟数据与之类似,但涉及创建复制物理世界行为的虚拟环境,包括光的反射、阴影形成和物体运动。虽然所有模拟视觉数据都是合成的,但并非所有合成数据都是模拟的。关键的区别在于,模拟数据复制的是真实的物理行为,而不仅仅是外观。

这些数据类型对于训练计算机视觉模型非常有用,特别是在难以收集现实世界数据或需要模拟特定、罕见情况时。开发者可以创建整个场景,选择物体类型、位置和光照,并自动添加边界框等标签用于训练。这有助于快速构建多样化的大型数据集,而无需真实照片或手动标注(后者通常既昂贵又耗时)。

例如,在医疗保健领域,合成数据可用于训练模型以分割乳腺癌细胞,因为在这种情况下收集和标注大量真实图像数据集非常困难。合成和模拟数据提供了灵活性和控制力,填补了现实世界视觉数据受限的空白。

Link to this section为你的 AI 应用选择正确的视觉数据类型#

既然我们已经了解了不同类型的视觉数据如何工作及其功能,让我们仔细看看哪些数据类型最适合特定任务:

  • RGB 图像: 它非常适合常规计算机视觉任务,如图像分类和目标检测。它能捕捉颜色和纹理,但在低光或能见度差等挑战性条件下会受到限制。
  • LiDAR 成像: 这种成像方式使用激光脉冲提供高精度 3D 测绘。它非常适合需要精确距离测量的应用,如机器人、自动驾驶车辆和基础设施巡检。
  • 热成像: 由于能够检测温差,它在低能见度条件下非常有用,如夜间监控、消防或检测机械和建筑物中的热泄漏。
  • 多光谱和高光谱成像: 它适用于需要详细材料分析的任务,如农业监测、医药质量控制或遥感。这些方法通过捕捉可见光之外的广泛波长数据,提供了更深入的见解。
  • 雷达和声纳成像: 它们在低能见度环境中是首选。雷达使用无线电波,对航空和导航有帮助;而声纳则使用声波在水下进行检测。
  • 合成和模拟视觉数据: 当现实世界数据有限、不可用或难以标注时,它是训练 AI 模型的理想选择。这些人工视觉数据有助于为罕见事件或安全关键条件等复杂场景构建多样化的数据集。

有时,单一数据类型可能无法在现实情况下提供足够的准确性或背景。这时,多模态传感器融合就变得至关重要。通过将 RGB 与热成像、深度或 LiDAR 等其他数据类型相结合,系统可以克服个体局限性,从而提高可靠性和适应性。

例如,在仓库自动化中,使用 RGB 进行目标识别、深度进行距离测量、热成像进行过热设备检测,可以使操作更高效、更安全。归根结底,最佳结果来自于根据你的应用特定需求选择或组合数据类型。

Link to this section关键要点#

在构建视觉 AI 模型时,选择正确的视觉数据类型至关重要。目标检测、分割和运动跟踪等任务不仅依赖算法,还依赖于输入数据的质量。干净、多样且准确的数据集有助于减少噪声并增强性能。

通过结合 RGB、深度、热成像和 LiDAR 等数据类型,AI 系统可以获得更完整的环境视图,从而在各种条件下更加可靠。随着技术的不断改进,它很可能会引领视觉 AI 在各行各业变得更快、更具适应性和影响力。

加入我们的社区并探索我们的 GitHub 仓库以了解有关计算机视觉的更多信息。在我们的解决方案页面上发现与医疗 AI零售业计算机视觉相关的各种应用。查看我们的许可选项以开始使用视觉 AI。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅