敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024

从可视化到计算机视觉的商业洞察

Abirami Vina

5 分钟阅读

2024年9月19日

了解如何将计算机视觉图像转化为有意义的商业见解。了解如何连接图像和数据之间的点,从而做出更好的决策。

计算机视觉是人工智能 (AI) 的一个子领域,它使机器能够根据视觉数据进行解释和做出决策。当展示计算机视觉应用程序时,它通常包括各种视觉输出,例如带有边界框或分割掩码注释的图像或视频,以突出显示感兴趣的对象。虽然这些视觉效果令人印象深刻,但它们并不总是能清楚地说明它们可以提供哪些可操作的见解。

以一家零售店为例。像 Ultralytics YOLOv8 这样的计算机视觉模型可以用来创建一个热图,显示顾客花费最多时间的地方。可视化效果可能看起来像一张彩色地图,指示大多数顾客倾向于行走或停留的位置。然而,真正获得的洞察力是能够识别出商店中表现不佳的区域。零售商可以利用这种可操作的洞察力来重新安排产品摆放位置、优化货架空间或调整促销展示,以推动更多的顾客参与并增加销售额。 

__wf_reserved_inherit
图 1. 使用 YOLOv8 为零售店创建的热图示例。

计算机视觉的真正价值在于将这些视觉输出转化为有意义的商业洞察,从而直接增强和优化运营,以推动增长和效率。在本文中,我们将探讨计算机视觉可以为企业提供什么,以及它如何对企业的运营产生实际影响。我们还将讨论超越视觉输出,利用可操作的洞察力来推动实际结果的策略。让我们开始吧!

AI中的可视化与洞察:常见的误解

让我们首先了解可视化和洞察之间的区别。在计算机视觉中,像边界框和热图这样的可视化对于理解模型的输出非常重要。这些视觉输出充当了一个垫脚石,用于说明计算机视觉可以做什么和不能做什么。然而,洞察超越了这些视觉效果,并提供了有价值的信息,可用于做出明智的决策、改进流程或更深入地理解模式。它们将原始视觉数据转化为有意义的结论,帮助揭示趋势、预测结果或优化策略。

例如,一个 计算机视觉锻炼监控系统 可能会使用 姿态估计YOLOv8 等模型,通过识别关节和四肢等关键点来跟踪身体运动。视觉输出(如显示人如何运动的动画骨骼)可能看起来很有趣。然而,真正的价值来自于这些数据提供的可量化见解——例如,完成的俯卧撑或深蹲次数、每次锻炼的持续时间、重复动作的一致性以及整个过程中保持的姿势质量。 

教练可以使用这些见解来分析客户的锻炼姿势,发现可能导致受伤的不正确动作,跟踪一段时间内的表现,并了解锻炼习惯。这些见解有助于教练提供更好的反馈,设计更有效的锻炼计划,并帮助客户更安全、更有效地实现他们的健身目标

__wf_reserved_inherit
图 2. 使用 YOLOv8 跟踪身体动作。

通过计算机视觉传递商业价值

随着技术的进步,企业一直在寻找保持竞争优势的方法,而计算机视觉正是一个很好的途径。通过将计算机视觉的洞察力融入到现有的工作流程中,他们可以看到真实的、可衡量的结果

这些见解可以为业务的各个领域提供有价值的信息,例如:

  • 性能指标:突出显示关键绩效指标和模式的定量数据。
  • 趋势分析: 了解客户行为或市场状况随时间推移而出现的新兴趋势和变化。
  • 预测性洞察: 使用过去和实时数据预测未来结果或识别潜在问题。
  • 实时警报:针对需要关注的重要事件、异常或更改的即时通知。

例如,在石油和天然气行业中,传统上使用人工监控或基本传感器系统来检测火炉的火灾或气体泄漏。这些方法通常缺乏及早发现潜在危险所需的速度和精度。计算机视觉可以通过使用摄像头目标检测模型(如 YOLOv8)持续监控火炉,并快速发现异常火焰、过度冒烟或气体泄漏等问题来改进此过程。 

该应用程序的可视化输出可以是图像上的边界框,突出显示检测到火灾的区域。然而,真正的益处在于将这些视觉线索转化为可执行的见解。这些见解有助于查明火灾原因、预测设备问题并规划维护,以防止未来问题的发生。通过利用这些见解,工业企业可以快速应对潜在火灾,避免代价高昂的损失,减少停机时间,并提高安全性和效率。

__wf_reserved_inherit
图 3. 使用 YOLOv8 检测火灾。

基于 AI 的数据驱动决策

来自训练模型的视觉输出可以转化为见解,这些见解被组织到仪表板和数据库中以进行更深入的分析。特别是仪表板可以帮助企业主清楚地了解绩效指标,帮助发现异常情况,并支持基于实时信息的数据驱动决策。

例如,在 交通监控 中,像 YOLOv8 这样的计算机视觉模型可以用来分析实时交通录像,以检测和 跟踪 道路上不同的车辆,如汽车、货车和公共汽车。输出可视化可以显示标记的车辆,并跟踪进出特定区域的车辆数量。此信息也可以显示在仪表板上,该仪表板提供按区域划分的车辆数量细分,并计算关键指标,如车辆总数和平均速度。 

__wf_reserved_inherit
图 4. 使用 YOLOv8 检测和跟踪交通。

这些见解帮助交通管理团队了解交通流量、识别拥堵点、预测交通堵塞,并调整交通信号或路线,以保持交通畅通。通过将视觉数据转化为可操作的见解,该系统帮助城市规划者做出明智的决策,以改善交通流量并减少道路上的问题。

弥合 AI 与业务需求之间的差距

既然我们已经讨论了可操作的计算机视觉洞察的业务影响,现在让我们看看弥合数据可视化和业务洞察之间差距的策略。在开发 AI 解决方案时,这些考虑因素至关重要,因为它们有助于超越简单的计算机视觉任务,从而理解数据中的上下文和关系。深入分析能够创建对业务需求更有意义和更相关的见解。

首先,改善 AI 开发人员和业务领导者之间的沟通至关重要。 AI 开发人员可以与业务利益相关者进行公开讨论,以 了解他们的目标、挑战以及他们希望实现的目标。 通过从企业所有者的角度思考,可以更容易地确定计算机视觉如何直接解决特定问题。 开发人员可以专注于创建解决实际业务需求的计算机视觉应用程序,而不是开发通用解决方案。 

例如,在我们前面讨论的石油和天然气场景中,直接与业务利益相关者沟通可能有助于开发人员了解具体需求,例如根据检测到的火灾的大小和严重程度发送警报。了解这些细节有助于开发人员定制解决方案,优先处理关键警报,确保更快的响应时间并降低风险,从而提高安全性和效率。

__wf_reserved_inherit
图 5. 沟通至关重要。图片来源:Envato Elements。

一旦建立了清晰的沟通,下一步就是关注数据质量和处理。开发人员可以确保用于训练和分析的数据是干净的、一致的,并且与客户的需求相关。简化数据处理可以帮助减少延迟,并提供准确、及时的见解。此外,将计算机视觉系统与现有业务工具集成可以改善决策,并使企业能够快速响应重要的见解。

以下是需要考虑的更多因素:

  • 用户友好的可视化:确保可视化输出简单易懂,方便非技术利益相关者理解。
  • 可扩展性: 设计可以随着业务不断增长的数据需求和运营变化而扩展的 AI 解决方案
  • 实时分析:结合实时数据处理以提供及时的见解,从而可以立即采取行动。
  • 安全和隐私:保护数据完整性和机密性,尤其是在处理敏感信息时。
  • 持续学习和适应:实施持续学习和模型更新机制,以适应不断变化的业务环境和数据模式。

商业计算机视觉的未来

虽然边界框和掩码等可视化输出展示了计算机视觉的功能,但企业需要的不仅仅是可视化表示;他们需要可用于推动决策和运营改进的可操作见解。 通过了解业务目标并将计算机视觉应用于实际问题,开发人员可以提供改进运营、增强客户体验和降低成本的见解。 

为了弥合可视化和可操作的见解之间的差距,开发人员可以与利益相关者清晰地沟通,使用高质量的数据并改进数据处理。这些步骤有助于企业充分利用计算机视觉技术,将见解转化为实际利益。

让我们一起学习和探索!查看我们的 GitHub 存储库,了解我们对 AI 的贡献,并且不要忘记与 我们的社区 互动。 了解我们如何通过尖端 AI 技术重新定义 制造业医疗保健 等行业。

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板