探索使用 Ultralytics YOLO11 进行各种计算机视觉应用时,实时推理和批量推理之间的区别。

探索使用 Ultralytics YOLO11 进行各种计算机视觉应用时,实时推理和批量推理之间的区别。
如果您见过自动驾驶汽车,您就见证了实时AI推理的实际应用。自动驾驶汽车通常使用摄像头、传感器和AI来处理周围环境并做出近乎即时的决策。但是,当不需要快速响应时,实时推理可能会消耗大量资源。
在这些情况下,更好的选择是批量推理。 批量推理不是实时连续处理数据,而是可以按计划的时间间隔处理大量数据集。 这种方法有助于节省资源、降低功耗并减少基础设施成本。
例如,在计算机视觉应用中,像Ultralytics YOLO11这样的模型可以用于实时任务,如物体检测和实例分割。然而,实时处理大量的视觉数据可能要求很高。
通过批量推理,YOLO11可以批量处理视觉数据,从而减轻系统压力并提高效率,而不会牺牲性能。这使得大规模部署视觉AI解决方案变得更容易,而不会使硬件不堪重负或增加成本。
在本文中,我们将探讨批量推理、它的优势,以及如何将使用 YOLO11 进行批量推理应用于计算机视觉应用。让我们开始吧!
您可以将批量推理理解为一次性处理一项大型任务,而不是像处理单个任务那样逐个处理。批量推理允许您以设定的时间间隔处理大量数据,而不是持续实时地处理数据。当不需要立即响应时,这种方法效率更高,有助于节省计算资源、减少能源消耗并降低成本。
在计算机视觉方面,在某些应用中,低延迟至关重要。低延迟是指接收输入(例如图像或视频帧)与系统响应之间的最小延迟。例如,在实时安全监控中,即使是很小的延迟也可能导致安全风险。
然而,在许多其他计算机视觉场景中,低延迟并不那么重要。 这就是批量推理的优势所在 - 当系统不需要立即做出反应时。 批量推理的工作原理是将视觉数据以组或批次的形式馈送到计算机视觉模型,使系统能够一次处理大型数据集,而不是连续实时地处理。
以下是批量推理所涉及步骤的详细介绍:
既然我们已经了解了什么是批量推理以及它与实时推理的区别,接下来让我们仔细看看何时使用它。
批量推理非常适合分析历史数据。 假设您有过去一个月来自 地铁站 的监控录像,并且您正在尝试识别特定模式,例如在一天中不同时间进入和退出的人数。
批量推理允许您批量处理整个月的录像,而不是实时处理每一帧,从而识别关键事件或趋势,而无需立即获得结果。这样,您可以更有效地分析大量数据,并深入了解长期模式,而不会使系统不堪重负或需要持续监控。
当系统资源有限时,批量推理也是一个最佳解决方案。 通过在非高峰时段(例如夜间)运行推理,您可以节省计算成本,并确保系统在高峰使用时段不会过载。 这使其成为需要处理大型数据集但不需要实时分析的企业或项目的有效且经济高效的方法。
Ultralytics Python 包支持 YOLO11 等模型的批量推理。使用 YOLO11,您可以通过指定“batch”参数轻松运行批量推理,该参数确定一次处理多少图像或视频帧。
在批量推理过程中,预测是同时为批次中的所有图像生成的。默认情况下,批量大小设置为 1,但您可以将其调整为您喜欢的任何数字。
例如,如果批量大小设置为 5,则 YOLO11 将一次处理五个图像或视频帧,并一次性生成所有五个图像或视频帧的预测。较大的批量大小通常会导致更快的推理时间,因为批量处理多个图像比单独处理它们更有效。
接下来,让我们探讨一些用于批量推理的真实世界计算机视觉用例。
在医学研究中,处理大量的视觉数据非常常见。在这里,批量推理可以帮助科学家更轻松地分析化学、生物学和遗传学等领域的数据。数据不是一次分析一个,而是分批处理,从而节省时间和精力。
例如,在医疗机构中,批量推理对于分析大量的医学图像(如MRI或CT扫描)尤其有用。医院可以全天收集这些扫描结果,并在夜间批量处理。
这种方法使医院能够更好地利用其硬件和员工,降低运营成本,并确保以一致和统一的方式审查所有扫描结果。它还有利于大型研究项目和长期研究,在这些项目中,处理大量数据是必要的。
自动驾驶汽车使用 计算机视觉 等 AI 技术来处理周围的世界。借助 YOLO11 等高级模型,车载系统可以识别其他车辆、车道线、道路标志和街道上的人。虽然实时推理在道路上至关重要,但自动驾驶技术在幕后也严重依赖批量推理。
汽车完成行程后,它可以批量处理收集到的数据,例如摄像头拍摄的视频、传感器读数和激光雷达扫描数据。这使得工程师可以更新汽车的 AI 模型,提高系统安全性,并增强其处理各种驾驶条件的能力。
批量推理也用于自动驾驶模拟,以测试自动驾驶汽车在不同情况下的反应,例如在繁忙的十字路口导航或对不可预测的行人移动做出反应。 这种方法节省了时间,降低了成本,并避免了在现实生活中测试每种场景所带来的风险。
同样,对于零售商店而言,使用 YOLO11 等计算机视觉模型进行批量推理可以显着提高运营效率。例如,商店中的摄像头系统可以全天捕获数千张图像,然后可以在夜间批量处理这些图像。
这使得商店能够分析商店中发生的事情,例如客户行为、客流量模式和产品互动,而无需实时处理,这对于较小的商店来说可能具有挑战性。
另一个有趣的例子是使用批量推理来生成热图,从而可视化商店内客户活动的高低区域。通过分析这些 热图,零售商可以确定哪些区域最能吸引客流量,以及商店的哪些部分可能需要更多关注或产品摆放优化。这些数据可以帮助零售商在商店布局、产品定位,甚至促销策略方面做出更好的决策,从而改善客户体验和销售额。
以下是批量推理可以为各行各业带来的一些主要好处:
虽然使用批量推理有很多优点,但也需要考虑一些局限性。以下是一些需要记住的因素:
批量推理是处理不需要立即结果的大量视觉数据的有效方法。 它不是实时分析每个图像,而是在预定的时间(如夜间)分批处理它们。
这种方法经济高效,降低了计算负载,并且仍然提供准确的结果。从帮助商店管理库存到协助医生进行医学扫描分析,再到增强自动驾驶汽车技术,批量推理使计算机视觉更易于访问、负担得起且适用于实际应用。
准备好深入探索人工智能了吗?浏览我们的 GitHub 仓库,与 我们的社区 建立联系,并查看 我们的许可选项,开始您的计算机视觉之旅。在我们的解决方案页面上了解更多关于 制造业中的人工智能 和 物流业中的计算机视觉 等创新。