SOHGA 借助 Ultralytics YOLO 将停车场监控时间缩短了 30%
了解 SOHGA 的 MEGURU 系统如何使用 Ultralytics YOLO26 实现停车场巡逻自动化,将巡逻时间缩短 30%,并提升安全性。

Problem
日本的停车场巡逻要求工作人员目视核实车辆内部,这是一项需要持续专注力的任务,且专注力会在 15 到 20 分钟内下降。这是一个容易出错的过程,可能会导致滞留人员未被发现,从而使生命安全处于风险之中。
Solution
SOHGA 开发了由 Ultralytics YOLO26 提供支持的移动巡逻系统 MEGURU,使停车场工作人员能够在走过停放的车辆时近乎瞬时地扫描车牌。MEGURU 标准化了该流程并缩短了巡逻时间。
在日本的各个行业中,停车场巡逻是一项常规但工作量繁重的任务。对于医疗保健等特定行业,停车场巡逻往往是必要要求。例如,医院需要确保通道畅通以便救护车和轮椅使用者通行,而其他行业则需要检查停车场内是否有无人看管的滞留人员。对于每天需要进行多轮巡逻的物业人员来说,持续跟踪每一辆车确实是一项严峻的运营挑战。
SOHGA Co. 开发了 MEGURU 来解决这一问题。MEGURU 由 Ultralytics YOLO26 提供支持,是一个移动车牌识别系统,能帮助巡逻人员实时跟踪停车场内的每一辆车,并通过智能手机发出的简单音频反馈,自动区分已检查和未检查的车辆。
Link to this section利用计算机视觉辅助停车场巡逻#
SOHGA 的 MEGURU 系统围绕一个简明的工作流程设计。工作人员只需携带一部安装在自拍杆上的 iPhone,以正常步速穿过停车场。当他们经过每辆车时,系统会实时扫描车牌并发出音频提示:一种声音代表尚未登记的新车,另一种不同的声音代表已检查过的车辆。
这种以音频为先的设计是刻意为之的。巡逻人员不仅要记录车牌,还要通过车窗查看车内情况。通过声音而非屏幕显示来提供反馈,MEGURU 能让工作人员将注意力集中在车辆本身,而不是设备上。新车牌的处理是瞬时的,允许工作人员每 2-3 秒就能从一辆车移动到下一辆车。在巡逻人员走动时,MEGURU 能实时跟上其步调,在不打断视觉关注的情况下高效提供音频提示。
该系统目前已在日本东部的 112 个客户处部署,在 147 台设备上运行,平均将巡逻时间缩短了约 30%。在最显著的记录案例中,原本需要两小时的巡逻在 40 分钟内即可完成。
Link to this section移动设备上进行车牌识别的挑战#
在受控的静态环境中进行可靠的车牌识别是一个众所周知的问题。但在穿过停车场的移动手持智能手机上执行此操作则复杂得多。当巡逻人员走动时,设备会抖动,视角会随车辆而变化,照明条件也会发生改变,车牌的距离和角度也各不相同。这些情况会导致运动模糊和画面不一致,使标准的 OCR 方法变得不可靠。
SOHGA 在开发过程中评估了 OCR,发现它经常对视觉上相似的字符产生误读。对于一个依赖准确识别车牌的系统来说,这是一个严重的问题。日本车牌使用定义的字符集,而不是开放字符集,这指引我们采取更有针对性的方法:仅对车牌中可能出现的字符进行检测模型训练,而不是依赖通用的文本识别系统。
这种方法还使模型对扫描环境的物理现实更具鲁棒性。由于训练数据反映了运动模糊、倾斜和多变光照等真实世界条件,模型学会了处理这些变化,而不会被它们所干扰。
Link to this sectionSOHGA 如何使用 Ultralytics YOLO26#
MEGURU 的视觉流程串联使用了两个 Ultralytics YOLO 模型:
车牌检测。 第一个模型定位每个摄像画面中的车牌。它在 iPhone 上以每秒 10 帧的速度运行,在设备经过每辆车时,持续识别包含车牌的图像区域。
字符识别。 第二个模型获取裁剪后的车牌区域并识别每个字符。由于它是针对日本车牌使用的字符集专门训练的,因此在受限的检测空间内运行,与通用 OCR 相比提高了准确性。为了处理运动引起的帧间差异,系统在确认读数之前会对多个帧进行多数投票机制判定。
YOLO 的速度和可训练性是使其成功的关键。在商用智能手机上实时运行推理需要一个既准确又轻量级的模型。通过领域特定数据集进行训练,而不是依赖现成的 OCR 模型,使 SOHGA 能够掌控性能调优以适配其具体用例。这使得车牌识别近乎瞬时完成,2-3 秒的时间窗口恰好对应操作员在车辆间的步行步调,MEGURU 能够跟上这种速度,无需巡逻人员等待即可实时提供音频提示。
Link to this section为何选择 Ultralytics YOLO 模型?#
Ultralytics YOLO 模型提供了 MEGURU 所需的实时性能与训练灵活性的结合。该系统在标准 iPhone 而非专用硬件上运行,需要一个能在两阶段流程中以 10 FPS 提供准确推理的模型,这涵盖了检测和字符识别,且无需依赖 GPU 或云连接。YOLO 的高效架构使这一切成为可能。
针对特定领域数据集进行训练的能力同样重要。日本车牌使用受限的字符集,专门针对这些字符训练模型,而不是使用通用文本识别系统,这为 SOHGA 提供了更可靠、更准确的字符检测基础。同样的训练过程还使模型能够适应巡逻环境的真实条件:运动模糊、倾斜角度和多变光照。
SOHGA 还发现了巡逻质量方面的意外益处。在受控试验中使用脑电波监测设备后,他们发现没有使用 MEGURU 的人员在巡逻时只能维持约 10 到 15 分钟的专注力。而借助 MEGURU 提供的持续音频反馈并省去了手动记录车牌的需求,工作人员能够将专注力保持长达一小时,这恰好是完整巡逻周期的时间。
Link to this section在全日本扩展巡逻业务#
MEGURU 目前已在日本东部的 100 多个客户处部署,拥有 140 多台活跃设备。该系统服务于两个主要客户群体,每个群体都利用它来满足特定的运营需求。
医院: 医院通道上的违规停车车辆可能会阻塞救护车路线并阻碍轮椅通行。MEGURU 帮助医院巡逻人员更高效地识别和记录违规车辆。
弹珠机厅: 日本法规要求弹珠机营业场所巡逻停车场,并检查是否有无人看管的人员或被遗留在车内的儿童。MEGURU 为巡逻人员提供了一种一致且结构化的方式来记录停车场内的每辆车并确保不遗漏任何一辆,从而取代了难以核实或标准化的手动流程。MEGURU 的核心功能是提供一种简单的方法来区分已检查和未检查的车辆,减轻工作人员的注意力疲劳并提高车内检查的有效性,最终有助于挽救生命。
另一个实际应用是解决未经授权的停车问题。长期以来,那些反复使用停车场却不是弹珠机顾客的车辆一直是一个难以有效管理的顽固问题。通过分析停车模式,可以清楚地识别这些车辆,据反馈,发出警告已将重复违规行为降至零。
图 1. 正在被 MEGURU 分析的车牌。
除了核心的巡逻用途外,SOHGA 还将 MEGURU 的能力扩展到了访客分析领域。由于日本车牌包含车辆的注册地信息,且根据日本法律车牌数据不被归类为个人信息,客户可以使用 MEGURU 的记录来了解访客从哪里来、停留多久以及回访频率。
Link to this section为停车场巡逻带来结构性和一致性#
MEGURU 解决了一个直观的运营问题:如何确保停车场内的每一辆车都经过检查,并以一种实用、可扩展的方式解决了它。通过在标准 iPhone 上运行两个 Ultralytics YOLO26 模型,SOHGA 构建了一个能够在活跃停车场的真实条件下工作的系统。
结果是可以衡量的。在各部署点,巡逻时间平均缩短了 30%,工作人员能够在整个巡逻周期内保持持续的专注力。凭借在日本东部部署的 100 多家客户和 140 多台设备,MEGURU 是计算机视觉模型如何在城市中发挥积极作用以监控安全,并成为停车场管理可靠工具的绝佳例证。
对视觉 AI 感兴趣吗?了解我们的 许可选项 以将计算机视觉引入您的项目。访问我们的 GitHub 仓库 并加入我们的社区。






