Specialvideo试图为披萨制造商构建一个可靠、高速的质量控制流程,因为人工检查无法跟上每600ms生产一个披萨的速度。
通过集成 Ultralytics YOLO 模型,Specialvideo 的 AI 食品检测系统将检测精度提高到 95% 以上,并将每次披萨的检测时间缩短到 250 毫秒以下。
披萨制造商通常需要高速生产外观精美、质量上乘的产品,但手动检查每个披萨的配料可能非常耗时。Specialvideo 利用视觉 AI 驱动的方法来实时检测和计数配料,使生产商能够坚持配方标准、减少浪费并保持平稳运营。
在测试各种视觉解决方案时,Specialvideo 发现某些技术(如语义分割)难以处理重叠或隐藏的配料。通过使用 Ultralytics YOLO 模型,他们能够克服这些障碍,并开发出可靠、高精度的 AI 驱动的质量控制系统,该系统可以动态识别、计数和验证配料。它确保了始终如一的质量,而不会牺牲生产速度。
Specialvideo 公司于 1993 年在意大利伊莫拉成立,拥有超过 30 年的先进计算机视觉系统设计经验,其应用领域包括机器人引导、自动检测和缺陷检测。他们的专业知识还扩展到食品行业的计算机视觉应用。
特别是,他们开发了一种 视觉 AI 食品检测系统,该系统使用 实例分割 来简化披萨生产。通过将每种配料视为一个不同的对象,该系统可以实时准确地检测、分割和计数配料。它可以解决遮挡(一种配料被另一种配料部分覆盖)和重复检测(系统识别出配料的两个实例,而实际上只有一个)等问题。通过识别放置错误(即配料不平衡),制造商可以相应地调整生产参数。
该模型旨在轻松适应新的成分,并且无需全面改造即可重新训练。
此外,该系统可以检查形状、验证颜色合规性并检测潜在的污染物,从而确保每种产品都符合高安全性和质量标准。
披萨制造商通常以极高的速度运营,每 600 毫秒就生产出一个新的披萨。按照这个速度,人工检查员很难跟上,因此很难准确地监控配料并检测任何缺陷。
此外,像意大利香肠和蘑菇这样重叠的配料会互相遮挡,导致披萨上的配料缺失或过多、分布不均或数量不一致。这不仅会破坏产品的统一性,还会在顾客收到不符合期望的披萨时损害品牌声誉。
与此同时,这些问题导致更高的废品率和资源浪费,从而推高了运营成本。此外,人工检查员在长时间轮班后可能会感到疲劳,导致注意力下降并增加出错的风险。
认识到这些缺陷后,许多制造商现在开始采用计算机视觉支持的质量控制和自动化食品检测系统。 这些创新系统提供实时监督,有助于减少人为错误,同时支持高质量的产出。
Specialvideo的视觉AI解决方案使用Ultralytics YOLO模型的实例分割支持来实时检查每个披萨,以确保只有高质量的产品才能到达消费者手中。它通过将每个披萨与其配方进行比较,准确地计数和测量配料,快速检测缺失或多余的配料、不均匀的分布和不一致的数量。
当检测到有缺陷的披萨时——无论是由于馅料错位、配料量不正确还是蓝色塑料等污染物——系统都会自动将其转移到废料线上。
为了保持部署后的准确性,Specialvideo 不断扩展其数据集,提高标注准确性,并定期重新训练 YOLO。他们在训练期间使用数据增强来防止过拟合,并帮助模型从有限数量的样本中进行泛化。此外,10% 的训练图像以 Margherita 披萨为特色,以提供有用的背景环境,这有助于网络处理同一成分类型内的变化,例如不同种类的意大利香肠。
除此之外,为了使重新训练过程更加高效,Specialvideo 已经为新的披萨配料实施了一个工作流程。该工作流程利用 YOLO 来加速新图像的标记,从而减少了对人工监督的需求,因为配料种类在不断变化。

Specialvideo选择使用Ultralytics YOLO模型,因为它们在AI模型性能和成本之间提供了很好的平衡。借助Nvidia GTX-1660gt GPU(图形处理单元),该系统实现了仅200 - 250ms的推理时间,使其速度足够快,可以处理每600ms生产一个披萨的生产线。
YOLO高效的处理速度有助于实现实时质量控制。总的来说,这种方法不仅简化了生产流程,还支持可扩展性,使其成为高产量食品制造环境中一个强大的解决方案。
通过集成 Ultralytics YOLO 模型,Specialvideo 的 AI 食品检测解决方案改变了披萨生产中的质量控制。该模型在超过 1,500 张图像的强大数据集上进行了训练,可以准确识别 10 多种不同的配料,将它们分为可计数项目(如橄榄、萨拉米香肠片、凤尾鱼和马苏里拉奶酪球)和不可计数项目(如火腿丁、蘑菇、奶酪片和辣椒)。
YOLO 驱动的系统以高达 99% 的准确率实时运行,优于人工检测员,并且与手动方法相比,显著减少了检测时间。
有趣的是,该解决方案已展示出良好的效果,能够准确识别未包含在初始训练中的食品成分,例如沙拉和意大利面,从而更容易扩展到新的产品线。最终,这种创新方法提高了运营效率,最大限度地减少了浪费并降低了成本,为自动化食品检测和质量保证树立了新的基准。
Specialvideo 的前景令人期待。该公司计划扩展其视觉人工智能解决方案,以涵盖其他食品,如沙拉和意大利面。通过不断微调其深度学习模型并扩大其数据集,Specialvideo 旨在进一步提高实时质量控制,减少浪费并提高生产效率。这些改进将有助于树立新的行业标准。
想要通过视觉人工智能来提升您的运营吗? 请访问我们的 GitHub 仓库,了解 Ultralytics 的 AI 解决方案如何在医疗保健领域的人工智能和制造业中的计算机视觉等领域产生影响。 查找有关我们的 YOLO 模型和许可选项的详细信息,并朝着更智能、更高效的自动化迈出第一步。
Ultralytics YOLO 模型是为分析来自图像和视频输入的视觉数据而开发的计算机视觉架构。这些模型可以针对包括对象检测、分类、姿态估计、跟踪和实例分割在内的任务进行训练。Ultralytics YOLO 模型包括:
Ultralytics YOLO11 是我们计算机视觉模型的最新版本。与之前的版本一样,它支持视觉 AI 社区一直以来所喜爱的关于 YOLOv8 的所有计算机视觉任务。然而,新的 YOLO11 具有更高的性能和准确性,使其成为一个强大的工具,也是应对现实世界行业挑战的完美盟友。
您选择使用的模型取决于您的具体项目要求。关键是要考虑到性能、准确性和部署需求等因素。以下是一个快速概览:
Ultralytics YOLO 仓库(如 YOLOv5 和 YOLO11)默认在 AGPL-3.0 许可下分发。这种经 OSI 批准的许可专为学生、研究人员和爱好者设计,旨在促进开放协作,并要求任何使用 AGPL-3.0 组件的软件也必须开源。虽然这确保了透明度并促进了创新,但它可能与商业用例不符。
如果您的项目涉及将 Ultralytics 软件和 AI 模型嵌入到商业产品或服务中,并且您希望绕过 AGPL-3.0 的开源要求,那么 企业许可证 是理想的选择。
企业许可证的优势包括:
为了确保无缝集成并避免 AGPL-3.0 约束,请使用提供的表格申请 Ultralytics 企业许可证。我们的团队将协助您根据您的特定需求定制许可证。