遇见 YOLO26: 下一代视觉 AI。
Ultralytics
Back to customer stories
商业与专业服务文档分析与符号识别

Prezent 使用 Ultralytics YOLO 将幻灯片检测准确率提高了 34%

Prezent 使用 Ultralytics YOLO 将幻灯片检测准确率提高了 34% logo

了解 Prezent 如何利用 Ultralytics YOLO 模型自动化幻灯片元素检测,在保持结构和设计的同时将处理时间缩短至 10 秒以内。

Prezent 使用 Ultralytics YOLO 将幻灯片检测准确率提高了 34%

Problem

Prezent 需要一种视觉 AI 解决方案来自动检测幻灯片结构,因为传统工具速度慢、不可靠,且往往无法保留设计。

Solution

借助 Ultralytics YOLO 模型,Prezent 将准确率从 65% 提高到 87%,训练时间从 3 天缩短至 1 天,并将幻灯片处理时间缩短至 10 秒以内。

演示文稿是商务会议中进行清晰沟通的关键,但要将其重新设计得既有影响力又具信息量可能具有挑战性。Prezent 使用 AI 检测并理解标题、文本、图像和图表等幻灯片元素,确保重新设计后的幻灯片保持清晰、引人入胜且易于理解。

在测试用于检测幻灯片元素的各种工具时,Prezent 发现许多工具会破坏布局和信息层级,导致演示文稿不够连贯。通过集成 Ultralytics YOLO 模型,Prezent 简化了流程,使幻灯片元素检测更快捷、更顺畅、更专业,且只需极少的人工投入。

Link to this section利用 AI 让幻灯片重新设计更快速、更智能#

Prezent 通过自动化重新设计流程,帮助企业高管和业务团队制作清晰、专业的演示文稿。最初,这依赖于手动模板和人工操作,既缓慢又低效。

为了提高效率,Prezent 转向 AI 和 computer vision 来自动进行幻灯片格式化,同时保留原始布局。通过使用 object detection 模型,他们的平台现在可以自动检测并整理幻灯片内容,从而以最少的用户输入实现更快、更无缝的重新设计过程。通过这样做,Prezent 确保了演示文稿保持清晰、美观且易于理解。

Link to this sectionAI 驱动的幻灯片重新设计中的障碍#

优秀的演示文稿不仅仅关乎信息,更关乎清晰度、结构和影响力。然而,手动重新设计幻灯片以使其更具吸引力需要耗费大量时间和精力。对于经常依赖演示文稿开会的企业高管和业务团队而言,缓慢且令人沮丧的重新设计过程是一个重大挑战。

Prezent 着手自动化幻灯片重新设计,但遇到了一个关键障碍——如何在保持原有布局的同时检测并重组幻灯片元素?传统工具可以提取文本,但无法识别标题、图像和图表的排列方式,往往会破坏布局。

起初,Prezent 使用了开源目标检测模型,但这些方法存在局限性:准确率低(60-65%)、处理时间长,且布局仍需人工修正。为了真正实现流程自动化,Prezent 需要一种更快、更智能的视觉 AI 解决方案,能够在不破坏结构的情况下准确检测幻灯片元素并进行重新设计。这时,他们转向了计算机视觉和 AI,使整个过程变得无缝衔接。

Link to this sectionPrezent 用于幻灯片元素检测的视觉 AI 解决方案#

为了在保持布局完整的同时自动化幻灯片重新设计,Prezent 将 Ultralytics YOLO 模型集成到了其平台中。Ultralytics YOLO 模型支持各种 computer vision tasks,包括目标检测。幻灯片被转换为图像,YOLO 会检测关键元素(标题、文本框、图像和图表),同时保持原始布局完好无损。

YOLO 在布局提取中发挥了关键作用,帮助 Prezent 保留每张幻灯片的结构和层级,同时实现快速、自动化的重新设计。通过识别文本和视觉元素,YOLO 有助于确保演示文稿既保持功能性又具备精美的设计。凭借高准确率和快速处理能力,YOLO 使 Prezent 能够自动化检测幻灯片元素,减少了对人工调整的需求。

Link to this section为何选择 Ultralytics YOLO 模型?#

Prezent 选择 Ultralytics YOLO 模型是因为与其他视觉 AI 模型相比,它们训练速度更快、准确率更高,且延迟更低。Prezent 发现大多数模型需要两到三天的时间来训练,这拖慢了迭代和改进的步伐。

“通常情况下,训练机器学习模型需要花费大量时间,你往往需要等待两到三天才能完成推理,然后决定准确率是否足够好。但使用 YOLO,我们可以在一天内训练模型,快速做出决策,并从结果中迅速学习,”Prezent 的首席数据科学家说道。

借助 YOLO,Prezent 的准确率从 65% 提高到了 87%,并能够快速优化模型和提升性能。此外,YOLO 的快速推理速度使得幻灯片处理可在 10 秒内完成,保证了实时自动化和无缝的用户体验。通过集成 YOLO,Prezent 找到了一种可靠、可扩展的解决方案,实现了高效且准确的幻灯片重新设计。

Link to this section使用 YOLO 在 10 秒内处理幻灯片#

通过利用 Ultralytics YOLO 模型,Prezent 将其幻灯片重新设计流程重新定义为更快速、更高效且高度准确。自动检测和组织幻灯片元素的能力确保了演示文稿在无需人工干预的情况下保持了原始结构、清晰度和视觉吸引力。

“使用 Ultralytics YOLO,处理速度也更胜一筹,因为我们可以在 10 秒内为客户提供完全处理好的幻灯片。快速的训练时间和低延迟是简化工作流程和提高重新设计质量的关键,”Prezent 的首席数据科学家分享道。

凭借 YOLO 的实时处理能力,Prezent 能够完全自动化幻灯片布局检测,消除了手动重新设计的低效问题。企业高管和业务团队可以立即生成精美、专业的演示文稿,从而提高工作效率和用户体验。通过集成计算机视觉和 AI,Prezent 构建了一个可扩展的自动化解决方案,提升了生产力和演示文稿的质量。

Link to this section计算机视觉在文档分析领域的未来之路#

Prezent 希望看到计算机视觉模型在处理更复杂布局的能力上得到提升,并能为文档结构提供更深层次的洞察。这将助力实现更精细、更准确的幻灯片重新设计。

一个潜在的改进方向是将相关元素分组为子类别的能力。这样的洞察将有助于视觉 AI 模型理解幻灯片组件之间的层级和关系。最终,重新设计后的幻灯片将结构更佳、视觉上更连贯且更易于遵循。

总的来说,Prezent 相信随着自动化和 AI 驱动解决方案需求的增加,计算机视觉模型将持续演进,以更高的准确率和速度处理更复杂的任务。

好奇视觉 AI 如何提升你的业务吗?访问我们的 GitHub repository 查看 Ultralytics 针对不同行业的 AI 解决方案,例如 computer vision in healthcaremanufacturing。了解我们的 YOLO 模型和 license options 如何帮助你立即开始!

Our solution to your industry

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

常见问题解答

  • Ultralytics YOLO 存储库默认在 AGPL-3.0 许可证下分发。这种经 OSI 批准的许可证专为学生、研究人员和爱好者设计,旨在促进开放式协作,并要求任何使用 AGPL-3.0 组件的软件也必须开源。虽然这确保了透明度并促进了创新,但它可能不符合商业用例的需求。

    如果你的项目涉及将 Ultralytics 软件和 AI 模型嵌入商业产品或服务,并且你希望绕过 AGPL-3.0 的开源要求,那么 企业许可证 (Enterprise License) 是理想选择。

    企业许可证的优势包括:

    • 商业灵活性: 修改并将 Ultralytics YOLO 源代码和模型嵌入到专有产品中,无需遵守 AGPL-3.0 要求将项目开源。
    • 专有开发: 获得充分的自由来开发和分发包含 Ultralytics YOLO 代码和模型的商业应用程序。

    为确保无缝集成并避免 AGPL-3.0 的约束,请使用提供的表格申请 Ultralytics 企业许可证。我们的团队将协助你根据特定需求量身定制许可证。

  • 你选择的模型取决于你的项目需求,包括性能、精度、部署目标和硬件限制。对于大多数新项目,推荐从 Ultralytics YOLO26 开始,因为它在速度、精度、可导出性和多任务支持方面提供了最新的改进。

    早期 YOLO 模型系列仍可供具有现有工作流或兼容性要求的团队使用。

    如果你是全新开始,请先选择 YOLO26,然后通过基准测试较小或较大的变体,找到适合你部署环境的速度与精度平衡点。

  • Ultralytics YOLO 模型是一个用于目标检测、分割、分类、姿态估计和旋转目标检测等任务的计算机视觉模型系列。YOLO26 是最新的稳定版本,推荐用于大多数新项目。早期 YOLO 版本仍可供具有现有工作流或兼容性要求的团队使用。

  • Ultralytics YOLO 模型是为分析图像和视频中的视觉数据而开发的计算机视觉架构。这些模型可以针对包括目标检测、分类、姿态估计、追踪、实例分割和旋转目标检测在内的多种任务进行训练。

    最新的 Ultralytics YOLO 模型系列是 YOLO26,同时也提供早期 YOLO 版本以适配现有工作流。

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅