遇见 YOLO26: 下一代视觉 AI。
Ultralytics
活动

Ultralytics 在 YOLO Vision 2025 上的主要亮点!

加入我们,回顾 Ultralytics 年度盛会,了解 Ultralytics YOLO26 发布会、鼓舞人心的专题讨论以及社区亮点。

ABAbirami Vina
5 min read
YOLO Vision 2025 亮点

AI 和计算机视觉社区于 9 月 25 日齐聚一堂,参加了 Ultralytics 的年度混合视觉 AI 活动——YOLO Vision 2025 (YV25)。该活动在伦敦的 The Pelligon 举办,并向全球同步直播。活动汇集了来自世界各地的研究人员、工程师和 AI 爱好者,大家在此交流想法并了解最新创新成果,例如 Ultralytics YOLO26

该活动已举办至第四届,其影响力和覆盖范围持续扩大。YV25 直播目前的观看次数已超过 6,800 次,产生超过 49,000 次展示,累计观看时长近 2,000 小时。

YV25 在主持人 Oisin Lunny 的开场致辞中拉开序幕,他鼓励参会者积极交流、分享并充分利用此次活动,为全天活动定下了基调。正如他所言:“YOLO Vision 2025 是一个团结开源视觉 AI 社区的会议,旨在聚焦数据、机器学习和计算机视觉的进步。”

在本文中,我们将回顾 YOLO Vision 2025 的主要亮点,包括产品发布、主题演讲、专题讨论、现场演示以及那些让这一天变得特别的社区时刻。让我们开始吧!

Link to this section从单块 GPU 到 3000 万美元的 A 轮融资#

活动开始前,新产品发布引起了广泛关注,我们的创始人兼 CEO Glenn Jocher 以此为契机,进一步点燃了全场的氛围。

他分享了 Ultralytics 的成长历程,回忆起 2020 年时,他还在用连接在 MacBook 上的单块 1080 Ti 进行实验,这种配置在今天看来早已过时。从那时的简陋起步,Ultralytics 现已成长为一个全球性社区,每天由 YOLO 模型驱动的推理次数高达数十亿。

Glenn 还谈到了 Ultralytics 最近完成的 3000 万美元 A 轮融资。他解释了这笔投资将如何助力公司的下一阶段增长,使团队能够扩大规模、推进研究,并获得持续突破计算机视觉边界所需的计算资源。

Link to this sectionUltralytics YOLO26:一款更好、更快、更小的 YOLO 模型#

Glenn 随后宣布了 Ultralytics 的两项新举措。第一项是 Ultralytics YOLO26,这是 Ultralytics YOLO 家族的最新成员,旨在实现更小、更快、更高效的同时,达到更高的精度。第二项是 Ultralytics Platform,这是一个全新的端到端 SaaS 工作区,集数据、训练、部署和监控于一体,旨在让构建计算机视觉解决方案变得前所未有的简单,预计将于不久的将来发布。

Glenn Jocher 在 YOLO Vision 2025 的舞台上发布 Ultralytics YOLO26

图 1. Glenn Jocher 在 YOLO Vision 2025 舞台上宣布 Ultralytics YOLO26。

YOLO26 的设计初衷是在推动性能提升的同时,保持在现实场景中的实用性。其最小版本在 CPU 上的运行速度提升了多达 43%,且精度有所提高,使其非常适合从移动设备到大型企业系统的各类应用。YOLO26 将于 10 月底公开可用。

以下是 YOLO26 的关键特性预览:

  • 精简架构:移除了此前会导致模型速度变慢的 Distribution Focal Loss (DFL) 模块。YOLO26 现在运行效率更高,且不会牺牲精度。
  • 更快的预测:YOLO26 引入了一个跳过 Non-Maximum Suppression (NMS) 步骤的选项,使其能更快地交付结果,从而促进实时部署。
  • 更好的小目标检测:全新的训练方法提高了模型稳定性,并显著提升了精度,特别是在检测复杂场景中的微小细节时。
  • 更智能的训练:全新的 MuSGD 优化器结合了两种训练技术的优势,帮助模型学习得更快并达到更高的精度。

Link to this sectionUltralytics 平台初探#

在介绍完 YOLO26 后,Glenn 邀请了我们的产品工程主管 Prateek Bhatnagar 上台,演示了即将到来的下一个项目——Ultralytics Platform。该平台旨在简化整个计算机视觉工作流,将数据集、标注、训练、部署和监控集中于一处。

Prateek 将其比作汽车维修:无需分别去不同的商店维修轮胎、引擎和变速箱,在同一个车库里即可完成所有工作。同样地,该平台为开发者提供了一个集成的工作区,用于管理视觉 AI 模型的完整生命周期。

演示展示了加速数据集准备的 AI 辅助标注工具、面向专家和初学者的可自定义训练选项,以及对训练过程的实时监控。

Link to this section关于边缘部署的专题讨论见解#

YV25 的另一个亮点是关于边缘部署的专题讨论,由 Oisin Lunny 主持。参与讨论的嘉宾包括来自索尼半导体解决方案公司的 Yuki Tsuji、来自 Raspberry Pi 的 David Plowman 以及 Glenn Jocher。

讨论探讨了将 AI 移至边缘端如何减少延迟、降低成本并改善隐私保护。Yuki 展示了索尼的 IMX500 传感器,该传感器可直接在芯片上进行推理。同时,David 谈到了 Raspberry Pi 如何从其创客根基向大规模商业应用领域扩展。

一场关于边缘部署的小组讨论,嘉宾包括 Oisin Lunny、Yuki Tsuji、David Plowman 和 Glenn Jocher

图 2. 关于边缘部署的专题讨论,嘉宾包括 Oisin Lunny、Yuki Tsuji、David Plowman 和 Glenn Jocher。

讨论还涉及开发者面临的最大障碍之一:让模型在不同设备上平稳运行。这就是 Ultralytics Python 软件包发挥关键作用的地方。

凭借其广泛的导出选项,它简化了将已训练模型投入生产环境的过程,无论是移动设备、嵌入式系统还是企业级硬件。通过减轻模型转换的负担,Ultralytics 帮助团队专注于构建解决方案,而无需纠结于兼容性问题。

正如 David 所解释的那样:“我从痛苦的经历中知道转换模型是一件糟糕的事,如果有人能帮我代劳,生活就会轻松得多。这就是 Ultralytics 真正改进的地方,它为我们的用户提供了非常有价值的东西。”

Link to this section加速创新与 AI 硬件#

AI 软件的进步与硬件的发展齐头并进,它们共同推动了计算机视觉的新一波创新浪潮。虽然像 Ultralytics YOLO 这样的模型不断提升精度,但其现实世界的应用影响也取决于它们所运行的平台。

例如,Seeed Studio 展示了其预装了 Ultralytics YOLO 模型的模块化、低成本硬件(如 reCamera 和 XIAO 板)如何使开发者能够轻松地从原型制作过渡到现实世界的 AI 系统。这种硬件与软件的集成降低了入门门槛,并展示了硬件层面的创新如何直接加速技术落地。

以下是其他 YV25 主题演讲的一些关键收获,强调了软硬件协同设计如何开启无限可能:

  • 量化带来巨大的速度提升:Intel 展示了通过量化技术将 Ultralytics YOLO 模型转换为 OpenVINO 如何在短短 30 分钟内将推理速度从 54 FPS 提升至 606 FPS,突显了优化的威力。
  • 全栈工具使边缘 AI 部署切实可行:NVIDIA 强调了 Jetson 设备、TensorRT、Triton Inference Server 和 DeepStream SDK 如何协同工作,以简化高性能视觉 AI 在边缘端的部署。
  • 开放生态加速原型设计:AMD 强调了其基于 GPU 和 ROCm 软件栈构建的端到端平台,帮助开发者在控制成本的同时,快速从原型转入部署阶段。
  • 低功耗芯片将 AI 扩展至受限设备:DEEPX 推出了其 DX-M1 和 DX-M2 处理器,可在 5 瓦以下提供数十 TOPS 的算力,从而实现在紧凑、功耗受限的系统中进行高级推理。

Link to this section计算机视觉的最新趋势#

随着软硬件的共同进步,计算机视觉的演进速度比以往任何时候都快。这些平行发展不仅提高了精度和速度,还塑造了视觉 AI 如何在现实世界中部署。在 YV25 上,参会者有机会听取来自机器人技术、边缘部署和多模态 AI 等领域的专家意见,每个人都对该领域的发展方向提供了不同的视角。

例如,来自 D-Robotics 的 Michael Hart 在演讲中演示了如何将 Ultralytics YOLO 模型与他们紧凑的 RDK X5 开发板(一种小型嵌入式 AI 视觉模块)结合,使机器人能够实时运行先进的视觉模型。他的现场演示展示了机器人技术的巨大进步,已从实验室实验演变为实用的 AI 驱动系统。

Michael Hart 强调 AI 赋能的机器人如何依赖计算机视觉

图 3. Michael Hart 强调了当今 AI 赋能的机器人如何依赖计算机视觉。

同样,来自 Axelera AI 的 Alexis CrowellSteven Hunsche 强调了在边缘端部署视觉 AI 的挑战与机遇。通过现场演示,他们解释了 Axelera AI 的 Metis AI 处理单元 (AIPU) 如何将 RISC-V 和数字内存计算相结合,以极低的功耗提供高性能。该平台采用 M.2 和 PCIe 等常见的封装形式,通过软硬件协同设计,使边缘 AI 的扩展变得既实用又高效。

在另一场会议中,来自 Hugging Face 的 Merve Noyan 探讨了多模态 AI 的兴起,即模型如何将视觉与文本、音频及其他输入相结合。她谈到了从文档分析到具身智能体的各种用例,强调了开源创新如何加速 AI 的采用。

Link to this section平衡技术进步与人类价值观#

YV25 不仅有鼓舞人心的大局演讲,还包含深度实用的环节。来自 Lightning AI 的 Jiri Borovec 进行了实操演练,展示了如何使用 PyTorch Lightning 和多 GPU 支持来训练和微调 Ultralytics YOLO 模型。

他展示了代码示例,并强调了开源工具、清晰的文档和灵活的框架如何帮助开发者更轻松地扩展训练、验证每个阶段并根据自身项目调整工作流。这提醒了大家,社区和易于获取的工具对于计算机视觉的真正进步有多么重要。

另一方面,演讲者敦促听众思考 AI 在社会中的更广泛作用。未来学家、人文主义者兼 The Futures Agency CEO Gerd Leonhard 在演讲中提出,“技术在被我们使用之前在道德上是中立的”,他强调真正的问题不仅在于 AI 能做什么,还在于它应该做什么。他警告不要陷入还原论和无真相的陷阱,并呼吁构建真正服务于人类长期利益的 AI。

Gerd Leonhard 分享他关于构建以人为本的 AI 的见解

图 4. Gerd Leonhard 分享他在保持以人为本的前提下构建 AI 解决方案的思考。

这种对责任的关注在与牛津大学 Carissa Véliz 的炉边谈话中得到了延续,她强调了隐私和安全问题。她指出,开源社区对于审查和改进代码至关重要,而且伦理和设计是不可分割的。她的信息很明确:开发者需要预见滥用风险,并构建将人类尊严和社会福祉放在首位的系统。

Link to this section伦敦 YV25 社交活动#

除了演讲和演示,YV25 还创造了人们建立联系的空间。在茶歇和午餐期间,参会者进行交流、分享经验、比较技术方案,并碰撞出新的合作火花。

对于 Ultralytics 团队来说,这也是一次面对面交流的绝佳机会。成员们分散在世界各地,这样的时刻有助于加强联络并共同庆祝进步。

Ultralytics 团队在 YOLO Vision 2025 结束了充满启发性的一天

图 5. Ultralytics 团队结束了在 YOLO Vision 2025 激动人心的一天。

活动以派对结束,参会者有机会放松身心并继续交流。这是一个反思、充能并展望视觉 AI 下一章创新篇章的时刻。

Link to this section共同拓展视觉 AI 的边界#

YOLO Vision 2025 是一场关于思想、创新和社区的盛会。Ultralytics YOLO26 的发布奠定了基调,随后关于边缘部署和以人为本的 AI 的深度探讨,突显了视觉 AI 的快速进步及其对世界的日益深远的影响。

除了主题演讲,活动还让人们凝聚在一起。研究人员、开发者和爱好者分享了经验,引发了有意义的对话,并探索了未来的新可能。活动在热烈的氛围中落下帷幕,参会者们对 Ultralytics YOLO 模型和计算机视觉的未来充满期待。

准备好探索 AI 了吗?加入我们的 社区GitHub 仓库 以了解更多关于 AI 和计算机视觉的信息。访问我们的解决方案页面,探索 农业中的计算机视觉机器人中的 AI 的更多应用。查看 我们的许可 选项,立即开始你的计算机视觉之旅吧!

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅