加入我们,一起回顾 Ultralytics 年度最大的活动,展示 Ultralytics YOLO26 的发布、鼓舞人心的专题讨论以及重要的社区亮点。
加入我们,一起回顾 Ultralytics 年度最大的活动,展示 Ultralytics YOLO26 的发布、鼓舞人心的专题讨论以及重要的社区亮点。
AI 和计算机视觉社区于 9 月 25 日齐聚一堂,参加了 Ultralytics 的年度混合视觉 AI 活动 YOLO Vision 2025 (YV25)。本次活动在伦敦的 The Pelligon 举办,并通过网络向全球直播,吸引了众多研究人员、工程师和 AI 爱好者,他们在此分享想法并了解新的创新技术,例如 Ultralytics YOLO26。
今年是该活动的第四年,其影响力和覆盖范围持续扩大。YV25 直播已获得超过 6,800 次观看,产生超过 49,000 次展示,并累计近 2,000 小时的观看时长。
YV25 在主持人 Oisin Lunny 的开幕致辞中拉开帷幕,他鼓励与会者建立联系、分享经验,并充分利用本次活动,为当天定下了基调。 正如他所说,“YOLO Vision 2025 大会汇集了开源视觉 AI 社区,共同关注数据、机器学习和计算机视觉的进步。”
在本文中,我们将回顾 YOLO Vision 2025 的主要亮点,包括产品发布、主题演讲、小组讨论、现场演示以及使这一天变得特别的社区时刻。让我们开始吧!
在活动之前,人们对新产品发布感到非常兴奋,我们的创始人兼首席执行官 Glenn Jocher 以此为动力开始了这一天。
他分享了 Ultralytics 的发展历程,回忆起 2020 年,他如何在插入 MacBook 的单张 1080 Ti 显卡上进行实验,而这种配置在今天已经过时。从这些不起眼的开端,Ultralytics 已经成长为一个全球社区,每天有数十亿次的推理由 YOLO 模型提供支持。
Glenn 还谈到了 Ultralytics 最近完成的 3000 万美元 A 轮融资。他解释说,这笔投资将通过扩大团队规模、扩展研究范围以及确保继续突破计算机视觉界限所需的计算资源,来推动公司进入下一个增长阶段。
Glenn 接着宣布了 Ultralytics 的两项新举措。第一项是 Ultralytics YOLO26,它是 Ultralytics YOLO 系列中的最新模型,旨在更小、更快、更高效,同时实现更高的精度。第二项是 Ultralytics 平台,这是一个全新的端到端 SaaS 工作空间,它结合了数据、训练、部署和监控,使构建计算机视觉解决方案比以往任何时候都更容易,预计将在不久的将来发布。

YOLO26 旨在推动性能向前发展,同时保持在实际应用中的实用性。最小的版本在 CPU 上的运行速度已经提高了 43%,同时仍提高了准确性,使其非常适合从移动设备到大型企业系统的应用。YOLO26 将于 10 月底公开发布。
以下是 YOLO26 的主要特性概览:
在介绍 YOLO26 之后,Glenn 邀请了我们的产品工程主管 Prateek Bhatnagar 来演示下一个即将到来的项目,Ultralytics 平台。该平台旨在简化整个计算机视觉工作流程,旨在将数据集、标注、训练、部署和监控整合到一个地方。
Prateek 将其比作汽车调校:无需为了轮胎、引擎和变速箱而奔波于不同的店铺,所有操作都在一个车库内完成。同样,该平台为开发者提供了一个集成的工作空间,以管理视觉 AI 模型的完整生命周期。
演示展示了 AI 辅助的标注工具,可加快数据集准备速度,为专家和初学者提供可定制的训练选项,以及训练运行的实时监控。
YV25 的另一个亮点是由 Oisin Lunny 主持的关于边缘部署的小组讨论。该会议邀请了索尼半导体解决方案公司的 Yuki Tsuji、Raspberry Pi 公司的 David Plowman 和 Glenn Jocher。
讨论探讨了将 AI 转移到边缘如何减少延迟、降低成本并提高隐私。Yuki 展示了索尼的 IMX500 传感器,该传感器可以直接在芯片上运行推理。同时,David 谈到了 Raspberry Pi 如何从其制造商的根基扩展到大规模的商业应用。

专家组还谈到了开发人员面临的最大障碍之一:让模型在不同的设备上平稳运行。这就是 Ultralytics Python 包 发挥关键作用的地方。
凭借其广泛的导出选项,可以轻松地将训练好的模型移动到移动设备、嵌入式系统或企业硬件上进行生产。通过消除模型转换的麻烦,Ultralytics 帮助团队专注于构建解决方案,而不是与兼容性问题作斗争。
正如 David 解释的那样,“根据我痛苦的经验,我知道转换模型非常糟糕,如果有人能为我做这件事,那会让生活轻松很多。这就是 Ultralytics 真正改进的地方,并为我们的用户提供有价值的东西。”
人工智能软件的进步与硬件的发展齐头并进,共同推动了计算机视觉领域的新一轮创新浪潮。虽然像 Ultralytics YOLO 这样的模型不断提高准确性,但它们的实际应用也取决于运行它们的平台。
例如,Seeed Studio 展示了像 reCamera 和 XIAO 开发板这样预装了 Ultralytics YOLO 模型的模块化、低成本硬件如何让开发人员轻松地从原型设计过渡到实际的 AI 系统。 这种硬件与软件的集成降低了入门门槛,并展示了硬件层面的创新如何直接加速采用。
以下是其他YV25主题演讲的一些主要内容,这些演讲强调了硬件与软件协同设计如何释放新的可能性:
随着软硬件协同发展,计算机视觉的演进速度比以往任何时候都快。这些并行发展不仅提高了准确性和速度,还塑造了视觉 AI 在现实世界中的部署方式。在 YV25 大会上,与会者有机会听取来自机器人、边缘部署和多模态 AI 领域专家的意见,他们各自对该领域的发展方向提出了不同的见解。
例如,在Michael Hart的演讲中,来自 D-Robotics 的 Michael Hart 演示了如何将 Ultralytics YOLO 模型与他们紧凑的 RDK X5 板(一种小型嵌入式 AI 视觉模块)配对,使机器人能够实时运行高级视觉模型。他的现场演示展示了机器人技术的发展程度,已经从实验室实验发展成为实用的、人工智能驱动的系统。

同样,来自 Axelera AI 的 Alexis Crowell 和 Steven Hunsche 强调了在边缘部署视觉 AI 的挑战和机遇。通过现场演示,他们解释了 Axelera AI 的 Metis AI 处理单元 (AIPU) 如何结合 RISC-V 和数字内存计算,以极低的功耗提供高性能。该平台采用 M.2 和 PCIe 等常见外形封装,其软硬件协同设计使边缘 AI 的扩展既实用又高效。
在另一次会议中,来自 Hugging Face 的 Merve Noyan 探讨了多模态 AI 的兴起,这种 AI 模型将视觉与文本、音频和其他输入相结合。她谈到了从文档分析到具身代理等用例,强调了开源创新如何加速 AI 的应用。
虽然 YV25 的特色是鼓舞人心的大局演讲,但它也包括非常实用的会议。 来自 Lightning AI 的 Jiri Borovec 进行了实践演练,展示了如何使用 PyTorch Lightning 和多 GPU 支持来训练和微调 Ultralytics YOLO 模型。
他演示了代码示例,并强调了开源工具、清晰的文档和灵活的框架如何使开发人员更容易扩展训练、验证每个阶段,并将工作流程调整到他们自己的项目中。这提醒了我们社区和易于使用的工具对于计算机视觉的真正进步是多么重要。
另一方面,演讲者敦促听众思考 AI 在社会中更广泛的角色。未来学家、人道主义者兼 The Futures Agency 首席执行官 Gerd Leonhard 在他的主题演讲中认为,“技术在被我们使用之前在道德上是中立的”,他强调,真正的问题不仅仅是 AI 能做什么,而是它应该做什么。他警告人们不要陷入还原论和虚假等陷阱,并呼吁开发真正服务于人类长期利益的 AI。

在与牛津大学的Carissa Véliz的炉边谈话中,对责任的关注仍在继续,她强调了隐私和安全。她指出,开源社区对于检查和改进代码至关重要,并且伦理与设计密不可分。她的信息很明确:开发人员需要预测滥用并构建将人的尊严和社会福祉放在首位的系统。
除了演讲和演示之外,YV25 还为人们创造了交流空间。在咖啡休息和午餐期间,与会者互相交流、分享经验、比较方法,并激发了新的合作。
对于 Ultralytics 团队 来说,这也是一个很好的面对面交流的机会。由于团队成员遍布全球,这样的时刻有助于加强联系,并共同庆祝进步。

这一天以一个 after-party 结束,参与者有机会放松身心并继续交流。这是一个反思、充电并展望 Vision AI 创新下一篇章的时刻。
YOLO Vision 2025 是一场关于想法、创新和社区的庆典。Ultralytics YOLO26 的发布奠定了基础,随后关于边缘部署和以人为本的人工智能的精彩演讲突出了视觉人工智能的快速发展及其对世界日益增长的影响。
除了主题演讲之外,本次活动还将人们聚集在一起。研究人员、开发人员和爱好者分享经验,引发有意义的对话,并探索未来新的可能性。活动在热烈的气氛中结束,与会者对 Ultralytics YOLO 模型和计算机视觉的未来感到兴奋。
准备好探索 AI 吗?加入我们的 社区 和 GitHub 存储库,了解更多关于 AI 和计算机视觉的信息。访问我们的解决方案页面,探索 计算机视觉在农业中的应用 和 AI 在机器人技术中的应用。查看 我们的许可 选项,立即开始使用计算机视觉!