与我们一起回顾Ultralytics今年最重要的活动,展示Ultralytics YOLO26 发布会、鼓舞人心的专题讨论会以及重要的社区亮点。
与我们一起回顾Ultralytics今年最重要的活动,展示Ultralytics YOLO26 发布会、鼓舞人心的专题讨论会以及重要的社区亮点。
9 月 25 日,人工智能和计算机视觉社区齐聚一堂,参加Ultralytics的年度混合视觉人工智能活动YOLO Vision 2025(YV25)。该活动在伦敦的派里贡酒店举行,并在全球范围内进行流媒体直播,吸引了众多研究人员、工程师和人工智能爱好者前来分享观点,了解新的创新技术,如Ultralytics YOLO26。
今年是该活动的第四年,其影响力和覆盖范围持续扩大。YV25 直播已获得超过 6,800 次观看,产生超过 49,000 次展示,并累计近 2,000 小时的观看时长。
YV25 大会在主持人Oisin Lunny 的开场白中拉开帷幕,他为今天的会议定下了基调,鼓励与会者相互联系、分享并充分利用这次会议。正如他所说:"YOLO Vision 2025 是一个将开源视觉人工智能社区联合起来的会议,旨在关注数据、机器学习和计算机视觉方面的进步"。
在本文中,我们将回顾YOLO Vision 2025 的主要亮点,包括产品发布、主题演讲、小组讨论、现场演示,以及让这一天变得与众不同的社区时刻。让我们开始吧!
在活动之前,人们对新产品发布感到非常兴奋,我们的创始人兼首席执行官 Glenn Jocher 以此为动力开始了这一天。
他分享了Ultralytics 的发展历程,回顾了 2020 年他是如何在一台插入 MacBook 的 1080 Ti 上运行实验的,这种设置在今天已经过时了。Ultralytics 从最初的小规模起步,如今已发展成为一个全球社区,每天由YOLO 模型提供数十亿条推论。
格伦还谈到了Ultralytics 最近完成的 3000 万美元 A 轮融资。他解释了这笔投资将如何推动公司下一阶段的发展,使公司能够扩大团队规模、扩大研究范围并确保继续推动计算机视觉发展所需的计算资源。
Glenn 接着宣布了Ultralytics 的两项新成果。第一项是Ultralytics YOLO26,这是Ultralytics YOLO 系列的最新型号,设计更小、更快、更高效,同时实现更高的精度。第二款产品是Ultralytics Platform,这是一个全新的端到端 SaaS 工作空间,集数据、培训、部署和监控于一体,使构建计算机视觉解决方案变得前所未有的简单。

YOLO26 旨在推动性能向前发展,同时保持在实际应用中的实用性。最小的版本在 CPU 上的运行速度已经提高了 43%,同时仍提高了准确性,使其非常适合从移动设备到大型企业系统的应用。YOLO26 将于 10 月底公开发布。
以下是 YOLO26 的主要特性概览:
在介绍完 YOLO26 之后,Glenn 邀请我们的产品工程主管Prateek Bhatnagar 演示了即将开展的下一个项目--Ultralytics 平台。该平台旨在简化整个计算机视觉工作流程,将数据集、注释、训练、部署和监控集中到一个地方。
Prateek 将其比作汽车调校:无需为了轮胎、引擎和变速箱而奔波于不同的店铺,所有操作都在一个车库内完成。同样,该平台为开发者提供了一个集成的工作空间,以管理视觉 AI 模型的完整生命周期。
演示展示了 AI 辅助的标注工具,可加快数据集准备速度,为专家和初学者提供可定制的训练选项,以及训练运行的实时监控。
YV25 的另一个亮点是由 Oisin Lunny 主持的关于边缘部署的小组讨论。该会议邀请了索尼半导体解决方案公司的 Yuki Tsuji、Raspberry Pi 公司的 David Plowman 和 Glenn Jocher。
讨论探讨了将 AI 转移到边缘如何减少延迟、降低成本并提高隐私。Yuki 展示了索尼的 IMX500 传感器,该传感器可以直接在芯片上运行推理。同时,David 谈到了 Raspberry Pi 如何从其制造商的根基扩展到大规模的商业应用。

讨论小组还谈到了开发人员面临的最大障碍之一:如何让模型在不同设备上流畅运行。这正是Ultralytics Python 软件包发挥关键作用的地方。
Ultralytics 提供多种导出选项,可以轻松地将训练有素的模型导入移动设备、嵌入式系统或企业硬件的生产中。Ultralytics 解决了模型转换的难题,帮助团队专注于构建解决方案,而不是纠结于兼容性问题。
正如戴维解释的那样:"根据我的惨痛经历,我知道转换模型是一件非常可怕的事情,如果有其他人能帮我完成这项工作,我的生活就会轻松很多。这就是Ultralytics 真正的优势所在,它能为我们的用户提供有价值的东西。
人工智能软件的发展与硬件的发展并驾齐驱,共同推动着计算机视觉领域新一轮的创新。Ultralytics YOLO 等模型不断推动准确性向前发展,但它们对现实世界的影响也取决于它们所运行的平台。
例如,Seeed Studio展示了模块化、低成本的硬件,如预装了Ultralytics YOLO 模型的reCamera和XIAO板,如何让开发人员轻松地从原型开发转向实际的人工智能系统。这种软硬件集成降低了入门门槛,展示了硬件层面的创新是如何直接加速应用的。
以下是其他YV25主题演讲的一些主要内容,这些演讲强调了硬件与软件协同设计如何释放新的可能性:
随着软硬件协同发展,计算机视觉的演进速度比以往任何时候都快。这些并行发展不仅提高了准确性和速度,还塑造了视觉 AI 在现实世界中的部署方式。在 YV25 大会上,与会者有机会听取来自机器人、边缘部署和多模态 AI 领域专家的意见,他们各自对该领域的发展方向提出了不同的见解。
例如,在主题演讲中,来自 D-Robotics 公司的Michael Hart演示了如何将Ultralytics YOLO 模型与其紧凑型 RDK X5 板(小型嵌入式人工智能视觉模块)搭配使用,使机器人能够实时运行高级视觉模型。他的现场演示表明,机器人技术已经从实验室实验发展成为实用的人工智能驱动系统。

同样,来自 Axelera AI 的 Alexis Crowell 和 Steven Hunsche 强调了在边缘部署视觉 AI 的挑战和机遇。通过现场演示,他们解释了 Axelera AI 的 Metis AI 处理单元 (AIPU) 如何结合 RISC-V 和数字内存计算,以极低的功耗提供高性能。该平台采用 M.2 和 PCIe 等常见外形封装,其软硬件协同设计使边缘 AI 的扩展既实用又高效。
在另一场会议上,来自Hugging Face 公司的Merve Noyan探讨了多模态人工智能的兴起,在这种人工智能模型中,视觉与文本、音频和其他输入相结合。她谈到了从文档分析到化身代理等各种用例,强调了开源创新如何加速了人工智能的应用。
YV25 不仅有鼓舞人心的大视野演讲,还包括深入实用的会议。来自 Lightning AI 的Jiri Borovec进行了一次实践演练,展示了如何利用PyTorch Lightning 和GPU GPU 支持来训练和微调Ultralytics YOLO 模型。
他演示了代码示例,并强调了开源工具、清晰的文档和灵活的框架如何使开发人员更容易扩展训练、验证每个阶段,并将工作流程调整到他们自己的项目中。这提醒了我们社区和易于使用的工具对于计算机视觉的真正进步是多么重要。
另一方面,演讲者敦促听众思考 AI 在社会中更广泛的角色。未来学家、人道主义者兼 The Futures Agency 首席执行官 Gerd Leonhard 在他的主题演讲中认为,“技术在被我们使用之前在道德上是中立的”,他强调,真正的问题不仅仅是 AI 能做什么,而是它应该做什么。他警告人们不要陷入还原论和虚假等陷阱,并呼吁开发真正服务于人类长期利益的 AI。

在与牛津大学的Carissa Véliz的炉边谈话中,对责任的关注仍在继续,她强调了隐私和安全。她指出,开源社区对于检查和改进代码至关重要,并且伦理与设计密不可分。她的信息很明确:开发人员需要预测滥用并构建将人的尊严和社会福祉放在首位的系统。
除了演讲和演示之外,YV25 还为人们创造了交流空间。在咖啡休息和午餐期间,与会者互相交流、分享经验、比较方法,并激发了新的合作。
对于Ultralytics 团队来说,这也是一次面对面交流的绝佳机会。Ultralytics 的成员遍布全球,这样的时刻有助于加强联系,共同庆祝进步。

这一天以一个 after-party 结束,参与者有机会放松身心并继续交流。这是一个反思、充电并展望 Vision AI 创新下一篇章的时刻。
YOLO Vision 2025 是一场关于创意、创新和社区的庆典。Ultralytics YOLO26 的发布为活动拉开了序幕,随后关于边缘部署和以人为本的人工智能的演讲引人入胜,凸显了 Vision AI 的快速发展及其对世界日益增长的影响。
除了主题会议,这次活动还将人们聚集在一起。研究人员、开发人员和爱好者分享了经验,引发了有意义的对话,并探索了未来的新可能性。活动在热烈的气氛中结束,与会者对Ultralytics YOLO 模型和计算机视觉的未来充满期待。
准备好探索 AI 吗?加入我们的 社区 和 GitHub 存储库,了解更多关于 AI 和计算机视觉的信息。访问我们的解决方案页面,探索 计算机视觉在农业中的应用 和 AI 在机器人技术中的应用。查看 我们的许可 选项,立即开始使用计算机视觉!