Ultralytics 在 CVPR 2025 的关键亮点
加入我们,一起回顾 Ultralytics 在 CVPR 2025 的经历,从展位亮点到现实世界的计算机视觉用例以及在纳什维尔的难忘时刻。

上周,即 6 月 11 日至 15 日,Ultralytics 团队亲临田纳西州纳什维尔,参加了 CVPR 2025——IEEE/CVF 计算机视觉与模式识别会议。这是计算机视觉和 AI 研究领域最重要的年度活动之一。
今年的会议在音乐城中心(Music City Center)举行,汇集了来自世界各地的 12,000 多名参会者。从学术研究人员和工程师到行业领袖和开发者,活动现场充满了致力于突破视觉 AI 边界的人们。
特别是 CVPR 2025 展示了前沿的研究,并围绕计算机视觉中的深度学习、多模态学习,以及生成式 AI 模型、基础模型和自动驾驶、3D 场景理解等实际应用进行了探讨。

图 1. 在田纳西州纳什维尔举行的 CVPR 2025。
对于 Ultralytics 而言,CVPR 2025 的这一周重点在于与计算机视觉社区建立联系、分享演示,并了解我们的 Ultralytics YOLO 模型如何在各个行业中得到应用。在 1512 号展位,我们展示了最新的视觉 AI 解决方案,与数百名参观者讨论了实际应用案例,并亲眼见证了我们的工作如何推动机器人、零售、研究等领域的创新。
接下来,让我们回顾一下活动中我们最喜欢的时刻,重点介绍主要收获、对话和社区联结。
Link to this section回顾 CVPR 纳什维尔 2025#
CVPR 于 1983 年首次举办,并于 1985 年正式获得 IEEE 支持。多年来,它已发展成为计算机视觉和模式识别领域最具影响力的会议之一,汇聚了全球的研究人员、工程师和创新者。自 2012 年起,会议由计算机视觉基金会(CVF)共同赞助,该非营利组织致力于支持计算机视觉研究的开放获取,并在组织活动方面发挥了至关重要的作用。
CVPR 每年举办一次,以其技术深度而闻名,并帮助塑造了整个领域的发展方向,从早期的物体识别突破到如今视觉 AI 和深度学习的进步。今年收到了超过 13,000 篇论文投稿,比去年增加了 13%。会议仅维持了 22% 的接收率,继续保持其聚焦高影响力研究的传统。
以下是 CVPR 2025 中脱颖而出的几个主要研究主题的简要概述:
- 3D 场景理解和神经渲染: 研究人员正在探索如何利用多视角或传感器输入以三维方式重建和表示世界,从而推动机器人、增强现实和仿真技术的发展。
- 使用 生成式 AI** 进行图像和视频合成:** 该领域专注于从文本提示或草图等最小输入创建高质量视觉效果,为创意媒体和交互系统的下一代工具提供支持。
- 多模态学习和视觉语言模型: 这些模型结合了视觉和语言数据,以提高理解、推理和沟通能力,为更通用和更具适应性的 AI 系统铺平了道路。
Link to this section在音乐城中心为 CVPR 进行搭建#
在会议正式开始前,我们的团队抵达了纳什维尔,为 CVPR 2025 做好准备。
我们花了一整天时间在音乐城中心进行搭建,1512 号展位成为了我们进行为期三天演示、交流和社区建设的大本营。我们带着设备,拆开硬件,配置了现场 YOLO 演示,并仔细安排了我们的布置,以确保一切能在节奏极快的展会环境中顺利运行。
展厅里逐渐挤满了卸货、测试演示并搭建展位的人群。看着这一切准备就绪,我们再次感受到 CVPR 是多么具有全球协作性。
经过一个富有成效的下午,团队改变节奏,出发去探索纳什维尔市中心。当然,他们也在百老汇(Broadway)停下了脚步,那里每家酒吧和餐馆都溢出着现场乡村音乐。
部分团队成员买了牛仔靴(这对我们中的几个人来说是第一次),并以当地经典的 Hattie B's 热辣炸鸡结束了夜晚。这是工作与娱乐的完美结合。展位已经准备就绪,团队也已充好电,期待着 CVPR 2025 的精彩内容。
Link to this section关于计算机视觉和 AI 研究的对话#
展会的第一天,Ultralytics 团队在现场蓄势待发。我们的数字内容经理 Nuvola Ladi、活动经理 Zinnia Pourdad 和机器学习工程师 Francesco Mattioli 于上午 9 点抵达了音乐城中心。随着最后的搭建检查完成并准备好演示,我们随时准备在门开启时迎接参会者。
上午 10 点,人群开始涌入,展会现场的氛围立刻热烈起来。我们的展位迅速被参观者填满,Ultralytics 的周边产品,尤其是托特包和贴纸,在几分钟内就被抢购一空。这是一个有趣的破冰方式,有助于开启对话并吸引人们。

图 2. Nuvola Ladi、Zinnia Pourdad 和 Francesco Mattioli 在 1512 号展位。
整天,我们都有机会与从事各种项目的研究人员、工程师和开发者进行交谈。大家对我们的实时 YOLO 演示非常感兴趣,我们听到了关于机器人、医疗保健、制造业、零售业等领域的应用案例。看到我们的模型被如此广泛地使用,从早期的学术研究到部署的企业系统,真是令人鼓舞。
我们还与 AI 领域的合作伙伴重新建立了联系,包括来自 Intel OpenVINO 和 Sony Semiconductor Solutions 的团队。与其他创新者共享展区,进一步加强了视觉 AI 领域持续保持协作和快速发展的感受。
临近下班时,团队前往打印机巷(Printers Alley)享受现场乡村音乐并放松身心。在经历了一整天紧凑的对话和展会上令人难以置信的活力之后,这是结束我们 CVPR 2025 第一天的完美方式。

图 3. 团队有机会探索了打印机巷。
Link to this section纳什维尔计算机视觉会议的第二天#
CVPR 2025 的第二天延续了第一天的热情。1512 号展位全天保持活跃,回头客和新参会者纷纷驻足,了解更多关于我们 Ultralytics YOLO 模型的信息并分享他们的工作。
例如,当天最难忘的时刻之一是 Intel Robodog 的到访。看到先进的硬件与实际的视觉模型结合并投入运行,确实抓住了活动的精髓。

图 4. Intel Robodog 访问了 1512 号展位的团队。
傍晚时分,我们的团队参加了由 Intel 主办的 After.CVPR() 开发者聚会。这是一个轻松且充满协作的空间,汇集了来自 AI 生态系统的工程师、研究人员和开发者。
聚会特色包括现场演示和持续到深夜的有意义的对话。活动期间,Francesco Mattioli 展示了一个由 Ultralytics 和 OpenVINO 联合开发的演示,展示了我们的模型如何被集成到高效的推理流水线中。
他讲解了如何将 Ultralytics YOLO11 等模型导出为 OpenVINO 格式,从而在 Intel 硬件上实现更快、更优化的推理。该演示突出了对中央处理器(CPU)、图形处理器(GPU)和神经网络处理器(NPU)的支持。它引起了从事边缘 AI 和实时应用团队的浓厚兴趣。

图 5. After.CVPR() 开发者聚会的一瞥。
Link to this sectionCVPR 上的计算机视觉深度学习应用#
即使在 CVPR 2025 的最后一天,音乐城中心依然忙碌。参会者们仍在探索展位,进行深入交流,并充分利用在会议上的每一分钟。
当天亮点之一是参观海报会议——这是 CVPR 分享研究的核心部分。与传统的舞台演示不同,海报会议更加非正式且具有互动性。
每位研究人员都设置了一张总结其工作的大型打印海报,并站在附近进行讲解、回答问题并与任何驻足者讨论他们的发现。这是在短时间内了解广泛主题的好方法,也为参会者和演讲者之间的真实对话创造了空间。
我们看到了各种各样的海报,涵盖了从视觉语言模型和 3D 场景理解到 AI 在机器人和医疗保健中的实际应用等方方面面。这些会议让我们更近距离地了解了该领域正在探索的最新想法,并有机会直接与背后的人员建立联系。
随着活动接近尾声,我们离开时感觉比以往任何时候都更有动力。这一周充满了学习、协作和视觉 AI 的真正势头,我们很高兴能将这些见解带入未来的工作中。
Link to this section关键要点#
CVPR 2025 是学习、分享和建立联系的精彩一周。从前沿研究到实践演示和伟大的对话,会议展示了视觉 AI 的发展速度有多快,以及背后的社区有多么具有影响力和支持力。
看到 Ultralytics YOLO 模型在如此多的现实和研究应用中得到实践,真是令人振奋。最重要的是,CVPR 2025 清晰地表明,计算机视觉处于 AI 创新的核心,未来还有更多精彩值得期待。
加入我们的社区,并在我们的 GitHub 仓库中深入了解视觉 AI。在我们的解决方案页面上了解零售业 AI 和制造业计算机视觉等创新。查看我们的许可计划,立即开启你的 AI 之旅!






