深圳Yolo 视觉
深圳
立即加入

Ultralytics 在 CVPR 2025 上的主要亮点

与我们一起回顾Ultralytics 在 CVPR 2025 上的经历,从展台亮点到真实的计算机视觉用例,以及在纳什维尔的难忘时刻。

上周,即6月11日至15日,Ultralytics 团队在田纳西州纳什维尔参加了CVPR 2025--IEEE/CVF计算机视觉与模式识别会议。这是计算机视觉和人工智能研究领域一年一度的重要活动之一。 

今年的会议在音乐城中心举行,汇集了来自世界各地的 12,000 多名与会者。从学术研究人员和工程师到行业领导者和开发人员,本次活动汇集了众多推动视觉 AI 边界的人士。 

特别是,2025年计算机视觉与模式识别会议(CVPR)以尖端研究和对话为特色,内容涵盖了计算机视觉和多模态学习中的深度学习,以及生成式人工智能模型、基础模型和自动驾驶和3D场景理解等实际应用。

图 1. 2025 年 CVPR 将在田纳西州纳什维尔举行。

对于Ultralytics 来说,在 CVPR 2025 上的一周主要是与计算机视觉社区建立联系、分享演示以及了解我们的Ultralytics YOLO 模型在各行各业的应用情况。在 1512 号展位,我们展示了最新的视觉人工智能解决方案,与数百名参观者讨论了实际使用案例,并亲眼目睹了我们的工作如何推动机器人、零售、研究等行业的创新。 

接下来,让我们回顾一下本次活动中的精彩瞬间,重点介绍关键要点、对话和社区联系。 

2025 年 CVPR 纳什维尔会议展望

CVPR 最初于 1983 年推出,并于 1985 年获得 IEEE 的正式支持。多年来,它已发展成为计算机视觉和模式识别领域最具影响力的会议之一,汇集了来自世界各地的研究人员、工程师和创新者。自 2012 年以来,它一直由计算机视觉基金会 (CVF) 共同赞助,该基金会是一家非营利组织,支持开放获取计算机视觉研究,并在组织活动中发挥着至关重要的作用。 

CVPR 每年举办一次,以其技术深度而闻名,并有助于塑造整个领域的发展方向,从早期在对象识别方面的突破到今天在视觉 AI 和深度学习方面的进步。今年的版本收到了超过 13,000 篇论文投稿,比去年增加了 13%。会议的接受率仅为 22%,延续了其突出展示具有高影响力研究的传统。

以下是 CVPR 2025 上一些主要研究主题的快速概览:

  • 3D 场景理解和神经渲染: 研究人员正在探索如何使用多个视图或传感器输入来重建和表示三维世界,以推进在机器人技术、增强现实和仿真中的应用。
  • 使用生成式 AI进行图像和视频合成:该领域专注于从最少的输入(如文本提示或草图)创建高质量的视觉效果,从而为创意媒体和交互系统的下一代工具提供支持。
  • 多模态学习和视觉-语言模型:这些模型结合了视觉和语言数据,以提高理解、推理和沟通能力,从而为更通用和适应性更强的人工智能系统铺平了道路。

在音乐城中心为 CVPR 做准备

在会议正式开始之前,我们的团队抵达纳什维尔,为CVPR 2025做好一切准备。 

我们花了一天的时间在音乐城中心进行布置,1512 号展位成为我们进行为期三天的演示、交流和社区建设的大本营。我们拖着装备,拆开硬件包装,配置YOLO 现场演示,并仔细安排我们的设置,以确保一切都能在快节奏的博览会环境中顺利进行。 

空间逐渐被卸载装备、测试演示和组装展位的人们填满。 看到这一切汇集在一起,让我们想起了 CVPR 真正的全球性和协作性。

在一个富有成效的下午之后,团队转换了方向,前往探索纳什维尔市中心。当然,他们还在百老汇大街停留了一下,那里每个酒吧和餐厅都涌出乡村音乐。 

我们团队的一些人买了牛仔靴(对我们中的一些人来说是第一次),他们以当地人最喜欢的经典美食——Hattie B’s 的辣鸡来结束了这个夜晚。这是工作和娱乐的完美结合。展位已准备就绪,团队已蓄势待发,期待 CVPR 2025 的到来。

关于计算机视觉和人工智能研究的对话

博览会第一天,Ultralytics 团队在现场整装待发。数字内容经理Nuvola Ladi、活动经理Zinnia Pourdad 和机器学习工程师Francesco Mattioli 早上 9 点就到达了音乐城中心。

上午 10 点,人群开始涌入,博览会现场的气氛立即活跃起来。我们的展位很快就挤满了参观者,Ultralytics 的商品,尤其是手提袋和贴纸,在几分钟内就被抢购一空。这是一次有趣的破冰之旅,有助于开始对话并吸引人们前来。

图 2. Nuvola LadiZinnia PourdadFrancesco Mattioli 在 1512 号展位。

在这一天里,我们有机会与从事各种项目的研究人员、工程师和开发人员交谈。大家对我们的现场YOLO 演示很感兴趣,我们还听到了机器人、医疗保健、制造、零售等领域的用例。看到我们的模型得到如此广泛的应用,从早期的学术研究到部署的企业系统,我们深受鼓舞。

我们还与人工智能领域的合作者重新建立了联系,包括来自Intel OpenVINO 和索尼半导体解决方案的团队。与其他创新者共享会场有助于加强视觉人工智能领域的合作和快速发展。

临近傍晚,团队前往 Printers Alley 欣赏乡村音乐,放松身心。在经历了充实的一天交流和展厅内令人难以置信的活力之后,这是结束我们在 CVPR 2025 第一天的完美方式。

图 3. 团队有机会探索 Printers Alley。

在纳什维尔举行的计算机视觉会议的第二天

CVPR 2025 第二天的活动紧接着第一天的活动。1512 号展位全天都很热闹,老客户和新与会者都驻足了解我们的Ultralytics YOLO 模型,并分享他们自己的作品。

例如,当天最令人难忘的时刻之一就是Intel Robodog 的到访。看到先进的硬件与实用的视觉模型配合使用,真正体现了活动的精神。

图 4.Intel Robodog 参观了 1512 号展位的团队。

晚些时候,我们的团队参加了由Intel主办的 After.CVPR() 开发人员聚会。这是一个轻松的协作空间,充满了来自整个人工智能生态系统的工程师、研究人员和开发人员。 

见面会上的现场演示和有意义的对话一直持续到深夜。活动期间,Francesco Mattioli 展示了Ultralytics 和OpenVINO 的联合演示,展示了如何将我们的模型集成到高效的推理管道中。 

他介绍了 Ultralytics YOLO11等模型如何导出为OpenVINO 格式,从而在Intel 硬件上实现更快的优化推理。演示重点介绍了对中央处理器(CPU)、图形处理器(GPU)和神经处理单元(NPU)的支持。它引起了从事边缘人工智能和实时应用的团队的极大兴趣。

图 5. After.CVPR() 开发者聚会的一瞥。

CVPR 中计算机视觉应用中的深度学习

即使在 CVPR 2025 的最后一天,音乐城中心仍然热闹非凡。与会者仍在探索展位,进行深入的对话,并充分利用他们在会议上的时间。

当天的一个亮点是参观海报展示环节,这是 CVPR 分享研究成果的核心方式。与传统的舞台演示不同,海报展示环节更加非正式和互动。 

每位研究人员都会设置一张大型印刷海报,总结他们的工作,并站在附近解释它、回答问题,并与任何驻足的人讨论他们的发现。这是在短时间内了解各种主题的好方法,并且它为与会者和演讲者之间的真正对话创造了空间。

我们看到了各种各样的海报,涵盖了从 视觉语言模型 和 3D 场景理解到人工智能在机器人和医疗保健领域的实际应用。这些会议让我们更深入地了解了该领域正在探索的最新想法,并有机会直接与幕后人员交流。

随着活动的结束,我们比以往任何时候都感到更有动力。这一周充满了学习、协作和视觉 AI 的真正动力,我们很高兴将这些见解带入下一步的发展中。

主要要点

CVPR 2025 是学习、分享和交流的精彩一周。从前沿研究到实践演示和精彩对话,本次会议展示了视觉 AI 的发展速度以及它背后社区的影响力和支持力度。

看到Ultralytics YOLO 模型在如此众多的现实世界和研究应用中发挥作用,我很受启发。CVPR 2025 清楚地表明,计算机视觉是人工智能创新的核心,未来还会有更多的创新。

加入我们的社区,并在我们的GitHub存储库中深入研究视觉AI。在我们的解决方案页面上了解零售业中的AI制造业中的计算机视觉等创新。查看我们的许可计划,立即开始您的AI之旅!

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始