上周,即6月11日至15日,Ultralytics团队在田纳西州纳什维尔参加了CVPR 2025--IEEE/CVF计算机视觉与模式识别会议。这是计算机视觉和人工智能研究领域一年一度的重要活动之一。
今年的会议在音乐城中心举行,来自世界各地的 12,000 多名与会者参加了会议。从学术研究人员和工程师到行业领导者和开发人员,本次会议挤满了推动视觉人工智能发展的人们。
特别是,CVPR 2025 围绕计算机视觉和多模态学习中的深度学习、生成式人工智能模型、基础模型以及自动驾驶和三维场景理解等实际应用开展了前沿研究和对话。
对于 Ultralytics 来说,在 CVPR 2025 上的一周主要是与计算机视觉社区建立联系、分享演示以及了解我们的Ultralytics YOLO 模型在各行各业的应用情况。在 1512 号展位,我们展示了最新的视觉人工智能解决方案,与数百名参观者讨论了实际使用案例,并亲眼目睹了我们的工作如何推动机器人、零售、研究等行业的创新。
因此,让我们来看看活动中我们最喜欢的一些时刻,重点介绍主要收获、对话和社区联系。
CVPR 始创于 1983 年,1985 年正式获得电气和电子工程师学会(IEEE)的支持。多年来,它已发展成为计算机视觉和模式识别领域最具影响力的会议之一,汇聚了全球的研究人员、工程师和创新者。自 2012 年以来,该会议一直由计算机视觉基金会(CVF)协办,该基金会是一个非营利组织,支持开放计算机视觉研究,并在会议组织中发挥了重要作用。
CVPR 每年举办一次,以其技术深度和帮助塑造整个领域的发展方向而著称,从早期的物体识别突破到今天的视觉人工智能和深度学习的进步。今年提交的论文超过 13,000 篇,比去年增加了 13%。本届大会的论文录用率仅为 22%,继续保持了突出高影响力研究的传统。
以下是在 CVPR 2025 上引人注目的一些主要研究主题:
在大会正式开始之前,我们的团队已经抵达纳什维尔,为 CVPR 2025 做好一切准备。
我们花了一天的时间在音乐城中心进行布置,1512 号展位成为我们进行为期三天的演示、交流和社区建设的大本营。我们拖着装备,拆开硬件包装,配置现场 YOLO 演示,并仔细安排我们的设置,以确保一切都能在快节奏的博览会环境中顺利进行。
卸载设备、测试演示和组装展台的人们逐渐挤满了会场。看着这一切,我们不禁想起了 CVPR 的全球性和协作性。
经过一个富有成效的下午后,团队换了个地方,前往纳什维尔市中心游览。自然而然地,他们在百老汇停了下来,那里的每家酒吧和餐馆都有乡村音乐现场表演。
团队中的一些人穿上了牛仔靴(这对我们中的几个人来说还是第一次),最后他们还品尝了当地人最喜欢的经典美食:Hattie B's 的热鸡肉。这是工作和娱乐的完美结合。展台已经准备就绪,团队也已蓄势待发,期待 CVPR 2025 的精彩表现。
展会第一天,Ultralytics 团队在现场整装待发。数字内容经理Nuvola Ladi、活动经理Zinnia Pourdad 和机器学习工程师Francesco Mattioli 早上 9 点就到达了音乐城中心。
上午 10 点,人群开始涌入,博览会现场的气氛立刻活跃起来。我们的展位很快就挤满了参观者,Ultralytics 的商品,尤其是手提袋和贴纸,在几分钟内就被抢购一空。这是一次有趣的破冰活动,有助于展开对话,吸引人们驻足观看。
在这一天里,我们有机会与从事各种项目的研究人员、工程师和开发人员交谈。大家对我们的现场 YOLO 演示很感兴趣,我们还听到了机器人、医疗保健、制造、零售等领域的用例。看到我们的模型得到如此广泛的应用,从早期的学术研究到部署的企业系统,我们深受鼓舞。
我们还与人工智能领域的合作者重新建立了联系,包括来自英特尔 OpenVINO 和索尼半导体解决方案的团队。与其他创新者共享会场有助于加强视觉人工智能领域的合作和快速发展。
一天即将结束时,团队来到 Printers Alley,欣赏现场乡村音乐,放松身心。经过一天紧凑的交谈和现场令人难以置信的活力,这是我们在 CVPR 2025 上第一天的完美收尾。
CVPR 2025 第二天的活动紧接着第一天的活动。1512 号展位全天都很热闹,老客户和新与会者都驻足了解我们的 Ultralytics YOLO 模型,并分享他们自己的作品。
例如,英特尔 Robodog 的到访是当天最令人难忘的时刻之一。看到先进的硬件与实用的视觉模型配合使用,真正体现了活动的精神。
晚些时候,我们的团队参加了由英特尔主办的 After.CVPR() 开发人员聚会。这是一个轻松的协作空间,充满了来自整个人工智能生态系统的工程师、研究人员和开发人员。
见面会上的现场演示和有意义的对话一直持续到深夜。活动期间,Francesco Mattioli 展示了 Ultralytics 和 OpenVINO 的联合演示,展示了如何将我们的模型集成到高效的推理管道中。
他演示了如何将Ultralytics YOLO11等模型导出为 OpenVINO 格式,以便在英特尔硬件上实现更快、更优化的推理。演示重点介绍了对中央处理器(CPU)、图形处理器(GPU)和神经处理单元(NPU)的支持。它引起了从事边缘人工智能和实时应用的团队的极大兴趣。
即使在 CVPR 2025 的最后一天,音乐城中心仍然热闹非凡。与会者仍在探索展台,进行深思熟虑的交谈,充分利用会议时间。
今天的亮点之一是参观海报展示环节,这是 CVPR 分享研究成果的核心环节。与传统的舞台演讲不同,海报会议更加非正式、互动性更强。
每位研究人员都会张贴一张印刷好的大型海报,总结自己的研究成果,并站在附近向来访者解释、回答问题和讨论研究结果。这是一种在短时间内了解各种主题的好方法,它为与会者和演讲者之间的真正对话创造了空间。
我们看到了各种各样的海报,内容涉及从视觉语言模型和三维场景理解到人工智能在机器人和医疗保健领域的实际应用等各个方面。这些会议让我们更近距离地了解了该领域正在探索的最新想法,并有机会与这些想法背后的人直接交流。
随着活动的结束,我们感到比以往任何时候都更有动力。这一周的活动充满了学习、合作和视觉人工智能的真正动力,我们很高兴能将这些见解带入下一步的工作中。
CVPR 2025 是学习、分享和交流的一周。从前沿研究到实践演示和精彩对话,会议展示了视觉人工智能的快速发展,以及其背后社区的影响力和支持性。
看到 Ultralytics YOLO 模型在如此众多的现实世界和研究应用中发挥作用,我很受启发。CVPR 2025 清楚地表明,计算机视觉是人工智能创新的核心,未来还会有更多的创新。
加入我们的社区,在我们的GitHub 存储库中深入研究视觉人工智能。在我们的解决方案页面了解零售业中的人工智能和制造业中的计算机视觉等创新。查看我们的许可计划,立即开始您的人工智能之旅!