#YV23 由 Ultralytics 提供支持,是世界上唯一关注开源视觉 AI 开发和进展的会议。研究人员、工程师和从业者将在线上线下齐聚一堂,连续第二年分享知识、创新和进展。9 月 27 日在西班牙马德里 Google for Startups 与专家和领导者一起,共同推动视觉 AI 新领域的发展。
1
日
18
会谈
2,000+
线上参会者
150
线下参会者
Glenn Jocher
创始人兼首席执行官
Glenn 创立了 Ultralytics,旨在领导美国国家地理空间情报局 (NGA) 的反中微子分析工作,最终促成了 miniTimeCube 实验以及在《自然》杂志上发表的世界上第一张全球反中微子地图。他对逃避我们的深刻粒子物理学奥秘有了更深刻的认识,这使他将通用人工智能 (AGI) 视为人类超越自身思维局限并有朝一日真正理解宇宙和我们在宇宙中的位置的最佳解决方案。今天,他致力于构建世界上最好的视觉人工智能,作为未来 AGI 的基石,Ultralytics YOLO 和 Ultralytics HUB 是这种痴迷的先锋。
主题演讲:探索 Ultralytics YOLO:最先进的视觉 AI 进展
小组讨论:让开源 AI 变得简单
Adrian Boguszewski
软件推广专员
Adrian 8 年前毕业于格但斯克理工大学计算机科学专业。之后,他开始了在计算机视觉和深度学习领域的职业生涯。在过去的两年里,Adrian 作为数据科学家和 Android 开发人员的团队负责人,负责开发一款无需离家即可拍摄专业照片(用于身份证或护照)的应用程序。他是 LandCover.ai 数据集的合著者,OpenCV 图像查看器插件的创建者,并且偶尔担任深度学习讲师。他目前的工作是向人们普及 OpenVINO 工具包。在空闲时间,他喜欢旅行。您还可以和他交流关于金融,尤其是投资方面的话题。
主题演讲:无需排队! 学习如何使用 YOLOv8 构建智能队列管理系统
Elaine Wu
边缘 AI 合作与营销
Elaine 是 Seeed 的 Edge AI 营销和合作伙伴经理。Seeed 是一家自 2008 年成立的物联网硬件公司,也是 NVIDIA Embedded 的精英合作伙伴。在 Seeed,她通过与开发者、生态系统和 Seeed 的硬件专业知识相结合,坚信并努力打造最可靠的硬件平台,从而帮助每个人实现其数字化转型目标,并共同创造下一代 AI 产品。她的 Twitter 账号是 @iamelainewu。
以无代码方式使用 YOLOv8 升级任何相机
Shashi Chilappagari
首席架构师 & 联合创始人
Shashi Chilappagari是DeGirum Corp.的联合创始人兼首席架构师,DeGirum Corp.是一家无晶圆半导体公司,致力于构建完整的边缘AI解决方案。在加入DeGirum之前,他曾担任Marvell Semiconductor Inc.的SSD架构总监。Shashi拥有印度马德拉斯印度理工学院的学士和硕士学位,以及亚利桑那州图森市亚利桑那大学的博士学位。
在边缘设备上部署量化的 YOLOv8 模型
Merve Noyan
开发者技术推广工程师
Merve Noyan 是 Hugging Face 的开发者倡导工程师,致力于开源机器学习。她也是机器学习研究生的毕业生和机器学习领域的 GDE(Google Developer Expert)。
基于 Transformer 的开源视觉技术
Amir Servi
边缘深度学习产品经理
Amir 是索尼的边缘深度学习产品经理。他在技术领域拥有超过 15 年的经验,在 Deci、Superwise 和 AnyVision 拥有丰富的开发者工具和 AI 生态系统经验,Amir 专注于领导产品和研发团队为开发者提供前沿技术产品,从计算机视觉应用到神经网络加速,再到重塑边缘设备上的深度学习部署。
弥合 AI 研究与实时边缘之间的差距
Glenn Jocher
创始人兼首席执行官
Glenn 创立了 Ultralytics,旨在领导美国国家地理空间情报局 (NGA) 的反中微子分析工作,最终促成了 miniTimeCube 实验以及在《自然》杂志上发表的世界上第一张全球反中微子地图。他对逃避我们的深刻粒子物理学奥秘有了更深刻的认识,这使他将通用人工智能 (AGI) 视为人类超越自身思维局限并有朝一日真正理解宇宙和我们在宇宙中的位置的最佳解决方案。今天,他致力于构建世界上最好的视觉人工智能,作为未来 AGI 的基石,Ultralytics YOLO 和 Ultralytics HUB 是这种痴迷的先锋。
主题演讲:探索 Ultralytics YOLO:最先进的视觉 AI 进展
小组讨论:让开源 AI 变得简单
Adrian Boguszewski
软件推广专员
Adrian 8 年前毕业于格但斯克理工大学计算机科学专业。之后,他开始了在计算机视觉和深度学习领域的职业生涯。在过去的两年里,Adrian 作为数据科学家和 Android 开发人员的团队负责人,负责开发一款无需离家即可拍摄专业照片(用于身份证或护照)的应用程序。他是 LandCover.ai 数据集的合著者,OpenCV 图像查看器插件的创建者,并且偶尔担任深度学习讲师。他目前的工作是向人们普及 OpenVINO 工具包。在空闲时间,他喜欢旅行。您还可以和他交流关于金融,尤其是投资方面的话题。
主题演讲:无需排队! 学习如何使用 YOLOv8 构建智能队列管理系统
Elaine Wu
边缘 AI 合作与营销
Elaine 是 Seeed 的 Edge AI 营销和合作伙伴经理。Seeed 是一家自 2008 年成立的物联网硬件公司,也是 NVIDIA Embedded 的精英合作伙伴。在 Seeed,她通过与开发者、生态系统和 Seeed 的硬件专业知识相结合,坚信并努力打造最可靠的硬件平台,从而帮助每个人实现其数字化转型目标,并共同创造下一代 AI 产品。她的 Twitter 账号是 @iamelainewu。
以无代码方式使用 YOLOv8 升级任何相机
Shashi Chilappagari
首席架构师 & 联合创始人
Shashi Chilappagari是DeGirum Corp.的联合创始人兼首席架构师,DeGirum Corp.是一家无晶圆半导体公司,致力于构建完整的边缘AI解决方案。在加入DeGirum之前,他曾担任Marvell Semiconductor Inc.的SSD架构总监。Shashi拥有印度马德拉斯印度理工学院的学士和硕士学位,以及亚利桑那州图森市亚利桑那大学的博士学位。
在边缘设备上部署量化的 YOLOv8 模型
Merve Noyan
开发者技术推广工程师
Merve Noyan 是 Hugging Face 的开发者倡导工程师,致力于开源机器学习。她也是机器学习研究生的毕业生和机器学习领域的 GDE(Google Developer Expert)。
基于 Transformer 的开源视觉技术
Amir Servi
边缘深度学习产品经理
Amir 是索尼的边缘深度学习产品经理。他在技术领域拥有超过 15 年的经验,在 Deci、Superwise 和 AnyVision 拥有丰富的开发者工具和 AI 生态系统经验,Amir 专注于领导产品和研发团队为开发者提供前沿技术产品,从计算机视觉应用到神经网络加速,再到重塑边缘设备上的深度学习部署。
弥合 AI 研究与实时边缘之间的差距
Kalen Michael
产品负责人
Kalen 13 岁时收到了他的第一台电脑,从此成为了一名程序员。他喜欢以最有效的方式解决挑战。编程和寻找解决方案是他真正的动力,没有什么比代码无 Bug 编译时获得的快感更令人兴奋的了。他学习的语言越多,就越渴望学习,他正在等待有一天我们能像《黑客帝国》里那样下载技能。
人人皆可使用 AI:Ultralytics HUB 平台让竞争环境更加公平
Erica Brescia
总经理
Erica Brescia 于 2022 年加入 Redpoint Ventures 担任执行董事,主要负责
对基础设施、人工智能、开发者工具和安全领域的投资。她目前担任 Dagger、Railway、Xata 和 Poolside 的
董事会成员,并领导了其他未公开的基础设施
投资。在加入 Redpoint 之前,Erica 曾担任 GitHub 的首席运营官。在加入 GitHub 之前,Erica 是 Bitnami 的联合
创始人兼首席运营官,Bitnami 是一家开源应用程序打包和部署公司,
后来被 VMware 收购。她还是 BitRock 的联合创始人兼首席执行官,该公司
开发了软件打包技术。Erica 在开源
社区拥有超过 15 年的领导经验,自 2016 年以来一直担任 Linux 基金会的董事会成员。
在加入 Redpoint 之前,Erica 是一位天使投资人,并为 Netlify、
Coda、Whimsical、Xata 和 Byteboard 等公司提供咨询。她与丈夫、儿子
以及他们滑稽的拉布拉多-吉娃娃混血犬住在加利福尼亚州核桃溪。
开源 A 轮融资:投资者关注什么
Ramit Debnath 博士
联合创始人
剑桥大学计算社会科学与设计助理教授、集体智能与设计小组(剑桥大学)主任、首位 Cambridge Zero 研究员,与加州理工学院、哈佛大学、波士顿大学、MCC-Berlin 等领先学术机构、联合国环境规划署 (UNEP)、国际能源署 (IEA) 等领先公共政策组织以及气候和可持续发展领域的其他先驱者合作,共同领导一项全球研究工作,以提高公众对气候变化的理解。
加州理工学院访问学者。曾就职于斯坦福大学、IEA 和印度理工学院孟买分校。盖茨学者。
人类与机器智能促进地球气候行动
Seán Boyle
联合创始人
曾担任 Twitter 首任可持续发展主管,发起首个公司范围内的气候行动战略,共同制定首个气候变化错误/虚假信息政策,并与包括联合国气候变化框架公约 (UNFCCC)、联合国环境规划署 (UNEP)、COP27、FridaysForFuture、WeDontHaveTime 在内的领先气候行动组织以及包括剑桥大学在内的领先学术机构以及气候行动领域的其他先驱者合作。
曾在 Twitter 工作 8 年。此前曾在 Meta 和 KPMG 担任职务。
WeDontHaveTime 的顾问委员会成员。Sigma Squared 的荣誉会员。
人类与机器智能促进地球气候行动
Yonatan Geifman
联合创始人兼首席执行官
Yonatan Geifman 是 Deci 的 CEO 兼联合创始人,Deci 是一个深度学习开发平台。在联合创立 Deci 之前,Yonatan 是 Google AI 的 MorphNet 团队成员。他拥有以色列理工学院计算机科学博士学位,以及以色列本-古里安大学计算机科学学士和硕士学位。他的研究重点是使深度神经网络 (DNN) 更适用于关键任务。他的研究成果已在全球领先的会议上发表和展示,包括神经信息处理系统大会 (NeurIPS) 和国际机器学习大会 (ICML)。
小组讨论:让开源视觉 AI 更轻松
Lakshantha Dissayanake
应用工程师
Lakshantha 是 Seeed Studio 的 Edge AI 高级应用工程师。他积极关注最新的 AI 趋势,并通过 NVIDIA Jetson 的分步 Wiki 教程向开发者社区提供嵌入式 AI 应用程序。此外,他还举办技术研讨会,并参与解决社区面临的技术问题。
展示与讲述:如何将YOLO部署到(几乎)任何东西:更简单、更快!
Davit Buniatyan
创始人兼首席执行官
Davit Buniatyan 在 18 岁时首次获得认可,当时 TechCrunch 对他进行了专题报道。 在伦敦大学学院 (UCL) 完成计算机科学学位后,他于 20 岁开始在普林斯顿大学攻读博士学位。 在普林斯顿大学期间,Davit 在著名的普林斯顿神经科学实验室,在 Sebastian Seung 教授的指导下专注于研究。
Davit 曾荣获 Gordon Wu 奖学金和 AWS 机器学习研究奖。他开创性的研究涉及绘制小鼠大脑的连接组。在神经科学实验室分析大型多模态数据集时,Davit 遇到了许多紧迫的机器学习挑战。因此,Davit 转变为 Activeloop 的创始 CEO。在 Y-Combinator 和其他著名的硅谷基金和天使投资人的支持下,Activeloop 正在构建 Deep Lake,这是一个旨在容纳所有 AI 数据的向量数据库。
PatentPT:构建具有企业级记忆代理的 LLM 驱动的解决方案
Soumik Rakshit
机器学习工程师
Weights & Biases 公司的机器学习工程师,同时也是 Google JAX 开发者专家。我也参与开源计算机视觉项目,研究方向主要集中在生成计算、图像修复和计算机图形学领域。我积极为开源项目做贡献,主要通过实现研究论文、端到端的机器学习示例以及为 Ultralytics、Diffusers、Keras 等开源仓库提供 MLOps 集成。
使用 Weights & Biases 增强 Ultralytics
张钹
算法策略师
Bo Zhang 是美团视觉的算法策略师。他于 2013 年在意大利特伦托大学获得信息学硕士学位。他之前的努力主要集中在自动化机器学习和计算机视觉上。他曾积极参与 YOLOv6 项目的合作。
小组讨论:让开源视觉 AI 更轻松
Bram Verhoef 博士
机器学习负责人
Bram Verhoef 拥有统计学、心理学和神经科学背景。 2010 年在 KU Leuven 获得博士学位后,他在哈佛大学和芝加哥大学进行了博士后研究,专注于注意力机制下的计算神经科学。
2017 年,他回到比利时,在 Imec 担任技术人员首席成员,领导与新型模拟内存计算深度学习芯片相关的算法开发。2021 年,他与人共同创立了 Axelera AI,目前担任机器学习主管,领导 Axelera AI 最先进的深度学习加速器的算法优化工作。
YOLO 超级加速:驾驭 AI 原生力量
Mónica Villas
技术顾问和讲师
曾在 IBM 工作 20 多年的 IT 主管。目前担任技术顾问和讲师。在 IT 行业工作多年后,我知道如何应用技术来改变和改善业务。我热衷于新的教学方式,并且对云、分析、人工智能和指数技术有深入的了解,同时我每天都在不断学习。作为一名工程师,我热爱技术和改变世界。我具有将复杂的事情简单化、解决问题和团队合作的强大能力。除了技术之外,我的另一个爱好是人。领导他人真的很有意义,在我担任领导的 15 年里,我总是努力以身作则。人们跟随我,这最终是领导者的主要目标。在我的整个职业生涯中,对我帮助最大的三件事是人、毅力和热情。
人工智能伦理挑战
Ultralytics 的 Glenn Jocher(YOLOv5 和 YOLOv8)、Deci 的 Yonatan Geifman(YOLO-NAS)和美团的 Bo Zhang(YOLOv6)齐聚一堂,共同探讨开源视觉 AI 的现状。本次讨论将深入探讨模型实施过程中遇到的挑战和优先事项,为实现无缝 AI 采用提供宝贵的见解。此外,小组成员还将讨论边缘设备上的部署、研究对象重新识别模块的潜力,并提供有关模型部署的见解等。
全球部署了大约 10 亿个网络摄像头。由先进 AI 驱动的智能摄像头可以专注于最重要的事情,并为从司机和行人到零售商和购物者的每个人带来空间安全。我们将引导您了解在 NVIDIA Jetson 上进行视频分析应用程序推理的整体边缘性能,您可以使用 YOLOv8 模型升级任何传统摄像头,而无需任何代码。
加入我们,了解 Axelera AI 的 Metis 平台如何以远低于当今解决方案的成本和功耗,提供行业领先的性能和可用性。 了解我们的硬件和软件解决方案的卓越成果,该解决方案优化了 YOLO 模型,以便在边缘设备上进行推理。
人工智能正在改变各个领域、商品和基本功能。然而,深度神经网络在内存、计算能力和能源方面消耗过多资源。为了确保人工智能的广泛应用,它必须在终端用户设备上高效运行,并遵守严格的功率和散热限制。量化和压缩等技术在缓解这些挑战方面发挥着关键作用。
在本次网络研讨会中,索尼的产品经理 Amir Servi 将向您介绍索尼的模型压缩工具包,用于量化和加速深度学习模型,以实现高效的边缘部署。您将学习如何为自己的模型做同样的事情!您将学到:
- 我们在量化技术方面的最新研究及其在实际产品中的应用
- 硬件感知压缩对于边缘推理的重要性
- 工程师和研究人员如何通过 Sony MCT 实施这些技术
Ultralytics HUB 降低了进入机器学习领域的门槛,使个人和企业都能轻松上手,无论是否具备编码专业知识。了解这个平台如何彻底改变我们处理机器学习的方式,使新一代数据爱好者能够以前所未有的轻松方式将他们的想法变为现实。
并且不要错过我们的重大公告...
在从 NVIDIA Jetson 的边缘 GPU 到微型 MCU 的嵌入式设备上部署最先进的模型,会带来挑战和限制。我们将介绍如何以简化的方法部署这些模型(包括 YOLOv8),以及在 NVIDIA Jetson 上进行视频分析应用程序推理的整体边缘性能。
Glenn 始终致力于开发世界上最优秀的视觉 AI。对他而言,这不仅仅是一项技术成就,更是实现 AGI 潜力的重要基石。而引领这项不懈追求的正是 YOLOv5、YOLOv8 和 Ultralytics HUB。
那么,是什么让 Ultralytics YOLO 成为世界上最好的呢?
Transformer 架构的引入以及在 🤗 transformers 库中预训练、微调和推理的用户友好型抽象,极大地推动了计算机视觉的最新进展。本次演讲概述了最新的基于 Transformer 的视觉模型,探讨了 🤗 transformers 库中可用的实用程序,并提供了对背后理念的实践见解。
厌倦了零售结账时的长队?我们的智能队列管理系统就是答案!加入我们,参加关于如何使用 OpenVINO 和 YOLOv8 创建此类系统的分步教程。我们将引导您完成集成这些强大的开源工具的过程,以开发可在零售结账环境中部署的端到端解决方案。您将学习如何优化应用程序以实现出色的性能。无论您是经验丰富的开发人员还是人工智能新手,本次会议都将为您提供使用 OpenVINO 构建智能系统的实用技巧和最佳实践。在演示结束时,您将拥有构建自己的解决方案的知识和资源。
在人工智能(AI)快速发展的时代,驾驭这项技术的伦理格局至关重要。在本次会议中,Mónica将解开伴随人工智能变革力量而来的复杂伦理困境。从解决偏见和公平问题到探索透明度、问责制以及人工智能对社会的深刻影响,Monica将提供洞察力,阐明围绕人工智能的伦理考量。
本次讲座是您全面了解与人工智能相关的伦理挑战和责任的机会。Mónica将为您提供知识,这对于从事人工智能开发、决策或政策制定的人员来说至关重要。
基础模型在 GPU 计算方面可能要求很高,并且可能不适合实时应用,特别是如果您想扩展数百万个自主销售点。但我们利用了一种称为知识蒸馏的方法,我们将基础模型用于注释等复杂任务,并将这些知识转移到更小且更具成本效益的模型中。这使我们的注释过程比传统的人工标注快 90 倍。
嘘。想听个秘密吗?如果我告诉你主动学习不必那么难呢?如果有一种简单的方法呢?你很幸运。本次演讲将向您展示如何使用 DagsHub 的数据引擎来实现主动学习管道。并且 90% 的管道可以直接在 Jupyter Notebook 或 Google Colab 上运行!在本次演讲结束时,您将获得必要的信息,将您现有的项目转换为使用主动学习来高效、快速地改进模型指标的项目!
将 YOLOv8 与开源工具结合使用,可以帮助您快速启动并运行您的下一个视觉 AI 项目。 这里有开源图像的存储库、可帮助自动化数据标记的库、用于跟踪或计数的工具以及用于部署模型的服务器。 了解如何将它们与 YOLOv8 结合使用来构建您的下一个应用程序。
目前,全球范围内对更大、更好的人工智能(AI)系统的竞争预计将对社会和环境产生深远的影响,它将改变就业市场、颠覆商业模式,并实现新的治理和社会福利结构,这些结构可能会影响全球对气候行动路径的共识。然而,当前的人工智能系统是在有偏见的数据集上训练的,这些数据集可能会破坏影响气候变化缓解和适应决策的政治机构,并损害社会稳定,从而可能导致社会临界点事件。因此,适当设计一个较少偏见的人工智能系统,以反映对社会和地球挑战的直接和间接影响,是一个至关重要的问题。
机器学习 (ML) 模型的量化可以显著减小模型大小,并由于降低了带宽需求而减少推理延迟。当部署在有效支持整数计算的硬件上时,性能提升会更加显著。但是,量化有时会导致精度下降到无法接受的程度。在本次演讲中,我们将概述有效量化 YOLOv8 模型的方法,使其成为各种实时边缘 AI 应用的绝佳选择。我们还将介绍一类具有 ReLU6 激活函数的 YOLOv8 模型,这些模型在各种模型架构和数据集上显示出出色的训练后量化结果。最后,我们将演示如何使用简单的 API 将量化模型部署在多个硬件选项上,例如 CPU、Edge TPU 和 Orca(DeGirum 的 AI 硬件加速器)。
Ultralytics 是尖端、最先进的计算机视觉模型的所在地,这些模型适用于图像分类、目标检测、图像分割和姿态估计等任务。Weights & Biases 是一个开发者优先的 MLOps 平台,当与 Ultralytics 工作流程集成时,使我们能够轻松地管理我们的实验、模型检查点,并以富有洞察力和直观的方式可视化我们的实验结果。在本节中,我们将探讨如何使用 Ultralytics 和 Weights & Biases 有效地增强我们的计算机视觉工作流程。
了解我们如何创建 PatentPT,这是一种先进的语言模型解决方案,可大大增强专利搜索和交互能力。该演示文稿提供了关于微调和部署大型语言模型以及利用企业级记忆代理来自动完成专利、生成摘要和权利要求以及使用丰富的专利语料库执行高级专利搜索功能的实用见解。我们将向您介绍如何使用最先进的 Activeloop 的 Deep Lake(AI 数据库)、开源 LLM 模型、Habana Gaudi HPU 硬件和 Amazon Sagemaker 的 LLM 推理 API 开发类似的解决方案。
我们将向您介绍架构蓝图以及我们构建解决方案所采取的所有步骤——从训练我们的 LLM 模型并对其进行微调、创建自定义功能以及部署搜索 API。
无论您是寻求微调 LLM 的实用指南的 AI 从业者,还是有兴趣利用 AI 进行专利搜索的法律专业人士,或者只是对 AI 增强解决方案的未来感到好奇,我们的演讲都让您了解在专业领域中使用 LLM 的过程和潜力。加入我们,分享我们构建由 Deep Lake(适用于各种规模公司的 AI 数据库)提供支持的自定义 LLM 驱动的应用程序的旅程。
开源公司的构建方式不同。在本次演讲中,我们将介绍投资者在考虑 A 轮投资时会关注什么。剧透:你可能不需要收入,但你肯定需要发展势头!我们将分享来自其他 OSS 公司的最佳指标,以帮助你确定何时进行融资。
我们将在马德里的 Google for Startups 以咖啡开启这一天。上午将有一系列讲座,随后是由 Ultralytics 在 Google for Startups 主办的午餐休息。午餐后,我们将重新投入到更多会议中。为了结束 YV23,请加入我们官方的社交欢乐时光,同样由 Google for Startups 主办。
亲自参加活动可以让您沉浸在活动氛围中,与演讲者和与会者互动,并参加交流活动。这是一个与视觉 AI 社区直接互动的独特机会。
无论您选择在线上还是线下加入我们,YV23 的门票都是完全免费的。
Calle de Moreno Nieto, 2, 28005 Madrid, Spain.
YV23 提供线上和线下两种参会方式。要确保您的席位,只需填写此页面上的注册表即可。
如果您在中国,请在此处找到Bilibili虚拟直播。如果您从世界其他地方加入,请使用Youtube虚拟直播。