敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024

来自迪拜的真知灼见:2025 年 GDG 中东和北非峰会的主要收获

Onuralp Sezer

4 分钟阅读

2025 年 10 月 10 日

获取 2025 年迪拜 GDG MENA-T 峰会的主要收获。本深度报道涵盖谷歌的人工智能代理、Firebase Studio、Gemini 以及 Ultralytics YOLO 社区的真实计算机视觉见解。

谷歌开发者峰会(GDG Summit)是谷歌开发者团体(GDG)为开发者、技术爱好者和学生组织的大型年度会议。今年,在迪拜举行的2025 年 GDG MENA-T 峰会充满了活力。 

从我到达美丽的迪拜 Uptown 酒店的那一刻起,我就知道这次活动将与众不同。作为来自土耳其的 GDG 组织者和 Ultralytics 的代表,我有机会戴上两顶帽子:一顶是土耳其当地的开发者社区,另一顶是我们公司服务的全球计算机视觉社区。我渴望与人交流、分享,并深入探讨技术的未来。我所发现的是比表面趋势更深层次的对话,探讨了我们明天将如何构建和部署软件的根本结构。从主题演讲到演示和交流,让我们来看看这次活动的一些主要亮点!

图 1.Ultralytics 高级机器学习工程师 Onuralp Sezer 与 GDG 土耳其组织者一起出席在迪拜举行的 GDG 峰会 MENAT 2025。图片由作者提供。

有三大主题给我留下了深刻印象:互联人工智能代理的快速发展、新的人工智能加速开发工作流程的到来,以及优化人工智能在现实世界中的实时性能的极端重要性。

解读代理协议:从理论到云部署

梅特-阿塔梅尔(Mete Atamel)深入探讨了代理协议,这是最引人注目的会议之一。多年来,我们一直在抽象地谈论人工智能代理,但这次会议将这一概念落实到了具体可行的工程中。梅特分解了让代理成为真正协作和有用的代理的框架:

图 2.Mete Atamel 解释制剂开发套件中的 a2a 用途。

MCP(模型上下文协议):将其视为人工智能代理的 "通用翻译器"。它是一个基础层,允许代理与外部工具、应用程序接口和数据源可靠连接。如果没有像 MCP 这样的标准,每一次集成都将是定制的、脆弱的工作。有了它,人工智能代理就能放心、一致地接入数字世界。

A2A(代理对代理协议):如果说 MCP 是代理与工具之间的对话方式,那么 A2A 就是代理与代理之间的对话方式。该协议使代理(即使是在完全不同的平台上运行的代理)能够相互发现、协作、委派任务并协调复杂的工作流程。这是未来的一个框架,在这个框架中,一个专门的代理可以雇佣另一个代理来处理特定的子任务,从而创建一个动态、自主的工作团队。

ADK(代理开发工具包):这是一个工具包,可将所有内容整合在一起。ADK 提供了使用 MCP 和 A2A 组装强大代理的结构、库和模式。它是从一个很酷的概念到一个可投入生产的系统的桥梁。

最激动人心的部分是最后一步:部署。Mete 演示了如何将使用 ADK 构建的代理容器化,并毫不费力地部署到Google Cloud Run 上。 它展示了一条清晰、可扩展的路径,从在本地机器上构建智能代理,到在可管理的无服务器环境中运行,随时应对现实世界的需求。

发展的新时代:人工智能成为你的副驾驶

峰会还明确指出,人工智能不再只是我们添加到应用程序中的一项功能,它正在成为开发过程本身的核心部分。谷歌新工具套件的展示让人仿佛看到了一个更加高效的未来。

主要亮点是推出了 Firebase Studio的介绍,这是一个雄心勃勃的基于云的代理环境。该演示令人叹为观止:Firebase Studio 从一个简单的自然语言提示开始工作,例如 "为我创建一个带用户登录的照片共享应用"。它为整个项目搭建了脚手架,设置了必要的 Cloud Firestore 模式,配置了 Firebase 身份验证规则,并生成了模板式前端代码。该工具旨在消除耗费开发人员大量时间的繁琐设置,让我们能够立即专注于应用程序的独特逻辑和用户体验。

图 3.Vikas Anand 解释 firebase studio 的使用和集成。图片由作者提供。

与此同时 朱尔斯谷歌的异步人工智能编码代理。Jules 与 Copilot 等内嵌工具不同。人们可以将一项完整的任务委托给它:"重构这个模块,使其更高效"、"为这个服务添加单元测试 "或 "更新这个 repo 中的所有依赖关系,并修复任何破坏性改动"。然后,Jules 会在后台进行处理,完成后提交拉取请求供您审核。这种模式将开发人员的角色从逐行编写代码转变为高级架构师和审核者。

这些革命性工具的基础是强大的新一代谷歌模型,可通过 Google One AI 计划访问。这些模型具有更强的推理能力、多模态功能和海量上下文窗口,为朱尔斯代理工具提供了 "大脑"。另一方面,Firebase Studio 是免费的,但如果你想增加配额,就需要订阅谷歌开发者计划,这样你就可以使用更多。 

从推理到行动:利用英伟达™(NVIDIA®)优化实时人工智能

我们对计算机视觉充满热情,因此我很高兴能参加英伟达公司高级开发人员Katja Sirazitdinova 的 "构建实时人工智能系统 "讲座。这次会议为我提供了一个绝佳的机会,让我作为 Ultralytics 的高级机器学习工程师,能够直接接触到硬件加速的最前沿技术,我还提出了关于增强我们广泛使用的 YOLO 模型导出管道的具体问题。

Katja 分享了关于如何从模型中榨取最后一滴性能的宝贵实用见解。我们深入探讨了模型量化(在减少精度损失的同时缩小模型尺寸)、确保不同硬件间的输出兼容性以及利用英伟达™(NVIDIA®)强大的工具链(如 TensorRT)来显著提高吞吐量和减少延迟等策略。我带着满满一笔记本的具体想法回到了 Ultralytics 团队,这些想法将帮助我们整个社区简化部署、减少摩擦,并更好地利用 GPU 加速来实现机器人和视频分析等要求苛刻的实时应用。

图 4.Ultralytics 高级机器学习工程师 Onuralp Sezer 和英伟达高级开发人员Katja Sirazitdinova。 图片由作者提供。

社区与创新的交汇点

除了各种主题演讲和演示之外,峰会还有力地提醒人们开源技术在科技界如此强大的原因:社区。走廊轨道 "和演讲一样有价值。我与每天使用我们工具的开发人员、研究人员和企业家进行了无数次交谈。他们就 "Ultralytics"Python 程序包提出了很多贴心、实用的问题,从优化边缘设备上的 YOLO 性能,到我从未考虑过的创造性实际用例

能够为我们的用户提供现场支持、集思广益的解决方案并收集直接的、未经过滤的反馈意见,是一件非常有意义的事情。这更加坚定了Ultralytics 社区对我们使命的重要性。每一个功能请求、每一个错误报告、每一个成功故事的分享都会加强我们的生态系统。这些互动推动了真正的创新。

共创未来

GDG MENA-T 峰会不仅仅是一次会议,更是对未来的一瞥。在未来,智能代理将在云端协作,人工智能工具将增强我们作为开发人员的能力,我们的模型将比以往运行得更快、更高效。最重要的是,在这个未来,开源社区和企业创新不仅共存,而且会积极推动彼此向前发展。

图 5.GDG 和 Googlers 全体成员在活动闭幕式上合影。图片由 GDG MENAT 摄影师拍摄。

衷心感谢组织者和谷歌开发者项目团队,特别是 Ramesh Chander、Nour Bouayadi、Alaa Shahin 和 Beyza Sunay Güler 为我们组织了这样一次鼓舞人心、内容丰富、技术精深的活动。迪拜的发展势头强劲,我迫不及待地想看到我们接下来的发展。

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板