Từ Dubai với những góc nhìn chuyên sâu: Những bài học rút ra từ Hội nghị thượng đỉnh GDG MENA-T 2025
Nhận những thông tin quan trọng từ Hội nghị thượng đỉnh GDG MENA-T 2025 tại Dubai. Nội dung chuyên sâu này bao gồm các tác nhân AI của Google, Firebase Studio, Gemini và những hiểu biết về computer vision thực tế cho cộng đồng Ultralytics YOLO.

GDG Summit là một hội nghị thường niên quan trọng do Google Developer Groups (GDGs) tổ chức dành cho các nhà phát triển, những người đam mê công nghệ và sinh viên. Hội nghị này quy tụ cộng đồng nhà phát triển địa phương và khu vực, các Google Developer Experts (GDEs) cùng các nhà tổ chức GDG để cùng tìm hiểu về các công nghệ của Google, chia sẻ kiến thức và kết nối với các đồng nghiệp và chuyên gia. Năm nay, nguồn năng lượng tại GDG MENA-T Summit 2025 ở Dubai thực sự rất bùng nổ.
Ngay từ khi đặt chân đến khách sạn Uptown Dubai tuyệt đẹp với tầm nhìn bao quát thành phố, tôi đã biết sự kiện này sẽ rất đặc biệt. Với tư cách là một nhà tổ chức GDG tại Thổ Nhĩ Kỳ và là đại diện của Ultralytics, tôi có cơ hội độc đáo để đảm nhận hai vai trò: một cho cộng đồng nhà phát triển địa phương tại Thổ Nhĩ Kỳ, và một cho cộng đồng thị giác máy tính toàn cầu mà công ty chúng tôi đang phục vụ. Tôi rất háo hức được kết nối, chia sẻ và đắm mình vào tương lai của công nghệ. Những gì tôi tìm thấy là các cuộc thảo luận chuyên sâu, vượt xa khỏi những xu hướng bề nổi, khám phá tận gốc rễ cách chúng ta sẽ xây dựng và triển khai phần mềm trong tương lai. Từ các bài phát biểu quan trọng đến các bản demo và kết nối, hãy cùng điểm qua một số điểm nhấn chính của sự kiện này!

Hình 1. Kỹ sư Machine Learning cấp cao của Ultralytics, Onuralp Sezer tham dự GDG Summit MENAT 2025 tại Dubai cùng các nhà tổ chức GDG Thổ Nhĩ Kỳ. Ảnh của tác giả.
Ba chủ đề chính đã để lại ấn tượng sâu sắc trong tôi: sự tiến hóa nhanh chóng của các AI agent có khả năng kết nối, bình minh của một quy trình phát triển mới được tăng tốc bởi AI, và tầm quan trọng sống còn của việc tối ưu hóa AI để đạt hiệu suất thực tế trong thời gian thực.
Link to this sectionGiải mã các Giao thức Agent: Từ lý thuyết đến triển khai trên cloud#
Một trong những phiên họp hấp dẫn nhất là bài phân tích chuyên sâu của Mete Atamel về các Giao thức Agent. Trong nhiều năm, chúng ta đã nói về các AI agent ở dạng trừu tượng, nhưng phiên này đã đưa khái niệm đó vào thực tế kỹ thuật cụ thể, có thể triển khai được. Mete đã phân tích khung làm việc cho phép các agent trở nên cộng tác thực sự và hữu ích:

Hình 2. Mete Atamel giải thích cách sử dụng a2a trong Agent Development Kit.
MCP (Model Context Protocol): Hãy coi đây là "bộ thông dịch phổ quát" cho một AI agent. Đây là lớp nền tảng cho phép một agent kết nối đáng tin cậy với các công cụ bên ngoài, API và các nguồn dữ liệu. Nếu không có một tiêu chuẩn như MCP, mọi tích hợp sẽ là một công việc tùy chỉnh, dễ hỏng. Với nó, các agent có thể kết nối vào thế giới kỹ thuật số với sự tự tin và nhất quán.
A2A (Agent-to-Agent Protocol): Nếu MCP là cách một agent giao tiếp với các công cụ, thì A2A là cách các agent giao tiếp với nhau. Giao thức này cho phép các agent, ngay cả những agent đang chạy trên các nền tảng hoàn toàn khác nhau, có thể khám phá lẫn nhau, cộng tác, ủy quyền tác vụ và phối hợp các quy trình phức tạp. Đây là khung làm việc cho một tương lai nơi một agent chuyên biệt có thể thuê một agent khác để xử lý một tác vụ con cụ thể, tạo ra một lực lượng lao động tự chủ và năng động.
ADK (Agent Development Kit): Đây là bộ công cụ gắn kết mọi thứ lại với nhau. ADK cung cấp cấu trúc, các thư viện và mô hình để lắp ráp các agent mạnh mẽ sử dụng MCP và A2A. Đó là cây cầu nối từ một khái niệm thú vị đến một hệ thống sẵn sàng cho sản xuất.
Phần thú vị nhất chính là bước cuối cùng: triển khai. Mete đã trình diễn cách một agent được xây dựng bằng ADK có thể được đóng gói container và triển khai dễ dàng trên Google Cloud Run. Điều đó cho thấy một lộ trình rõ ràng, có khả năng mở rộng từ việc xây dựng một agent thông minh trên máy local đến việc chạy nó trong một môi trường serverless được quản lý, sẵn sàng xử lý nhu cầu thực tế.
Link to this sectionMột kỷ nguyên phát triển mới: AI là co-pilot của bạn#
Hội nghị cũng khẳng định rõ ràng rằng AI không còn chỉ là một tính năng mà chúng ta thêm vào ứng dụng; nó đang trở thành một phần cốt lõi của chính quy trình phát triển. Việc trình diễn bộ công cụ mới của Google giống như một cái nhìn thoáng qua về một tương lai hiệu quả hơn hẳn.
Một điểm nhấn quan trọng là sự ra mắt của Firebase Studio, một môi trường dựa trên cloud đầy tham vọng và có tính agent. Bản demo thật ấn tượng: bắt đầu với một câu lệnh ngôn ngữ tự nhiên đơn giản như "Xây dựng cho tôi một ứng dụng chia sẻ ảnh với tính năng đăng nhập người dùng", Firebase Studio bắt đầu thực hiện công việc. Nó tạo khung toàn bộ dự án, thiết lập các lược đồ Cloud Firestore cần thiết, cấu hình các quy tắc xác thực Firebase và tạo mã frontend boilerplate. Đây là một công cụ được thiết kế để loại bỏ các thiết lập tẻ nhạt tiêu tốn quá nhiều thời gian của nhà phát triển, cho phép chúng ta tập trung ngay lập tức vào logic độc đáo và trải nghiệm người dùng của ứng dụng.

Hình 3. Vikas Anand giải thích cách sử dụng và tích hợp Firebase Studio. Ảnh của tác giả.
Cùng với đó là Jules, AI coding agent bất đồng bộ của Google. Jules khác với các công cụ inline như Copilot. Người dùng có thể ủy quyền một tác vụ hoàn chỉnh cho nó: "Tái cấu trúc module này để hiệu quả hơn", "Thêm unit test cho service này" hoặc "Cập nhật tất cả các phụ thuộc trong repo này và sửa bất kỳ thay đổi nào gây lỗi". Sau đó, Jules thực hiện công việc ở chế độ nền và khi hoàn tất, gửi một pull request để bạn xem xét. Mô hình này chuyển đổi vai trò của nhà phát triển từ người viết mã từng dòng sang kiến trúc sư cấp cao và người đánh giá.
Nền tảng của những công cụ mang tính cách mạng này là thế hệ model tiếp theo đầy mạnh mẽ của Google, có thể truy cập thông qua các gói Google One AI Plans. Với khả năng suy luận nâng cao, khả năng đa phương thức và cửa sổ ngữ cảnh khổng lồ, các model này cung cấp "bộ não" giúp các công cụ agent như Jules trở nên khả thi. Mặt khác, Firebase Studio hoàn toàn miễn phí, nhưng nếu bạn muốn tăng hạn mức, bạn cần đăng ký Google Developer Program để có thể sử dụng nhiều hơn.
Link to this sectionTừ suy luận đến hành động: Tối ưu hóa AI thời gian thực với NVIDIA#
Niềm đam mê của chúng tôi nằm ở lĩnh vực thị giác máy tính, vì vậy tôi rất phấn khích khi tham dự bài nói chuyện "Xây dựng hệ thống AI thời gian thực" của Katja Sirazitdinova, Kỹ sư phát triển cấp cao tại NVIDIA. Phiên họp này là cơ hội tuyệt vời để kết nối vai trò Kỹ sư Machine Learning cấp cao tại Ultralytics của tôi trực tiếp với công nghệ tăng tốc phần cứng tiên tiến nhất, và tôi đã đặt những câu hỏi cụ thể về việc tăng cường các đường ống xuất (export pipelines) cho các model YOLO đang được sử dụng rộng rãi của chúng tôi.
Katja đã chia sẻ những thông tin thực tế, vô giá về việc vắt kiệt hiệu suất từ một model. Chúng tôi đi sâu vào các chiến lược như lượng tử hóa model (giảm kích thước model trong khi giảm thiểu mất mát độ chính xác), đảm bảo tính tương thích khi xuất sang các phần cứng khác nhau và tận dụng các bộ công cụ mạnh mẽ của NVIDIA như TensorRT để cải thiện đáng kể thông lượng và giảm độ trễ. Tôi đã ra về với một cuốn sổ đầy ắp các ý tưởng cụ thể để mang trở lại cho đội ngũ Ultralytics, những ý tưởng sẽ giúp toàn bộ cộng đồng của chúng tôi hợp lý hóa quá trình triển khai, giảm ma sát và tận dụng hiệu quả hơn nữa khả năng tăng tốc GPU cho các ứng dụng đòi hỏi cao như robot và phân tích video thời gian thực.

Hình 4. Kỹ sư Machine Learning cấp cao của Ultralytics, Onuralp Sezer và Kỹ sư phát triển cấp cao của NVIDIA Katja Sirazitdinova. Ảnh của tác giả.
Link to this sectionSự giao thoa giữa cộng đồng và đổi mới#
Ngoài các bài phát biểu và demo, hội nghị là một lời nhắc nhở mạnh mẽ về lý do tại sao nguồn mở lại là một thế lực trong thế giới công nghệ: cộng đồng. Những cuộc trò chuyện ở hành lang cũng có giá trị không kém gì các bài thuyết trình. Tôi đã có vô số cuộc trò chuyện với các nhà phát triển, nhà nghiên cứu và doanh nhân sử dụng các công cụ của chúng tôi mỗi ngày. Họ đặt những câu hỏi thực tế, đầy suy ngẫm về gói Ultralytics Python từ việc tối ưu hóa hiệu suất YOLO trên các thiết bị biên đến các trường hợp sử dụng thực tế sáng tạo mà tôi thậm chí chưa từng nghĩ tới.
Việc có thể hỗ trợ tại chỗ, cùng nhau tìm ra giải pháp và thu thập phản hồi trực tiếp, không qua bộ lọc từ người dùng thật sự rất bổ ích. Nó củng cố tầm quan trọng của cộng đồng Ultralytics đối với sứ mệnh của chúng tôi. Mỗi yêu cầu tính năng, mỗi báo cáo lỗi và mỗi câu chuyện thành công được chia sẻ đều làm cho hệ sinh thái của chúng ta vững mạnh hơn. Những tương tác này chính là động lực thúc đẩy sự đổi mới thực sự.
Link to this sectionCùng nhau xây dựng tương lai#
GDG MENA-T Summit không chỉ là một hội nghị; đó là cái nhìn về tương lai. Một tương lai nơi các agent thông minh cộng tác trên đám mây, các công cụ hỗ trợ AI khuếch đại khả năng của chính chúng ta với tư cách là nhà phát triển, và các model của chúng ta chạy nhanh hơn và hiệu quả hơn bao giờ hết. Quan trọng nhất, đó là một tương lai nơi các cộng đồng nguồn mở và đổi mới doanh nghiệp không chỉ cùng tồn tại; mà họ còn chủ động thúc đẩy lẫn nhau tiến lên phía trước.

Hình 5. Ảnh tập thể của toàn bộ nhóm GDG và các nhân viên Google tại lễ bế mạc sự kiện. Ảnh do các nhiếp ảnh gia GDG MENAT thực hiện.
Gửi lời cảm ơn chân thành đến các nhà tổ chức và đội ngũ Google Developer Program, đặc biệt là Ramesh Chander, Nour Bouayadi, Alaa Shahin và Beyza Sunay Güler vì đã tổ chức một sự kiện đầy cảm hứng, phong phú và sâu sắc về mặt kỹ thuật. Động lực từ Dubai rất mạnh mẽ, và tôi không thể chờ đợi để thấy những gì chúng ta sẽ cùng nhau xây dựng tiếp theo.






