Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Từ Dubai với những hiểu biết sâu sắc: Những điểm chính từ Hội nghị thượng đỉnh GDG MENA-T 2025

Onuralp Sezer

4 phút đọc

Ngày 10 tháng 10 năm 2025

Tìm hiểu những điểm chính từ Hội nghị thượng đỉnh GDG MENA-T 2025 tại Dubai. Bài viết này sẽ đề cập đến các tác nhân AI của Google, Firebase Studio, Gemini và những hiểu biết sâu sắc về thị giác máy tính trong thế giới thực dành cho cộng đồng Ultralytics YOLO.

Hội nghị Thượng đỉnh GDG là hội nghị thường niên lớn do Nhóm Nhà phát triển Google (GDG) tổ chức dành cho các nhà phát triển, người đam mê công nghệ và sinh viên. Hội nghị thượng đỉnh này quy tụ cộng đồng nhà phát triển địa phương và khu vực, các Chuyên gia Nhà phát triển Google (GDE) và Ban tổ chức GDG để tìm hiểu về công nghệ Google, chia sẻ kiến thức và kết nối với các đồng nghiệp và chuyên gia. Năm nay, Hội nghị Thượng đỉnh GDG MENA-T 2025 tại Dubai đã diễn ra vô cùng sôi động. 

Ngay từ khoảnh khắc đặt chân đến Khách sạn Uptown Dubai xinh đẹp, với tầm nhìn ngoạn mục ra thành phố, tôi đã biết sự kiện này sẽ vô cùng đặc biệt. Là một nhà tổ chức GDG tại Thổ Nhĩ Kỳ và là đại diện của Ultralytics, tôi đã có cơ hội đặc biệt để đảm nhiệm hai vai trò: một là cho cộng đồng nhà phát triển địa phương của tôi tại Thổ Nhĩ Kỳ, và hai là cho cộng đồng thị giác máy tính toàn cầu mà công ty chúng tôi phục vụ. Tôi rất háo hức được kết nối, chia sẻ và khám phá tương lai của công nghệ. Điều tôi tìm thấy là những cuộc trò chuyện đi sâu hơn là chỉ những xu hướng bề nổi, khám phá tận gốc rễ cách chúng ta sẽ xây dựng và triển khai phần mềm trong tương lai. Từ các bài phát biểu chính đến các buổi demo và giao lưu, hãy cùng điểm qua một số điểm nổi bật từ sự kiện này!

Hình 1. Kỹ sư học máy cấp cao của Ultralytics, Onuralp Sezer, tham dự Hội nghị thượng đỉnh GDG MENAT 2025 tại Dubai cùng nhiều nhà tổ chức GDG Thổ Nhĩ Kỳ. Ảnh của tác giả.

Có ba chủ đề chính để lại ấn tượng cho tôi: sự phát triển nhanh chóng của các tác nhân AI được kết nối, sự ra đời của quy trình phát triển mới được tăng tốc bằng AI và tầm quan trọng của việc tối ưu hóa AI để có hiệu suất thực tế, thời gian thực.

Giải nén các giao thức tác nhân: Từ lý thuyết đến triển khai đám mây

Một trong những buổi hội thảo hấp dẫn nhất là buổi chia sẻ chuyên sâu của Mete Atamel về Giao thức Đại lý (Agent Protocols). Trong nhiều năm, chúng ta đã nói về các đại lý AI một cách trừu tượng, nhưng buổi hội thảo này đã đặt nền tảng cho khái niệm này vào kỹ thuật cụ thể, khả thi. Mete đã phân tích khuôn khổ cho phép các đại lý thực sự trở nên cộng tác và hữu ích:

Hình 2. Mete Atamel giải thích cách sử dụng a2a trong bộ công cụ phát triển tác nhân.

MCP (Giao thức Bối cảnh Mô hình) : Hãy coi đây như "trình biên dịch đa năng" cho một tác nhân AI. Đây là lớp nền tảng cho phép tác nhân kết nối đáng tin cậy với các công cụ, API và nguồn dữ liệu bên ngoài. Nếu không có một tiêu chuẩn như MCP, mọi tích hợp sẽ chỉ là một công việc tùy chỉnh, dễ bị gián đoạn. Với nó, các tác nhân có thể kết nối vào thế giới kỹ thuật số một cách tự tin và nhất quán.

A2A (Giao thức Agent-to-Agent): Nếu MCP là cách một agent giao tiếp với các công cụ, thì A2A là cách các agent giao tiếp *với nhau*. Giao thức này cho phép các agent, ngay cả khi chạy trên các nền tảng hoàn toàn khác nhau, khám phá lẫn nhau, hợp tác, phân công nhiệm vụ và điều phối các quy trình làm việc phức tạp. Đây là khuôn khổ cho một tương lai, nơi một agent chuyên biệt có thể thuê một agent khác để xử lý một nhiệm vụ phụ cụ thể, tạo ra một lực lượng lao động năng động và tự chủ.

ADK (Bộ công cụ Phát triển Agent): Đây là bộ công cụ tổng hợp tất cả. ADK cung cấp cấu trúc, thư viện và mẫu để xây dựng các agent mạnh mẽ bằng MCP và A2A. Đây là cầu nối từ một ý tưởng thú vị đến một hệ thống sẵn sàng đưa vào sản xuất.

Phần thú vị nhất là bước cuối cùng: triển khai. Mete đã chứng minh cách một tác nhân được xây dựng bằng ADK có thể được đóng gói và triển khai dễ dàng trên Google Cloud Run . Bài viết đã chỉ ra một lộ trình rõ ràng, có khả năng mở rộng từ việc xây dựng một tác nhân thông minh trên máy cục bộ đến việc chạy nó trong một môi trường được quản lý, không cần máy chủ, sẵn sàng xử lý nhu cầu thực tế.

Kỷ nguyên phát triển mới: AI là người đồng hành cùng bạn

Hội nghị thượng đỉnh cũng khẳng định rõ ràng rằng AI không còn chỉ là một tính năng chúng ta thêm vào ứng dụng nữa; nó đang trở thành một phần cốt lõi của chính quá trình phát triển. Việc giới thiệu bộ công cụ mới của Google giống như một cái nhìn thoáng qua về một tương lai hiệu quả hơn rất nhiều.

Điểm nhấn chính là sự ra mắt của Firebase Studio , một môi trường đám mây đầy tham vọng, mang tính đại diện. Bản demo thật ấn tượng: bắt đầu bằng một lời nhắc ngôn ngữ tự nhiên đơn giản như "Xây dựng cho tôi một ứng dụng chia sẻ ảnh với thông tin đăng nhập của người dùng", Firebase Studio đã bắt đầu hoạt động. Nó đã xây dựng toàn bộ dự án, thiết lập các lược đồ Cloud Firestore cần thiết, cấu hình các quy tắc Xác thực Firebase và tạo mã front-end mẫu. Đây là một công cụ được thiết kế để loại bỏ quá trình thiết lập rườm rà, vốn chiếm rất nhiều thời gian của nhà phát triển, cho phép chúng tôi tập trung ngay vào logic độc đáo và trải nghiệm người dùng của ứng dụng.

Hình 3. Vikas Anand giải thích cách sử dụng và tích hợp Firebase Studio. Hình ảnh của tác giả.

Bên cạnh đó là Jules , trình mã hóa AI không đồng bộ của Google. Jules khác với các công cụ nội tuyến như Copilot. Người dùng có thể ủy thác cho nó một nhiệm vụ hoàn chỉnh: "Cải tiến mô-đun này để hiệu quả hơn", "Thêm các bài kiểm tra đơn vị cho dịch vụ này" hoặc "Cập nhật tất cả các phụ thuộc trong kho lưu trữ này và sửa bất kỳ thay đổi nào gây lỗi". Sau đó, Jules sẽ làm việc trên nền tảng và khi hoàn tất, sẽ gửi yêu cầu kéo để bạn xem xét. Mô hình này chuyển vai trò của nhà phát triển từ người viết mã từng dòng sang một kiến trúc sư và người đánh giá cấp cao.

Nền tảng cho những công cụ mang tính cách mạng này là thế hệ mô hình mạnh mẽ tiếp theo của Google, có thể truy cập thông qua Gói Google One AI. Với khả năng lập luận nâng cao, khả năng đa phương thức và cửa sổ ngữ cảnh rộng lớn, các mô hình này cung cấp "bộ não" giúp các công cụ agentic Jules trở nên khả thi. Firebase Studio thì miễn phí, nhưng nếu bạn muốn tăng hạn ngạch, bạn cần đăng ký Chương trình Nhà phát triển Google để có thể sử dụng nhiều hơn. 

Từ suy luận đến hành động: Tối ưu hóa AI thời gian thực với NVIDIA

Niềm đam mê của chúng tôi nằm ở thị giác máy tính, vì vậy tôi rất vui mừng được tham dự buổi nói chuyện "Xây dựng Hệ thống AI Thời gian thực" của Katja Sirazitdinova , Nhà phát triển Cấp cao tại NVIDIA . Buổi nói chuyện này là một cơ hội tuyệt vời để tôi kết nối trực tiếp vai trò Kỹ sư Học máy Cấp cao tại Ultralytics với công nghệ tăng tốc phần cứng tiên tiến, và được đặt ra những câu hỏi cụ thể về việc cải thiện quy trình xuất dữ liệu cho các mô hình YOLO được sử dụng rộng rãi của chúng tôi.

Katja đã chia sẻ những hiểu biết thực tế và vô giá về việc khai thác tối đa hiệu suất của một mô hình. Chúng tôi đã đi sâu vào các chiến lược như lượng tử hóa mô hình (giảm kích thước mô hình đồng thời giảm thiểu tổn thất độ chính xác), đảm bảo khả năng tương thích xuất dữ liệu trên nhiều phần cứng khác nhau và tận dụng các chuỗi công cụ mạnh mẽ của NVIDIA như TensorRT để cải thiện đáng kể thông lượng và giảm độ trễ. Tôi đã mang theo một cuốn sổ tay đầy những ý tưởng cụ thể để chia sẻ với nhóm Ultralytics, những ý tưởng sẽ giúp toàn bộ cộng đồng chúng tôi hợp lý hóa việc triển khai, giảm thiểu xung đột và tận dụng tốt hơn nữa khả năng tăng tốc GPU cho các ứng dụng đòi hỏi thời gian thực cao như robot và phân tích video.

Hình 4. Kỹ sư học máy cấp cao của Ultralytics, Onuralp Sezer và Nhà phát triển cấp cao của NVIDIA , Katja Sirazitdinova. Hình ảnh của tác giả.

Giao điểm của cộng đồng và đổi mới

Bên cạnh các bài phát biểu chính và demo, hội nghị thượng đỉnh là một lời nhắc nhở mạnh mẽ về lý do tại sao mã nguồn mở lại là một thế lực mạnh mẽ trong thế giới công nghệ: cộng đồng. "Hành lang" cũng giá trị như các buổi tọa đàm. Tôi đã có vô số cuộc trò chuyện với các nhà phát triển, nhà nghiên cứu và doanh nhân sử dụng công cụ của chúng tôi hàng ngày. Họ đã đặt ra những câu hỏi thực tế và sâu sắc về gói Python ` Ultralytics` , từ việc tối ưu hóa hiệu suất YOLO trên các thiết bị biên cho đến các trường hợp sử dụng sáng tạo, thực tế mà tôi chưa từng nghĩ đến.

Việc có thể hỗ trợ ngay tại chỗ, cùng nhau đưa ra giải pháp và thu thập phản hồi trực tiếp, không qua kiểm duyệt từ người dùng là một thành quả vô cùng đáng tự hào. Điều này càng khẳng định tầm quan trọng của cộng đồng Ultralytics đối với sứ mệnh của chúng tôi. Mỗi yêu cầu tính năng, mỗi báo cáo lỗi và mỗi câu chuyện thành công được chia sẻ đều củng cố hệ sinh thái của chúng tôi. Chính những tương tác này là động lực thúc đẩy sự đổi mới thực sự.

Cùng nhau xây dựng tương lai

Hội nghị thượng đỉnh GDG MENA-T không chỉ là một hội nghị; đó là một cái nhìn thoáng qua về tương lai. Một tương lai nơi các tác nhân thông minh cộng tác trên nền tảng đám mây, các công cụ hỗ trợ AI khuếch đại năng lực phát triển của chúng ta, và các mô hình của chúng ta chạy nhanh hơn và hiệu quả hơn bao giờ hết. Quan trọng nhất, đó là một tương lai nơi các cộng đồng nguồn mở và đổi mới doanh nghiệp không chỉ cùng tồn tại; mà còn chủ động thúc đẩy lẫn nhau tiến lên.

Hình 5. Toàn cảnh bức ảnh nhóm GDG và Googler tại lễ bế mạc sự kiện. Ảnh do nhiếp ảnh gia GDG MENAT chụp.

Xin chân thành cảm ơn ban tổ chức và đội ngũ Chương trình Nhà phát triển Google, đặc biệt là Ramesh Chander, Nour Bouayadi, Alaa Shahin và Beyza Sunay Güler đã cùng nhau tạo nên một sự kiện đầy cảm hứng, bổ ích và sâu sắc về mặt kỹ thuật. Động lực từ Dubai rất mạnh mẽ, và tôi rất mong chờ xem chúng ta sẽ cùng nhau xây dựng những gì tiếp theo.

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard