Hãy cùng nhìn lại sự kiện lớn nhất trong năm của Ultralytics, giới thiệu sự kiện ra mắt Ultralytics YOLO26, các hội thảo truyền cảm hứng và những điểm nổi bật của cộng đồng.
Hãy cùng nhìn lại sự kiện lớn nhất trong năm của Ultralytics, giới thiệu sự kiện ra mắt Ultralytics YOLO26, các hội thảo truyền cảm hứng và những điểm nổi bật của cộng đồng.
Cộng đồng AI và thị giác máy tính đã cùng nhau tham gia vào ngày 25 tháng 9 cho YOLO Vision 2025 (YV25), sự kiện Vision AI thường niên kết hợp của Ultralytics. Được tổ chức tại London tại The Pelligon và phát trực tiếp trên toàn thế giới, sự kiện này đã chào đón một nhóm đa dạng các nhà nghiên cứu, kỹ sư và những người đam mê AI để chia sẻ ý tưởng và tìm hiểu về những đổi mới mới, chẳng hạn như Ultralytics YOLO26.
Đánh dấu năm thứ tư, sự kiện tiếp tục phát triển về phạm vi tiếp cận và tác động. Livestream YV25 đã thu hút hơn 6.800 lượt xem, tạo ra hơn 49.000 lượt hiển thị và thu về gần 2.000 giờ xem.
YV25 đã bắt đầu với lời khai mạc từ người dẫn chương trình Oisin Lunny, người đã tạo không khí cho cả ngày bằng cách khuyến khích những người tham dự kết nối, chia sẻ và tận dụng tối đa sự kiện. Như ông đã nói, "YOLO Vision 2025 là hội nghị kết nối cộng đồng AI thị giác mã nguồn mở để tập trung vào dữ liệu, học máy và những tiến bộ trong lĩnh vực thị giác máy tính."
Trong bài viết này, chúng ta sẽ tóm tắt những điểm nổi bật chính từ YOLO Vision 2025, bao gồm việc ra mắt sản phẩm, các bài phát biểu quan trọng, một hội thảo, các bản trình diễn trực tiếp và những khoảnh khắc cộng đồng đã làm cho ngày này trở nên đặc biệt. Hãy cùng bắt đầu!
Trước sự kiện, có rất nhiều sự phấn khích xung quanh việc ra mắt sản phẩm mới và Glenn Jocher, Người sáng lập kiêm Giám đốc điều hành của chúng tôi, đã bắt đầu ngày mới bằng cách xây dựng trên năng lượng đó.
Ông chia sẻ hành trình của Ultralytics, nhớ lại vào năm 2020, ông đã chạy các thử nghiệm trên một card đồ họa 1080 Ti duy nhất cắm vào MacBook của mình, một thiết lập đã lỗi thời ngày nay. Từ những khởi đầu скромный đó, Ultralytics đã phát triển thành một cộng đồng toàn cầu với hàng tỷ lượt suy luận hàng ngày được cung cấp bởi các mô hình YOLO.
Glenn cũng đã nói về việc Ultralytics gần đây đã kết thúc vòng gọi vốn Series A trị giá 30 triệu đô la. Ông giải thích khoản đầu tư này sẽ thúc đẩy giai đoạn tăng trưởng tiếp theo bằng cách cho phép công ty mở rộng đội ngũ, mở rộng nghiên cứu và đảm bảo các tài nguyên máy tính cần thiết để tiếp tục vượt qua các giới hạn của thị giác máy tính.
Glenn tiếp tục công bố hai nỗ lực mới từ Ultralytics. Đầu tiên là Ultralytics YOLO26, mô hình mới nhất trong dòng Ultralytics YOLO, được thiết kế nhỏ hơn, nhanh hơn và hiệu quả hơn đồng thời đạt được độ chính xác cao hơn nữa. Thứ hai là Ultralytics Platform, một không gian làm việc SaaS end-to-end mới kết hợp dữ liệu, huấn luyện, triển khai và giám sát để giúp việc xây dựng các giải pháp thị giác máy tính trở nên dễ dàng hơn bao giờ hết, dự kiến sẽ được công bố trong tương lai gần.

YOLO26 được xây dựng để thúc đẩy hiệu suất trong khi vẫn thiết thực cho việc sử dụng trong thế giới thực. Phiên bản nhỏ nhất đã chạy nhanh hơn tới 43% trên CPU đồng thời vẫn cải thiện độ chính xác, khiến nó trở nên lý tưởng cho các ứng dụng từ thiết bị di động đến các hệ thống doanh nghiệp lớn. YOLO26 sẽ được công khai vào cuối tháng 10.
Đây là cái nhìn sơ lược về các tính năng chính của YOLO26:
Sau khi giới thiệu YOLO26, Glenn đã mời Prateek Bhatnagar, Giám đốc Kỹ thuật Sản phẩm của chúng tôi, trình diễn dự án tiếp theo sắp ra mắt, Nền tảng Ultralytics. Được xây dựng để đơn giản hóa toàn bộ quy trình làm việc của thị giác máy tính, nền tảng này nhằm mục đích tập hợp các bộ dữ liệu, chú thích, đào tạo, triển khai và giám sát ở một nơi.
Prateek đã so sánh nó với việc điều chỉnh một chiếc xe hơi: thay vì đến các cửa hàng khác nhau để mua lốp xe, động cơ và hộp số, mọi thứ diễn ra trong một nhà để xe. Tương tự, nền tảng này cung cấp cho các nhà phát triển một không gian làm việc tích hợp để quản lý toàn bộ vòng đời của một mô hình AI thị giác.
Bản demo giới thiệu các công cụ chú giải hỗ trợ bởi AI giúp tăng tốc quá trình chuẩn bị bộ dữ liệu, các tùy chọn huấn luyện tùy chỉnh cho cả chuyên gia và người mới bắt đầu, và khả năng giám sát thời gian thực các lần chạy huấn luyện.
Một điểm nổi bật khác của YV25 là hội thảo về triển khai biên, do Oisin Lunny điều hành. Phiên họp có sự tham gia của Yuki Tsuji từ Sony Semiconductor Solutions, David Plowman từ Raspberry Pi và Glenn Jocher.
Cuộc thảo luận đã khám phá cách di chuyển AI đến biên giúp giảm độ trễ, giảm chi phí và cải thiện quyền riêng tư. Yuki đã giới thiệu cảm biến IMX500 của Sony, có thể chạy suy luận trực tiếp trên chip. Trong khi đó, David đã nói về cách Raspberry Pi đang mở rộng từ nguồn gốc nhà sản xuất sang các ứng dụng thương mại quy mô lớn.

Hội thảo cũng đề cập đến một trong những rào cản lớn nhất đối với các nhà phát triển: làm cho các mô hình chạy trơn tru trên các thiết bị khác nhau. Đây là nơi mà gói Ultralytics Python đóng vai trò quan trọng.
Với nhiều tùy chọn xuất, nó giúp bạn dễ dàng chuyển một mô hình đã được huấn luyện vào sản xuất trên thiết bị di động, hệ thống nhúng hoặc phần cứng doanh nghiệp. Bằng cách loại bỏ những khó khăn trong việc chuyển đổi mô hình, Ultralytics giúp các nhóm tập trung vào việc xây dựng các giải pháp thay vì phải vật lộn với các vấn đề về khả năng tương thích.
Như David đã giải thích, "Tôi biết từ kinh nghiệm cay đắng của mình rằng việc chuyển đổi mô hình là rất kinh khủng, và nếu ai đó làm điều đó cho tôi, nó sẽ làm cho cuộc sống dễ dàng hơn rất nhiều. Đó là nơi Ultralytics thực sự cải thiện câu chuyện và cung cấp một cái gì đó có giá trị cho người dùng của họ."
Những tiến bộ về phần mềm AI đang diễn ra song song với phần cứng và cùng nhau thúc đẩy một làn sóng đổi mới mới trong thị giác máy tính. Trong khi các mô hình như Ultralytics YOLO tiếp tục thúc đẩy độ chính xác, tác động thực tế của chúng cũng phụ thuộc vào các nền tảng mà chúng chạy trên đó.
Ví dụ: Seeed Studio đã giới thiệu cách phần cứng mô-đun, chi phí thấp như bảng mạch reCamera và XIAO của họ, được cài đặt sẵn các mô hình Ultralytics YOLO, giúp các nhà phát triển dễ dàng chuyển từ tạo mẫu sang các hệ thống AI thực tế. Loại tích hợp phần cứng–phần mềm này làm giảm rào cản gia nhập và cho thấy sự đổi mới ở cấp độ phần cứng trực tiếp đẩy nhanh việc áp dụng như thế nào.
Dưới đây là một số điểm chính rút ra từ các bài phát biểu quan trọng khác của YV25, nhấn mạnh cách thiết kế phối hợp phần cứng-phần mềm đang mở ra những khả năng mới:
Với những tiến bộ song hành trong cả phần mềm và phần cứng, thị giác máy tính đang phát triển nhanh hơn bao giờ hết. Sự phát triển song song này không chỉ cải thiện độ chính xác và tốc độ mà còn định hình cách AI thị giác có thể được triển khai trong thế giới thực. Tại YV25, những người tham gia đã có cơ hội lắng nghe từ các chuyên gia trong lĩnh vực robot, triển khai biên và AI đa phương thức, mỗi người đưa ra một góc nhìn khác nhau về hướng đi của lĩnh vực này.
Ví dụ: trong bài phát biểu quan trọng của mình, Michael Hart từ D-Robotics đã trình bày cách kết hợp các mô hình Ultralytics YOLO với bo mạch RDK X5 nhỏ gọn của họ (một mô-đun thị giác AI nhúng nhỏ) cho phép robot chạy các mô hình thị giác nâng cao trong thời gian thực. Bản demo trực tiếp của ông cho thấy ngành robot đã tiến xa như thế nào, phát triển từ các thử nghiệm trong phòng thí nghiệm thành các hệ thống thực tế, được hỗ trợ bởi AI.

Tương tự, Alexis Crowell và Steven Hunsche từ Axelera AI đã nhấn mạnh những thách thức và cơ hội của việc triển khai vision AI ở biên. Thông qua các bản demo trực tiếp, họ đã giải thích cách các Đơn vị xử lý AI (AIPU) Metis của Axelera AI kết hợp RISC-V và tính toán trong bộ nhớ kỹ thuật số để mang lại hiệu suất cao với mức tiêu thụ điện năng rất thấp. Được đóng gói trong các hệ số hình thức quen thuộc như M.2 và PCIe, thiết kế phần cứng-phần mềm kết hợp của nền tảng giúp mở rộng quy mô AI biên một cách thiết thực và hiệu quả.
Và trong một phiên khác, Merve Noyan từ Hugging Face đã khám phá sự trỗi dậy của AI đa phương thức, nơi các mô hình kết hợp thị giác với văn bản, âm thanh và các đầu vào khác. Cô đã nói về các trường hợp sử dụng từ phân tích tài liệu đến các tác nhân hiện thân, nhấn mạnh cách đổi mới mã nguồn mở đang đẩy nhanh việc áp dụng AI.
Trong khi YV25 có các bài nói chuyện truyền cảm hứng về bức tranh toàn cảnh lớn, nó cũng bao gồm các phiên thực hành chuyên sâu. Jiri Borovec từ Lightning AI đã trình bày hướng dẫn thực hành cho thấy cách huấn luyện và tinh chỉnh các mô hình Ultralytics YOLO với PyTorch Lightning và hỗ trợ đa GPU.
Ông trình bày các ví dụ về code và nhấn mạnh cách các công cụ mã nguồn mở, tài liệu rõ ràng và các framework linh hoạt giúp các nhà phát triển dễ dàng mở rộng quy mô huấn luyện, xác thực mọi giai đoạn và điều chỉnh quy trình làm việc cho các dự án của riêng họ. Đó là một lời nhắc nhở về tầm quan trọng của cộng đồng và các công cụ dễ tiếp cận đối với sự tiến bộ thực sự trong lĩnh vực thị giác máy tính.
Ở một khía cạnh khác, các diễn giả kêu gọi khán giả suy nghĩ về vai trò rộng lớn hơn của AI trong xã hội. Trong bài phát biểu quan trọng của mình, Gerd Leonhard, nhà tương lai học, nhà nhân văn học và Giám đốc điều hành của The Futures Agency, lập luận rằng "công nghệ mang tính trung lập về mặt đạo đức cho đến khi chúng ta sử dụng nó", nhấn mạnh rằng câu hỏi thực sự không chỉ là AI có thể làm gì, mà là nó nên làm gì. Ông cảnh báo về việc rơi vào những cạm bẫy như giản lược và thiếu trung thực, đồng thời kêu gọi AI thực sự phục vụ lợi ích lâu dài của nhân loại.

Sự tập trung vào trách nhiệm này tiếp tục trong cuộc trò chuyện thân mật với Carissa Véliz từ Đại học Oxford, người nhấn mạnh đến quyền riêng tư và bảo mật. Bà chỉ ra rằng các cộng đồng mã nguồn mở rất quan trọng để kiểm tra và cải thiện mã, đồng thời đạo đức và thiết kế là không thể tách rời. Thông điệp của bà rất rõ ràng: các nhà phát triển cần dự đoán việc sử dụng sai mục đích và xây dựng các hệ thống đặt phẩm giá con người và phúc lợi xã hội lên hàng đầu.
Vượt xa các bài nói chuyện và trình diễn, YV25 cũng tạo không gian cho mọi người kết nối. Trong giờ giải lao và ăn trưa, những người tham dự đã giao lưu, chia sẻ kinh nghiệm, so sánh các phương pháp tiếp cận và khơi dậy những hợp tác mới.
Đối với đội ngũ Ultralytics, đây cũng là một cơ hội tuyệt vời để gặp gỡ trực tiếp. Với các thành viên trải rộng trên toàn cầu, những khoảnh khắc như thế này giúp củng cố các mối quan hệ và cùng nhau ăn mừng tiến bộ.

Ngày hội khép lại với một bữa tiệc after-party, nơi những người tham gia có cơ hội thư giãn và tiếp tục kết nối. Đó là khoảnh khắc để suy ngẫm, nạp lại năng lượng và hướng tới chương tiếp theo của sự đổi mới trong Vision AI.
YOLO Vision 2025 là một sự kiện tôn vinh những ý tưởng, sự đổi mới và cộng đồng. Sự ra mắt của Ultralytics YOLO26 đã tạo tiền đề, tiếp theo là các bài nói chuyện hấp dẫn về triển khai edge và AI lấy con người làm trung tâm, làm nổi bật sự tiến bộ nhanh chóng của Vision AI và tác động ngày càng tăng của nó trên thế giới.
Ngoài các phiên họp quan trọng, sự kiện này đã đưa mọi người đến với nhau. Các nhà nghiên cứu, nhà phát triển và những người đam mê đã chia sẻ kinh nghiệm, khơi dậy những cuộc trò chuyện ý nghĩa và khám phá những khả năng mới cho tương lai. Sự kiện kết thúc tốt đẹp, với những người tham gia hào hứng về tương lai của các mô hình Ultralytics YOLO và thị giác máy tính.
Bạn đã sẵn sàng khám phá AI chưa? Tham gia cộng đồng và kho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về AI và thị giác máy tính. Truy cập các trang giải pháp của chúng tôi để khám phá thêm các ứng dụng của thị giác máy tính trong nông nghiệp và AI trong robot học. Kiểm tra các tùy chọn cấp phép của chúng tôi và bắt đầu với thị giác máy tính ngay hôm nay!