Yolo Vision Thâm Quyến
Thâm Quyến
Tham gia ngay

Những điểm nổi bật chính của Ultralytics từ YOLO Vision 2025!

Abirami Vina

5 phút đọc

29 tháng 9, 2025

Hãy cùng nhìn lại sự kiện lớn nhất trong năm của Ultralytics, giới thiệu sự kiện ra mắt Ultralytics YOLO26, các hội thảo truyền cảm hứng và những điểm nổi bật của cộng đồng.

Cộng đồng AI và thị giác máy tính đã cùng nhau tham gia vào ngày 25 tháng 9 cho YOLO Vision 2025 (YV25), sự kiện Vision AI thường niên kết hợp của Ultralytics. Được tổ chức tại London tại The Pelligon và phát trực tiếp trên toàn thế giới, sự kiện này đã chào đón một nhóm đa dạng các nhà nghiên cứu, kỹ sư và những người đam mê AI để chia sẻ ý tưởng và tìm hiểu về những đổi mới mới, chẳng hạn như Ultralytics YOLO26.

Đánh dấu năm thứ tư, sự kiện tiếp tục phát triển về phạm vi tiếp cận và tác động. Livestream YV25 đã thu hút hơn 6.800 lượt xem, tạo ra hơn 49.000 lượt hiển thị và thu về gần 2.000 giờ xem.

YV25 đã bắt đầu với lời khai mạc từ người dẫn chương trình Oisin Lunny, người đã tạo không khí cho cả ngày bằng cách khuyến khích những người tham dự kết nối, chia sẻ và tận dụng tối đa sự kiện. Như ông đã nói, "YOLO Vision 2025 là hội nghị kết nối cộng đồng AI thị giác mã nguồn mở để tập trung vào dữ liệu, học máy và những tiến bộ trong lĩnh vực thị giác máy tính."

Trong bài viết này, chúng ta sẽ tóm tắt những điểm nổi bật chính từ YOLO Vision 2025, bao gồm việc ra mắt sản phẩm, các bài phát biểu quan trọng, một hội thảo, các bản trình diễn trực tiếp và những khoảnh khắc cộng đồng đã làm cho ngày này trở nên đặc biệt. Hãy cùng bắt đầu!

Từ một GPU duy nhất đến vòng gọi vốn Series A trị giá 30 triệu đô la

Trước sự kiện, có rất nhiều sự phấn khích xung quanh việc ra mắt sản phẩm mới và Glenn Jocher, Người sáng lập kiêm Giám đốc điều hành của chúng tôi, đã bắt đầu ngày mới bằng cách xây dựng trên năng lượng đó. 

Ông chia sẻ hành trình của Ultralytics, nhớ lại vào năm 2020, ông đã chạy các thử nghiệm trên một card đồ họa 1080 Ti duy nhất cắm vào MacBook của mình, một thiết lập đã lỗi thời ngày nay. Từ những khởi đầu скромный đó, Ultralytics đã phát triển thành một cộng đồng toàn cầu với hàng tỷ lượt suy luận hàng ngày được cung cấp bởi các mô hình YOLO.

Glenn cũng đã nói về việc Ultralytics gần đây đã kết thúc vòng gọi vốn Series A trị giá 30 triệu đô la. Ông giải thích khoản đầu tư này sẽ thúc đẩy giai đoạn tăng trưởng tiếp theo bằng cách cho phép công ty mở rộng đội ngũ, mở rộng nghiên cứu và đảm bảo các tài nguyên máy tính cần thiết để tiếp tục vượt qua các giới hạn của thị giác máy tính. 

Ultralytics YOLO26: Một mô hình YOLO tốt hơn, nhanh hơn, nhỏ hơn

Glenn tiếp tục công bố hai nỗ lực mới từ Ultralytics. Đầu tiên là Ultralytics YOLO26, mô hình mới nhất trong dòng Ultralytics YOLO, được thiết kế nhỏ hơn, nhanh hơn và hiệu quả hơn đồng thời đạt được độ chính xác cao hơn nữa. Thứ hai là Ultralytics Platform, một không gian làm việc SaaS end-to-end mới kết hợp dữ liệu, huấn luyện, triển khai và giám sát để giúp việc xây dựng các giải pháp thị giác máy tính trở nên dễ dàng hơn bao giờ hết, dự kiến sẽ được công bố trong tương lai gần.

Hình 1. Glenn Jocher công bố Ultralytics YOLO26 trên sân khấu tại YOLO Vision 2025.

YOLO26 được xây dựng để thúc đẩy hiệu suất trong khi vẫn thiết thực cho việc sử dụng trong thế giới thực. Phiên bản nhỏ nhất đã chạy nhanh hơn tới 43% trên CPU đồng thời vẫn cải thiện độ chính xác, khiến nó trở nên lý tưởng cho các ứng dụng từ thiết bị di động đến các hệ thống doanh nghiệp lớn. YOLO26 sẽ được công khai vào cuối tháng 10.

Đây là cái nhìn sơ lược về các tính năng chính của YOLO26:

  • Kiến trúc được sắp xếp hợp lý: Mô-đun Distribution Focal Loss (DFL) đã bị loại bỏ, trước đây làm chậm các mô hình. YOLO26 hiện chạy hiệu quả hơn mà không làm giảm độ chính xác.
  • Dự đoán nhanh hơn: YOLO26 giới thiệu tùy chọn bỏ qua bước Non-Maximum Suppression (NMS), cho phép đưa ra kết quả nhanh hơn và tạo điều kiện triển khai theo thời gian thực.
  • Phát hiện các vật thể nhỏ tốt hơn: Các phương pháp huấn luyện mới cải thiện tính ổn định và tăng đáng kể độ chính xác, đặc biệt là khi phát hiện các chi tiết nhỏ trong các cảnh phức tạp.
  • Huấn luyện thông minh hơn: Trình tối ưu hóa MuSGD mới kết hợp các điểm mạnh của hai kỹ thuật huấn luyện, giúp mô hình học nhanh hơn và đạt được độ chính xác cao hơn.

Cái nhìn đầu tiên về nền tảng Ultralytics

Sau khi giới thiệu YOLO26, Glenn đã mời Prateek Bhatnagar, Giám đốc Kỹ thuật Sản phẩm của chúng tôi, trình diễn dự án tiếp theo sắp ra mắt, Nền tảng Ultralytics. Được xây dựng để đơn giản hóa toàn bộ quy trình làm việc của thị giác máy tính, nền tảng này nhằm mục đích tập hợp các bộ dữ liệu, chú thích, đào tạo, triển khai và giám sát ở một nơi.

Prateek đã so sánh nó với việc điều chỉnh một chiếc xe hơi: thay vì đến các cửa hàng khác nhau để mua lốp xe, động cơ và hộp số, mọi thứ diễn ra trong một nhà để xe. Tương tự, nền tảng này cung cấp cho các nhà phát triển một không gian làm việc tích hợp để quản lý toàn bộ vòng đời của một mô hình AI thị giác.

Bản demo giới thiệu các công cụ chú giải hỗ trợ bởi AI giúp tăng tốc quá trình chuẩn bị bộ dữ liệu, các tùy chọn huấn luyện tùy chỉnh cho cả chuyên gia và người mới bắt đầu, và khả năng giám sát thời gian thực các lần chạy huấn luyện. 

Thông tin chi tiết từ một buổi thảo luận về triển khai biên

Một điểm nổi bật khác của YV25 là hội thảo về triển khai biên, do Oisin Lunny điều hành. Phiên họp có sự tham gia của Yuki Tsuji từ Sony Semiconductor Solutions, David Plowman từ Raspberry Pi và Glenn Jocher. 

Cuộc thảo luận đã khám phá cách di chuyển AI đến biên giúp giảm độ trễ, giảm chi phí và cải thiện quyền riêng tư. Yuki đã giới thiệu cảm biến IMX500 của Sony, có thể chạy suy luận trực tiếp trên chip. Trong khi đó, David đã nói về cách Raspberry Pi đang mở rộng từ nguồn gốc nhà sản xuất sang các ứng dụng thương mại quy mô lớn.

Hình 2. Một hội thảo về triển khai biên (edge deployment) với sự góp mặt của Oisin Lunny, Yuki Tsuji, David Plowman và Glenn Jocher.

Hội thảo cũng đề cập đến một trong những rào cản lớn nhất đối với các nhà phát triển: làm cho các mô hình chạy trơn tru trên các thiết bị khác nhau. Đây là nơi mà gói Ultralytics Python đóng vai trò quan trọng. 

Với nhiều tùy chọn xuất, nó giúp bạn dễ dàng chuyển một mô hình đã được huấn luyện vào sản xuất trên thiết bị di động, hệ thống nhúng hoặc phần cứng doanh nghiệp. Bằng cách loại bỏ những khó khăn trong việc chuyển đổi mô hình, Ultralytics giúp các nhóm tập trung vào việc xây dựng các giải pháp thay vì phải vật lộn với các vấn đề về khả năng tương thích.

Như David đã giải thích, "Tôi biết từ kinh nghiệm cay đắng của mình rằng việc chuyển đổi mô hình là rất kinh khủng, và nếu ai đó làm điều đó cho tôi, nó sẽ làm cho cuộc sống dễ dàng hơn rất nhiều. Đó là nơi Ultralytics thực sự cải thiện câu chuyện và cung cấp một cái gì đó có giá trị cho người dùng của họ." 

Đẩy nhanh đổi mới và phần cứng AI

Những tiến bộ về phần mềm AI đang diễn ra song song với phần cứng và cùng nhau thúc đẩy một làn sóng đổi mới mới trong thị giác máy tính. Trong khi các mô hình như Ultralytics YOLO tiếp tục thúc đẩy độ chính xác, tác động thực tế của chúng cũng phụ thuộc vào các nền tảng mà chúng chạy trên đó.

Ví dụ: Seeed Studio đã giới thiệu cách phần cứng mô-đun, chi phí thấp như bảng mạch reCamera và XIAO của họ, được cài đặt sẵn các mô hình Ultralytics YOLO, giúp các nhà phát triển dễ dàng chuyển từ tạo mẫu sang các hệ thống AI thực tế. Loại tích hợp phần cứng–phần mềm này làm giảm rào cản gia nhập và cho thấy sự đổi mới ở cấp độ phần cứng trực tiếp đẩy nhanh việc áp dụng như thế nào.

Dưới đây là một số điểm chính rút ra từ các bài phát biểu quan trọng khác của YV25, nhấn mạnh cách thiết kế phối hợp phần cứng-phần mềm đang mở ra những khả năng mới:

  • Lượng tử hóa (Quantization) mở ra những cải thiện lớn về tốc độ: Intel đã chỉ ra cách chuyển đổi các mô hình Ultralytics YOLO sang OpenVINO bằng lượng tử hóa đã tăng cường suy luận từ 54 FPS lên 606 FPS chỉ trong 30 phút, làm nổi bật sức mạnh của tối ưu hóa.
  • Các công cụ full-stack giúp việc triển khai AI biên trở nên thiết thực: NVIDIA nhấn mạnh cách các thiết bị Jetson, TensorRT, Triton Inference Server và DeepStream SDK phối hợp với nhau để hợp lý hóa việc triển khai AI thị giác hiệu suất cao ở biên.
  • Hệ sinh thái mở đẩy nhanh quá trình tạo mẫu: AMD nhấn mạnh nền tảng đầu cuối của mình được xây dựng trên GPU và ngăn xếp phần mềm ROCm, giúp các nhà phát triển chuyển nhanh chóng từ nguyên mẫu sang triển khai đồng thời kiểm soát chi phí.
  • Chip công suất thấp mở rộng phạm vi ứng dụng AI cho các thiết bị hạn chế: DEEPX đã giới thiệu bộ xử lý DX-M1 và DX-M2, cung cấp hàng chục TOPS dưới 5 watt để cho phép suy luận nâng cao trong các hệ thống nhỏ gọn, giới hạn về năng lượng.

Các xu hướng gần đây trong thị giác máy tính

Với những tiến bộ song hành trong cả phần mềm và phần cứng, thị giác máy tính đang phát triển nhanh hơn bao giờ hết. Sự phát triển song song này không chỉ cải thiện độ chính xác và tốc độ mà còn định hình cách AI thị giác có thể được triển khai trong thế giới thực. Tại YV25, những người tham gia đã có cơ hội lắng nghe từ các chuyên gia trong lĩnh vực robot, triển khai biên và AI đa phương thức, mỗi người đưa ra một góc nhìn khác nhau về hướng đi của lĩnh vực này.

Ví dụ: trong bài phát biểu quan trọng của mình, Michael Hart từ D-Robotics đã trình bày cách kết hợp các mô hình Ultralytics YOLO với bo mạch RDK X5 nhỏ gọn của họ (một mô-đun thị giác AI nhúng nhỏ) cho phép robot chạy các mô hình thị giác nâng cao trong thời gian thực. Bản demo trực tiếp của ông cho thấy ngành robot đã tiến xa như thế nào, phát triển từ các thử nghiệm trong phòng thí nghiệm thành các hệ thống thực tế, được hỗ trợ bởi AI.

Hình 3. Michael Hart nhấn mạnh cách robot hỗ trợ AI ngày nay phụ thuộc vào thị giác máy tính.

Tương tự, Alexis CrowellSteven Hunsche từ Axelera AI đã nhấn mạnh những thách thức và cơ hội của việc triển khai vision AI ở biên. Thông qua các bản demo trực tiếp, họ đã giải thích cách các Đơn vị xử lý AI (AIPU) Metis của Axelera AI kết hợp RISC-V và tính toán trong bộ nhớ kỹ thuật số để mang lại hiệu suất cao với mức tiêu thụ điện năng rất thấp. Được đóng gói trong các hệ số hình thức quen thuộc như M.2 và PCIe, thiết kế phần cứng-phần mềm kết hợp của nền tảng giúp mở rộng quy mô AI biên một cách thiết thực và hiệu quả.

Và trong một phiên khác, Merve Noyan từ Hugging Face đã khám phá sự trỗi dậy của AI đa phương thức, nơi các mô hình kết hợp thị giác với văn bản, âm thanh và các đầu vào khác. Cô đã nói về các trường hợp sử dụng từ phân tích tài liệu đến các tác nhân hiện thân, nhấn mạnh cách đổi mới mã nguồn mở đang đẩy nhanh việc áp dụng AI.

Cân bằng tiến bộ kỹ thuật với các giá trị nhân văn

Trong khi YV25 có các bài nói chuyện truyền cảm hứng về bức tranh toàn cảnh lớn, nó cũng bao gồm các phiên thực hành chuyên sâu. Jiri Borovec từ Lightning AI đã trình bày hướng dẫn thực hành cho thấy cách huấn luyện và tinh chỉnh các mô hình Ultralytics YOLO với PyTorch Lightning và hỗ trợ đa GPU. 

Ông trình bày các ví dụ về code và nhấn mạnh cách các công cụ mã nguồn mở, tài liệu rõ ràng và các framework linh hoạt giúp các nhà phát triển dễ dàng mở rộng quy mô huấn luyện, xác thực mọi giai đoạn và điều chỉnh quy trình làm việc cho các dự án của riêng họ. Đó là một lời nhắc nhở về tầm quan trọng của cộng đồng và các công cụ dễ tiếp cận đối với sự tiến bộ thực sự trong lĩnh vực thị giác máy tính.

Ở một khía cạnh khác, các diễn giả kêu gọi khán giả suy nghĩ về vai trò rộng lớn hơn của AI trong xã hội. Trong bài phát biểu quan trọng của mình, Gerd Leonhard, nhà tương lai học, nhà nhân văn học và Giám đốc điều hành của The Futures Agency, lập luận rằng "công nghệ mang tính trung lập về mặt đạo đức cho đến khi chúng ta sử dụng nó", nhấn mạnh rằng câu hỏi thực sự không chỉ là AI có thể làm gì, mà là nó nên làm gì. Ông cảnh báo về việc rơi vào những cạm bẫy như giản lược và thiếu trung thực, đồng thời kêu gọi AI thực sự phục vụ lợi ích lâu dài của nhân loại.

Hình 4. Gerd Leonhard chia sẻ những suy nghĩ của ông về việc xây dựng các giải pháp AI đồng thời giữ chúng lấy con người làm trung tâm.

Sự tập trung vào trách nhiệm này tiếp tục trong cuộc trò chuyện thân mật với Carissa Véliz từ Đại học Oxford, người nhấn mạnh đến quyền riêng tư và bảo mật. Bà chỉ ra rằng các cộng đồng mã nguồn mở rất quan trọng để kiểm tra và cải thiện mã, đồng thời đạo đức và thiết kế là không thể tách rời. Thông điệp của bà rất rõ ràng: các nhà phát triển cần dự đoán việc sử dụng sai mục đích và xây dựng các hệ thống đặt phẩm giá con người và phúc lợi xã hội lên hàng đầu.

Kết nối mạng ở London tại YV25

Vượt xa các bài nói chuyện và trình diễn, YV25 cũng tạo không gian cho mọi người kết nối. Trong giờ giải lao và ăn trưa, những người tham dự đã giao lưu, chia sẻ kinh nghiệm, so sánh các phương pháp tiếp cận và khơi dậy những hợp tác mới.

Đối với đội ngũ Ultralytics, đây cũng là một cơ hội tuyệt vời để gặp gỡ trực tiếp. Với các thành viên trải rộng trên toàn cầu, những khoảnh khắc như thế này giúp củng cố các mối quan hệ và cùng nhau ăn mừng tiến bộ.

Hình 5. Nhóm Ultralytics kết thúc một ngày đầy cảm hứng tại YOLO Vision 2025.

Ngày hội khép lại với một bữa tiệc after-party, nơi những người tham gia có cơ hội thư giãn và tiếp tục kết nối. Đó là khoảnh khắc để suy ngẫm, nạp lại năng lượng và hướng tới chương tiếp theo của sự đổi mới trong Vision AI.

Cùng nhau vượt qua các giới hạn của Vision AI

YOLO Vision 2025 là một sự kiện tôn vinh những ý tưởng, sự đổi mới và cộng đồng. Sự ra mắt của Ultralytics YOLO26 đã tạo tiền đề, tiếp theo là các bài nói chuyện hấp dẫn về triển khai edge và AI lấy con người làm trung tâm, làm nổi bật sự tiến bộ nhanh chóng của Vision AI và tác động ngày càng tăng của nó trên thế giới.

Ngoài các phiên họp quan trọng, sự kiện này đã đưa mọi người đến với nhau. Các nhà nghiên cứu, nhà phát triển và những người đam mê đã chia sẻ kinh nghiệm, khơi dậy những cuộc trò chuyện ý nghĩa và khám phá những khả năng mới cho tương lai. Sự kiện kết thúc tốt đẹp, với những người tham gia hào hứng về tương lai của các mô hình Ultralytics YOLO và thị giác máy tính.

Bạn đã sẵn sàng khám phá AI chưa? Tham gia cộng đồngkho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về AI và thị giác máy tính. Truy cập các trang giải pháp của chúng tôi để khám phá thêm các ứng dụng của thị giác máy tính trong nông nghiệpAI trong robot học. Kiểm tra các tùy chọn cấp phép của chúng tôi và bắt đầu với thị giác máy tính ngay hôm nay!

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí