Những điểm nhấn quan trọng của Ultralytics từ YOLO Vision 2025!
Hãy tham gia cùng chúng tôi để tổng hợp lại sự kiện lớn nhất trong năm của Ultralytics, giới thiệu buổi ra mắt Ultralytics YOLO26, các phiên thảo luận đầy cảm hứng và những điểm nhấn quan trọng của cộng đồng.

Cộng đồng AI và thị giác máy tính đã cùng hội tụ vào ngày 25 tháng 9 tại YOLO Vision 2025 (YV25), sự kiện AI về thị giác thường niên theo hình thức kết hợp của Ultralytics. Được tổ chức tại The Pelligon, London và phát trực tuyến toàn cầu, sự kiện đã chào đón một nhóm đa dạng các nhà nghiên cứu, kỹ sư và những người đam mê AI cùng chia sẻ ý tưởng và tìm hiểu về các đổi mới mới, chẳng hạn như Ultralytics YOLO26.
Đánh dấu năm thứ tư tổ chức, sự kiện tiếp tục phát triển về quy mô tiếp cận và tầm ảnh hưởng. Luồng phát trực tiếp YV25 đã thu hút hơn 6.800 lượt xem, tạo ra hơn 49.000 lượt hiển thị và đạt gần 2.000 giờ xem.
YV25 bắt đầu bằng lời khai mạc từ người dẫn chương trình Oisin Lunny, người đã đặt ra bầu không khí cho cả ngày bằng cách khuyến khích những người tham dự kết nối, chia sẻ và tận dụng tối đa sự kiện. Như ông đã nói: “YOLO Vision 2025 là hội nghị gắn kết cộng đồng AI thị giác mã nguồn mở để tập trung vào dữ liệu, học máy và những tiến bộ trong thị giác máy tính.”
Trong bài viết này, chúng tôi sẽ tổng hợp những điểm nhấn quan trọng từ YOLO Vision 2025, bao gồm buổi ra mắt sản phẩm, các bài thuyết trình chính, tọa đàm, trình diễn trực tiếp và những khoảnh khắc cộng đồng đã làm nên một ngày đặc biệt. Hãy cùng bắt đầu!
Link to this sectionTừ một GPU duy nhất đến vòng gọi vốn Series A trị giá 30 triệu USD#
Trước khi sự kiện diễn ra, đã có rất nhiều sự phấn khích xoay quanh việc ra mắt sản phẩm mới, và Glenn Jocher, Nhà sáng lập kiêm CEO của chúng tôi, đã khởi đầu ngày mới bằng cách tiếp nối nguồn năng lượng đó.
Ông đã chia sẻ về hành trình của Ultralytics, hồi tưởng lại việc vào năm 2020, ông đã thực hiện các thử nghiệm trên một chiếc 1080 Ti duy nhất cắm vào MacBook của mình, một thiết lập hiện nay đã lỗi thời. Từ những khởi đầu khiêm tốn đó, Ultralytics đã phát triển thành một cộng đồng toàn cầu với hàng tỷ lượt suy luận (inference) mỗi ngày được thực hiện bởi các model YOLO.
Glenn cũng chia sẻ về việc Ultralytics gần đây đã chốt thành công vòng gọi vốn Series A trị giá 30 triệu USD. Ông giải thích khoản đầu tư này sẽ thúc đẩy giai đoạn tăng trưởng tiếp theo bằng cách cho phép công ty mở rộng đội ngũ, đẩy mạnh nghiên cứu và đảm bảo các nguồn lực tính toán cần thiết để tiếp tục mở rộng giới hạn của thị giác máy tính.
Link to this sectionUltralytics YOLO26: Một model YOLO tốt hơn, nhanh hơn và nhỏ hơn#
Glenn tiếp tục công bố hai nỗ lực mới từ Ultralytics. Đầu tiên là Ultralytics YOLO26, model mới nhất trong gia đình Ultralytics YOLO, được thiết kế để nhỏ hơn, nhanh hơn và hiệu quả hơn trong khi đạt được độ chính xác cao hơn nữa. Thứ hai là Ultralytics Platform, một không gian làm việc SaaS toàn diện mới kết hợp dữ liệu, đào tạo, triển khai và giám sát nhằm giúp việc xây dựng các giải pháp thị giác máy tính trở nên dễ dàng hơn bao giờ hết, dự kiến sẽ được công bố trong thời gian tới.

Hình 1. Glenn Jocher công bố Ultralytics YOLO26 trên sân khấu tại YOLO Vision 2025.
YOLO26 được xây dựng để nâng cao hiệu suất trong khi vẫn giữ tính thực tiễn cho việc sử dụng trong thế giới thực. Phiên bản nhỏ nhất đã chạy nhanh hơn tới 43% trên CPU trong khi vẫn cải thiện độ chính xác, giúp nó trở nên lý tưởng cho các ứng dụng từ thiết bị di động đến các hệ thống doanh nghiệp lớn. YOLO26 sẽ có sẵn công khai vào cuối tháng 10.
Dưới đây là cái nhìn sơ lược về các tính năng chính của YOLO26:
- Kiến trúc tối ưu hóa: Module Distribution Focal Loss (DFL) đã bị loại bỏ, vốn trước đây làm chậm các model. YOLO26 hiện vận hành hiệu quả hơn mà không làm giảm độ chính xác.
- Dự đoán nhanh hơn: YOLO26 giới thiệu tùy chọn bỏ qua bước Non-Maximum Suppression (NMS), cho phép đưa ra kết quả nhanh hơn và tạo điều kiện thuận lợi cho việc triển khai thời gian thực.
- Phát hiện vật thể nhỏ tốt hơn: Các phương pháp đào tạo mới cải thiện độ ổn định và tăng đáng kể độ chính xác, đặc biệt là khi phát hiện các chi tiết nhỏ trong những khung cảnh phức tạp.
- Đào tạo thông minh hơn: Bộ tối ưu hóa MuSGD mới kết hợp sức mạnh của hai kỹ thuật đào tạo, giúp model học nhanh hơn và đạt được độ chính xác cao hơn.
Link to this sectionCái nhìn đầu tiên về nền tảng Ultralytics#
Sau khi giới thiệu YOLO26, Glenn đã mời Prateek Bhatnagar, Giám đốc Kỹ thuật Sản phẩm của chúng tôi, trình diễn dự án tiếp theo trong lộ trình phát triển: Ultralytics Platform. Được xây dựng để đơn giản hóa toàn bộ quy trình công việc thị giác máy tính, nền tảng này hướng tới việc tập hợp các tập dữ liệu, chú thích, đào tạo, triển khai và giám sát về cùng một nơi.
Prateek so sánh nó với việc bảo dưỡng xe: thay vì phải đi đến các tiệm khác nhau cho lốp xe, động cơ và hộp số, mọi thứ đều diễn ra trong một gara duy nhất. Tương tự như vậy, nền tảng này cung cấp cho các nhà phát triển một không gian làm việc tích hợp để quản lý toàn bộ vòng đời của một model AI thị giác.
Phần trình diễn đã giới thiệu các công cụ chú thích hỗ trợ bởi AI giúp tăng tốc chuẩn bị tập dữ liệu, các tùy chọn đào tạo có thể tùy chỉnh cho cả chuyên gia và người mới bắt đầu, cùng khả năng giám sát các quá trình đào tạo theo thời gian thực.
Link to this sectionNhững hiểu biết từ phiên thảo luận về triển khai biên (edge deployment)#
Một điểm nhấn khác của YV25 là phiên thảo luận về triển khai biên, do Oisin Lunny điều phối. Phiên họp có sự tham gia của Yuki Tsuji từ Sony Semiconductor Solutions, David Plowman từ Raspberry Pi và Glenn Jocher.
Cuộc thảo luận đã khám phá việc đưa AI ra biên (edge) giúp giảm độ trễ, giảm chi phí và cải thiện quyền riêng tư như thế nào. Yuki đã giới thiệu cảm biến IMX500 của Sony, có thể chạy suy luận trực tiếp trên chip. Trong khi đó, David đã nói về cách Raspberry Pi đang mở rộng từ nguồn gốc dành cho các nhà sáng tạo (maker) sang các ứng dụng thương mại quy mô lớn.

Hình 2. Một phiên thảo luận về triển khai biên với sự tham gia của Oisin Lunny, Yuki Tsuji, David Plowman và Glenn Jocher.
Phiên thảo luận cũng đề cập đến một trong những rào cản lớn nhất đối với các nhà phát triển: làm cho các model chạy mượt mà trên các thiết bị khác nhau. Đây là lúc gói Ultralytics Python đóng vai trò then chốt.
Với nhiều tùy chọn xuất (export) đa dạng, nó giúp việc đưa một model đã đào tạo vào sản xuất trên thiết bị di động, hệ thống nhúng hoặc phần cứng doanh nghiệp trở nên đơn giản. Bằng cách loại bỏ sự phức tạp trong chuyển đổi model, Ultralytics giúp các đội ngũ tập trung vào việc xây dựng giải pháp thay vì phải vật lộn với các vấn đề tương thích.
Như David đã giải thích: “Tôi biết từ kinh nghiệm đau thương của mình rằng việc chuyển đổi các model rất tồi tệ, và nếu ai đó làm điều đó cho tôi, nó sẽ giúp cuộc sống dễ dàng hơn rất nhiều. Đó là nơi Ultralytics thực sự cải thiện câu chuyện và cung cấp một thứ gì đó có giá trị cho người dùng của chúng tôi.”
Link to this sectionTăng tốc đổi mới và phần cứng AI#
Các tiến bộ trong phần mềm AI đang diễn ra song song với phần cứng, và cùng nhau, chúng đang thúc đẩy một làn sóng đổi mới mới trong thị giác máy tính. Trong khi các model như Ultralytics YOLO tiếp tục đẩy mạnh độ chính xác, tác động thực tế của chúng cũng phụ thuộc vào các nền tảng mà chúng chạy trên đó.
Ví dụ, Seeed Studio đã giới thiệu cách các phần cứng dạng module, chi phí thấp như bảng mạch reCamera và XIAO, được tải sẵn các model Ultralytics YOLO, giúp các nhà phát triển dễ dàng chuyển từ tạo mẫu sang các hệ thống AI thực tế. Sự tích hợp phần cứng–phần mềm này giúp hạ thấp rào cản gia nhập và cho thấy đổi mới ở cấp độ phần cứng trực tiếp đẩy nhanh việc áp dụng.
Dưới đây là một số thông tin chính từ các bài thuyết trình khác tại YV25, nhấn mạnh cách đồng thiết kế phần cứng–phần mềm đang mở ra những khả năng mới:
- Lượng tử hóa (Quantization) mang lại những bước nhảy vọt về tốc độ: Intel đã chỉ ra cách chuyển đổi các model Ultralytics YOLO sang OpenVINO với lượng tử hóa giúp tăng tốc độ suy luận từ 54 FPS lên 606 FPS chỉ trong 30 phút, làm nổi bật sức mạnh của việc tối ưu hóa.
- Các công cụ toàn diện (full-stack) giúp việc triển khai AI biên trở nên thực tế: NVIDIA nhấn mạnh cách các thiết bị Jetson, TensorRT, Triton Inference Server và DeepStream SDK phối hợp với nhau để hợp lý hóa việc triển khai AI thị giác hiệu suất cao tại biên.
- Hệ sinh thái mở tăng tốc tạo mẫu: AMD nhấn mạnh nền tảng toàn diện của họ được xây dựng trên GPU và ngăn xếp phần mềm ROCm, giúp các nhà phát triển di chuyển nhanh chóng từ tạo mẫu sang triển khai trong khi vẫn kiểm soát được chi phí.
- Chip tiêu thụ điện năng thấp mở rộng AI tới các thiết bị hạn chế: DEEPX đã giới thiệu các bộ xử lý DX-M1 và DX-M2 của họ, cung cấp hàng chục TOPS dưới mức 5 watt để kích hoạt suy luận tiên tiến trong các hệ thống nhỏ gọn, giới hạn về năng lượng.
Link to this sectionCác xu hướng gần đây trong thị giác máy tính#
Với sự tiến bộ của cả phần mềm và phần cứng phối hợp chặt chẽ, thị giác máy tính đang phát triển nhanh hơn bao giờ hết. Những bước phát triển song song này không chỉ cải thiện độ chính xác và tốc độ mà còn định hình cách AI thị giác có thể được triển khai trong thế giới thực. Tại YV25, những người tham gia đã có cơ hội lắng nghe từ các chuyên gia về robot, triển khai biên và AI đa phương thức, mỗi người mang đến một góc nhìn khác nhau về hướng đi của lĩnh vực này.
Ví dụ, trong bài thuyết trình của mình, Michael Hart từ D-Robotics đã chứng minh cách kết hợp các model Ultralytics YOLO với bo mạch RDK X5 nhỏ gọn của họ (một module thị giác AI nhúng nhỏ) cho phép robot chạy các model thị giác tiên tiến trong thời gian thực. Phần trình diễn trực tiếp của ông cho thấy robot đã tiến xa như thế nào, phát triển từ các thí nghiệm trong phòng thí nghiệm thành các hệ thống thực tế chạy bằng AI.

Hình 3. Michael Hart nhấn mạnh cách các robot hỗ trợ AI ngày nay phụ thuộc vào thị giác máy tính.
Tương tự, Alexis Crowell và Steven Hunsche từ Axelera AI đã nhấn mạnh những thách thức và cơ hội của việc triển khai AI thị giác tại biên. Thông qua các phần trình diễn trực tiếp, họ giải thích cách các đơn vị xử lý AI (AIPU) Metis của Axelera AI kết hợp RISC-V và tính toán kỹ thuật số trong bộ nhớ (digital in-memory compute) để mang lại hiệu suất cao với mức tiêu thụ điện năng rất thấp. Được đóng gói trong các yếu tố hình thức quen thuộc như M.2 và PCIe, việc đồng thiết kế phần cứng-phần mềm của nền tảng giúp việc mở rộng AI biên trở nên thực tế và hiệu quả.
Và trong một phiên khác, Merve Noyan từ Hugging Face đã khám phá sự trỗi dậy của AI đa phương thức (multimodal AI), nơi các model kết hợp thị giác với văn bản, âm thanh và các đầu vào khác. Cô đã nói về các trường hợp sử dụng từ phân tích tài liệu đến các tác nhân hữu hình (embodied agents), nhấn mạnh cách đổi mới mã nguồn mở đang thúc đẩy việc áp dụng AI.
Link to this sectionCân bằng giữa tiến bộ kỹ thuật và các giá trị nhân văn#
Trong khi YV25 có các bài thuyết trình đầy cảm hứng về bức tranh lớn, nó cũng bao gồm các phiên thực hành sâu sắc. Jiri Borovec từ Lightning AI đã có một buổi hướng dẫn thực tế, chỉ cách đào tạo và tinh chỉnh (fine-tune) các model Ultralytics YOLO với PyTorch Lightning và hỗ trợ đa GPU.
Ông đã đi qua các ví dụ về mã và nhấn mạnh cách các công cụ mã nguồn mở, tài liệu rõ ràng và các khuôn khổ linh hoạt giúp các nhà phát triển dễ dàng mở rộng quy trình đào tạo, xác thực từng giai đoạn và điều chỉnh quy trình làm việc cho các dự án của riêng họ. Đó là lời nhắc nhở về tầm quan trọng của cộng đồng và các công cụ dễ tiếp cận đối với sự tiến bộ thực sự trong thị giác máy tính.
Ở khía cạnh khác, các diễn giả đã thúc giục khán giả suy nghĩ về vai trò rộng lớn hơn của AI trong xã hội. Trong bài thuyết trình của mình, Gerd Leonhard, nhà tương lai học, nhà nhân văn học và CEO của The Futures Agency, cho rằng “công nghệ là trung lập về mặt đạo đức cho đến khi chúng ta sử dụng nó,” nhấn mạnh rằng câu hỏi thực sự không chỉ là AI có thể làm gì, mà là nó nên làm gì. Ông cảnh báo không nên rơi vào những cái bẫy như chủ nghĩa giản lược và sự thiếu trung thực, đồng thời kêu gọi một AI thực sự phục vụ lợi ích lâu dài của nhân loại.

Hình 4. Gerd Leonhard chia sẻ suy nghĩ của ông về việc xây dựng các giải pháp AI trong khi vẫn giữ chúng lấy con người làm trung tâm.
Sự tập trung vào trách nhiệm này tiếp tục trong một cuộc trò chuyện thân mật với Carissa Véliz từ Đại học Oxford, người đã nhấn mạnh về quyền riêng tư và bảo mật. Cô chỉ ra rằng các cộng đồng mã nguồn mở rất quan trọng để kiểm tra và cải thiện mã, và đạo đức với thiết kế là không thể tách rời. Thông điệp của cô rất rõ ràng: các nhà phát triển cần lường trước sự lạm dụng và xây dựng các hệ thống đặt phẩm giá con người và phúc lợi xã hội lên hàng đầu.
Link to this sectionKết nối tại London ở YV25#
Đi xa hơn các bài thuyết trình và phần trình diễn, YV25 cũng tạo ra không gian để mọi người kết nối. Trong các giờ nghỉ giải lao và ăn trưa, những người tham dự đã giao lưu, chia sẻ kinh nghiệm, so sánh các phương pháp tiếp cận và khơi dậy các hợp tác mới.
Đối với đội ngũ Ultralytics, đây cũng là một cơ hội tuyệt vời để gặp gỡ trực tiếp. Với các thành viên phân bố trên toàn cầu, những khoảnh khắc như thế này giúp củng cố mối quan hệ và cùng nhau ăn mừng các tiến bộ.

Hình 5. Đội ngũ Ultralytics kết thúc một ngày đầy cảm hứng tại YOLO Vision 2025.
Ngày sự kiện khép lại với một bữa tiệc sau đó, nơi những người tham gia có cơ hội thư giãn và tiếp tục kết nối. Đó là khoảnh khắc để suy ngẫm, nạp năng lượng và hướng tới chương tiếp theo của sự đổi mới trong AI thị giác.
Link to this sectionCùng nhau mở rộng giới hạn của AI thị giác#
YOLO Vision 2025 là một lễ hội của các ý tưởng, sự đổi mới và cộng đồng. Việc ra mắt Ultralytics YOLO26 đã tạo tiền đề, theo sau là các bài thuyết trình hấp dẫn về triển khai biên và AI lấy con người làm trung tâm, nhấn mạnh sự tiến bộ nhanh chóng của AI thị giác và tác động ngày càng lớn của nó đối với thế giới.
Ngoài các phiên thuyết trình chính, sự kiện đã gắn kết mọi người lại với nhau. Các nhà nghiên cứu, nhà phát triển và những người đam mê đã chia sẻ kinh nghiệm, khơi dậy những cuộc hội thoại ý nghĩa và khám phá những khả năng mới cho tương lai. Sự kiện kết thúc trên một nốt cao, với những người tham gia đầy hào hứng về tương lai của các model Ultralytics YOLO và thị giác máy tính.
Sẵn sàng khám phá AI? Hãy tham gia cộng đồng và kho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về AI và thị giác máy tính. Ghé thăm các trang giải pháp của chúng tôi để khám phá thêm các ứng dụng của thị giác máy tính trong nông nghiệp và AI trong robot. Kiểm tra các tùy chọn cấp phép của chúng tôi và bắt đầu với thị giác máy tính ngay hôm nay!






