Chào đón Ultralytics YOLO26: Một model YOLO tốt hơn, nhanh hơn, nhỏ hơn
Khám phá model Ultralytics YOLO mới nhất, Ultralytics YOLO26, và các tính năng tiên tiến hỗ trợ sự cân bằng tối ưu giữa tốc độ, độ chính xác và khả năng triển khai.

Vào ngày 25 tháng 9, tại sự kiện hybrid thường niên của chúng tôi, YOLO Vision 2025 (YV25) ở London, Glenn Jocher, Nhà sáng lập & CEO của chúng tôi, đã chính thức công bố bước đột phá mới nhất trong chuỗi mô hình Ultralytics YOLO, Ultralytics YOLO26! Mô hình thị giác máy tính mới của chúng tôi, YOLO26, có khả năng phân tích và diễn giải hình ảnh cũng như video với một kiến trúc được tối ưu hóa giúp cân bằng giữa tốc độ, độ chính xác và tính dễ dàng trong triển khai.
Trong khi Ultralytics YOLO26 đơn giản hóa các khía cạnh trong thiết kế mô hình và bổ sung các cải tiến mới, nó vẫn tiếp tục cung cấp những tính năng quen thuộc mà người dùng mong đợi từ các mô hình Ultralytics YOLO. Ví dụ, Ultralytics YOLO26 rất dễ sử dụng, hỗ trợ hàng loạt tác vụ thị giác máy tính và cung cấp các tùy chọn tích hợp cũng như triển khai linh hoạt.
Không cần phải nói, điều này giúp cho việc chuyển sang sử dụng Ultralytics YOLO26 trở nên vô cùng dễ dàng, và chúng tôi rất mong chờ được thấy người dùng trải nghiệm nó khi nó chính thức ra mắt công chúng vào cuối tháng 10.

Hình 1. Một ví dụ về việc sử dụng YOLO26 để phát hiện vật thể trong hình ảnh.
Nói một cách đơn giản, Ultralytics YOLO26 là một mô hình AI thị giác tốt hơn, nhanh hơn và nhỏ gọn hơn. Trong bài viết này, chúng ta sẽ khám phá các tính năng chính của Ultralytics YOLO26 và những giá trị mà nó mang lại. Hãy bắt đầu ngay thôi!
Link to this sectionPhá vỡ các giới hạn của AI thị giác với Ultralytics YOLO26#
Trước khi đi sâu vào các tính năng chính của Ultralytics YOLO26 và những ứng dụng mà nó có thể thực hiện, hãy cùng nhìn lại và thảo luận về nguồn cảm hứng và động lực thúc đẩy sự phát triển của mô hình này.
Tại Ultralytics, chúng tôi luôn tin vào sức mạnh của sự đổi mới. Ngay từ những ngày đầu, sứ mệnh của chúng tôi đã bao gồm hai khía cạnh. Một mặt, chúng tôi muốn làm cho AI thị giác trở nên dễ tiếp cận để bất kỳ ai cũng có thể sử dụng mà không gặp rào cản. Mặt khác, chúng tôi cũng cam kết giữ vững vị thế tiên phong, mở rộng ranh giới của những gì mà các mô hình thị giác máy tính có thể đạt được.
Một yếu tố then chốt đằng sau sứ mệnh này là không gian AI luôn không ngừng phát triển. Ví dụ, edge AI, liên quan đến việc chạy các mô hình AI trực tiếp trên thiết bị thay vì phụ thuộc vào đám mây, đang được áp dụng nhanh chóng trong nhiều ngành công nghiệp.
Từ camera thông minh cho đến các hệ thống tự hành, các thiết bị ở biên hiện nay được kỳ vọng phải xử lý thông tin theo thời gian thực. Sự thay đổi này đòi hỏi các mô hình phải nhẹ hơn và nhanh hơn, đồng thời vẫn phải duy trì mức độ chính xác cao.
Đó là lý do tại sao luôn cần phải liên tục cải tiến các mô hình Ultralytics YOLO của chúng tôi. Như Glenn Jocher đã chia sẻ, “Một trong những thách thức lớn nhất là đảm bảo người dùng có thể tận dụng tối đa YOLO26 trong khi vẫn đạt được hiệu suất hàng đầu.”
Link to this sectionTổng quan về Ultralytics YOLO26#
YOLO26 sẵn sàng sử dụng với năm biến thể mô hình khác nhau, mang lại cho bạn sự linh hoạt để tận dụng khả năng của nó trong các ứng dụng ở mọi quy mô. Tất cả các biến thể mô hình này đều hỗ trợ nhiều tác vụ thị giác máy tính, giống như các mô hình Ultralytics YOLO trước đây. Điều này có nghĩa là bất kể kích thước nào bạn chọn, bạn đều có thể tin tưởng vào YOLO26 để cung cấp một loạt các khả năng mạnh mẽ, tương tự như Ultralytics YOLO11.
Dưới đây là tổng quan về các tác vụ thị giác máy tính được YOLO26 hỗ trợ:
- Phát hiện vật thể (Object detection): YOLO26 có thể nhận diện và xác định vị trí của nhiều vật thể trong một khung hình ảnh hoặc video.
- Phân đoạn thực thể (Instance segmentation): Tiến xa hơn so với việc phát hiện, YOLO26 có thể tạo các ranh giới chính xác đến từng pixel xung quanh mỗi vật thể mà nó nhận diện được.
- Phân loại hình ảnh (Image classification): Mô hình có thể phân tích toàn bộ một hình ảnh và gán nó vào một danh mục hoặc nhãn cụ thể.
- Ước tính tư thế (Pose estimation): YOLO26 có thể phát hiện các điểm mấu chốt và ước tính tư thế cho con người cũng như các vật thể khác.
- Hộp bao định hướng (OBB): Mô hình có thể phát hiện các vật thể ở bất kỳ góc độ nào, đặc biệt hữu ích cho hình ảnh chụp từ trên không, máy bay không người lái và vệ tinh, nơi các mục tiêu như tòa nhà, phương tiện hoặc cây trồng có thể không thẳng hàng với khung hình.
- Theo dõi vật thể (Object tracking): YOLO26 có thể được sử dụng để theo dõi các vật thể xuyên suốt các khung hình video hoặc các luồng dữ liệu thời gian thực.

Hình 2. Phát hiện vật thể trong hình ảnh sử dụng YOLO26.
Link to this sectionTìm hiểu về kiến trúc của YOLO26#
Giờ đây, khi đã hiểu rõ hơn về những gì YOLO26 có thể làm, hãy cùng điểm qua một số cải tiến trong kiến trúc của nó.
Thiết kế của mô hình đã được tối ưu hóa bằng cách loại bỏ mô-đun Distribution Focal Loss (DFL), vốn trước đây làm chậm quá trình suy luận và hạn chế khả năng hồi quy hộp bao (bounding box).
Quá trình dự đoán cũng đã được đơn giản hóa với tùy chọn suy luận end-to-end (E2E), cho phép mô hình bỏ qua bước Non-Maximum Suppression (NMS) truyền thống. Cải tiến này giúp giảm độ phức tạp và cho phép mô hình cung cấp kết quả nhanh hơn, giúp việc triển khai trở nên dễ dàng hơn trong các ứng dụng thực tế.
Những cải tiến khác giúp mô hình trở nên thông minh và đáng tin cậy hơn. Progressive Loss Balancing (ProgLoss) giúp ổn định quá trình huấn luyện và cải thiện độ chính xác, trong khi Small-Target-Aware Label Assignment (STAL) đảm bảo mô hình phát hiện các vật thể nhỏ hiệu quả hơn. Ngoài ra, bộ tối ưu hóa MuSGD mới giúp cải thiện độ hội tụ trong quá trình huấn luyện và nâng cao hiệu suất tổng thể.
Thực tế, phiên bản nhỏ nhất của YOLO26, mô hình nano, hiện chạy nhanh hơn tới 43% trên các CPU tiêu chuẩn, khiến nó đặc biệt phù hợp cho các ứng dụng di động, camera thông minh và các thiết bị biên khác nơi tốc độ và hiệu quả là yếu tố quan trọng. Dưới đây là bản tóm tắt nhanh về các tính năng của YOLO26 và những gì người dùng có thể mong đợi:
- Loại bỏ DFL: Chúng tôi đã loại bỏ mô-đun Distribution Focal Loss khỏi kiến trúc của mô hình. Bất kể kích thước vật thể trong hình ảnh, YOLO26 có thể đặt các hộp bao phù hợp trong khi vẫn hoạt động hiệu quả hơn.
- Suy luận end-to-end không cần NMS: YOLO26 bổ sung một chế độ tùy chọn không cần Non-Maximum Suppression (NMS), một bước thường được sử dụng để loại bỏ các dự đoán trùng lặp, giúp việc triển khai đơn giản và nhanh hơn cho việc sử dụng thời gian thực.
- ProgLoss và STAL: Những cải tiến này giúp quá trình huấn luyện ổn định hơn và tăng đáng kể độ chính xác, đặc biệt là đối với việc phát hiện các vật thể nhỏ trong các cảnh phức tạp.
- Bộ tối ưu hóa MuSGD: YOLO26 sử dụng một bộ tối ưu hóa mới kết hợp thế mạnh của hai bộ tối ưu hóa huấn luyện (Muon và SGD), giúp mô hình học nhanh hơn và đạt độ chính xác cao hơn.

Hình 3. Đánh giá hiệu suất YOLO26.
Link to this sectionĐơn giản hóa triển khai với Ultralytics YOLO26#
Cho dù bạn đang làm việc với các ứng dụng di động, camera thông minh hay hệ thống doanh nghiệp, việc triển khai YOLO26 đều rất đơn giản và linh hoạt. Gói Ultralytics Python hỗ trợ ngày càng nhiều định dạng xuất, giúp việc tích hợp YOLO26 vào các quy trình làm việc hiện có trở nên dễ dàng và tương thích với hầu hết mọi nền tảng.
Một vài tùy chọn xuất bao gồm TensorRT để tăng tốc GPU tối đa, ONNX để tương thích rộng rãi, CoreML cho các ứng dụng iOS gốc, TFLite cho Android và các thiết bị biên, và OpenVINO để tối ưu hóa hiệu suất trên phần cứng Intel. Sự linh hoạt này giúp việc đưa YOLO26 từ khâu phát triển sang sản xuất trở nên thẳng tiến mà không gặp thêm trở ngại nào.
Một phần quan trọng khác của việc triển khai là đảm bảo các mô hình chạy hiệu quả trên các thiết bị hạn chế về tài nguyên. Đây là lúc kỹ thuật lượng tử hóa (quantization) phát huy tác dụng. Nhờ kiến trúc được đơn giản hóa, YOLO26 xử lý điều này cực kỳ tốt. Nó hỗ trợ triển khai INT8 (sử dụng nén 8-bit để giảm kích thước và cải thiện tốc độ với độ chính xác giảm ở mức tối thiểu) cũng như độ chính xác bán phần (FP16) để suy luận nhanh hơn trên phần cứng được hỗ trợ.
Quan trọng nhất, YOLO26 mang lại hiệu suất ổn định trên các mức lượng tử hóa này, vì vậy bạn có thể tin tưởng vào nó dù là khi chạy trên máy chủ mạnh mẽ hay một thiết bị biên nhỏ gọn.
Link to this sectionTừ robot đến sản xuất: Các trường hợp sử dụng của YOLO26#
YOLO26 có thể được sử dụng trong nhiều ứng dụng thị giác máy tính khác nhau trên nhiều ngành công nghiệp và trường hợp sử dụng. Từ robot đến sản xuất, nó có thể tạo ra tác động đáng kể bằng cách cải thiện quy trình làm việc và cho phép đưa ra quyết định nhanh hơn, chính xác hơn.
Ví dụ, một trường hợp điển hình là trong lĩnh vực robot, nơi YOLO26 có thể giúp robot diễn giải môi trường xung quanh theo thời gian thực. Điều này giúp việc điều hướng mượt mà hơn và việc xử lý vật thể chính xác hơn. Nó cũng cho phép sự cộng tác an toàn hơn với con người.
Một ví dụ khác là sản xuất, nơi mô hình có thể được sử dụng để phát hiện lỗi. Nó có thể tự động nhận diện các khiếm khuyết trên dây chuyền sản xuất nhanh chóng và chính xác hơn so với kiểm tra thủ công.

Hình 4. Phát hiện chai lọ trong nhà máy sản xuất sử dụng YOLO26.
Nhìn chung, vì YOLO26 tốt hơn, nhanh hơn và nhẹ hơn, nó dễ dàng thích nghi với nhiều môi trường, từ các thiết bị biên nhẹ đến các hệ thống doanh nghiệp lớn. Điều này làm cho nó trở thành một lựa chọn thiết thực cho các ngành công nghiệp đang muốn cải thiện hiệu quả, độ chính xác và tính tin cậy.
Link to this sectionCác điểm chính cần lưu ý#
Ultralytics YOLO26 là một mô hình thị giác máy tính tốt hơn, nhanh hơn và nhẹ hơn, đồng thời vẫn dễ sử dụng và mang lại hiệu suất mạnh mẽ. Nó hoạt động trên hàng loạt tác vụ và nền tảng khác nhau và sẽ có sẵn cho mọi người vào cuối tháng 10. Chúng tôi rất nóng lòng được thấy cộng đồng sử dụng nó như thế nào để tạo ra các giải pháp mới và mở rộng ranh giới của thị giác máy tính.
Hãy tham gia cộng đồng đang phát triển của chúng tôi! Khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về AI. Khám phá những đổi mới như thị giác máy tính trong bán lẻ và AI trong ngành ô tô bằng cách truy cập các trang giải pháp của chúng tôi. Để bắt đầu xây dựng với thị giác máy tính ngay hôm nay, hãy xem qua các tùy chọn cấp phép của chúng tôi.






