Ultralytics tái định nghĩa AI thị giác hiện đại với YOLO26
Xem cách Ultralytics YOLO26 thiết lập một tiêu chuẩn mới cho AI thị giác về tốc độ, sự đơn giản và khả năng triển khai thực tế từ các thiết bị biên (edge devices) đến các máy chủ quy mô lớn.

Hôm nay, chúng tôi chính thức ra mắt Ultralytics YOLO26, mô hình mới của chúng tôi thiết lập một chuẩn mực mới cho hiệu suất hiện đại nhất. Được giới thiệu lần đầu bởi Founder và CEO của chúng tôi, Glenn Jocher, tại YOLO Vision 2025 (YV25) ở London, đây là mô hình tiên tiến và có khả năng triển khai tốt nhất của chúng tôi cho đến nay.
Được thiết kế để trở nên nhẹ, gọn và nhanh, YOLO26 được tối ưu hóa cho những nơi mà các ứng dụng AI thị giác thời gian thực thực sự chạy trong môi trường thực tế. Với khả năng suy luận end-to-end native được tích hợp trực tiếp vào mô hình, YOLO26 đơn giản hóa việc triển khai, giảm độ phức tạp của hệ thống và mang lại hiệu suất đáng tin cậy trên các thiết bị edge và môi trường sản xuất quy mô lớn.
Trên thực tế, phiên bản nhỏ nhất của YOLO26, mô hình nano, chạy nhanh hơn tới 43% trên các CPU tiêu chuẩn, cho phép triển khai các giải pháp AI thị giác thời gian thực hiệu quả trên các thiết bị di động, camera thông minh và các thiết bị edge khác. Được xây dựng dựa trên tầm nhìn của Ultralytics nhằm mang khả năng AI thị giác có tác động mạnh mẽ đến với mọi người, YOLO26 kết hợp hiệu suất hiện đại với sự đơn giản, giúp việc sử dụng và triển khai trở nên dễ dàng.
Link to this sectionĐược xây dựng cho kỷ nguyên tiếp theo của thị giác máy tính#
Thị giác máy tính đang nhanh chóng vượt ra ngoài đám mây. Các ứng dụng thực tế ngày càng đòi hỏi suy luận thời gian thực, độ trễ thấp, sự linh hoạt về phần cứng và hiệu suất ổn định trên các thiết bị như máy bay không người lái (drone), camera, hệ thống di động và nền tảng nhúng.
YOLO26 được xây dựng dành riêng cho sự thay đổi này. Bằng cách tư duy lại quy trình phát hiện đối tượng ngay từ đầu, Ultralytics đã tạo ra một kiến trúc mô hình giúp loại bỏ sự phức tạp không cần thiết trong khi vẫn mang lại độ chính xác và tốc độ hiện đại nhất.
Ví dụ, các mô hình phát hiện đối tượng truyền thống của Ultralytics dựa vào một bước hậu xử lý bổ sung gọi là Non-Maximum Suppression để lọc các dự đoán chồng lấp sau khi suy luận. YOLO26 loại bỏ bước bổ sung này bằng cách kích hoạt suy luận end-to-end native, cho phép mô hình tạo ra các kết quả phát hiện cuối cùng trực tiếp. Nó mở khóa khả năng triển khai thực tế nhanh hơn, ổn định hơn và đáng tin cậy hơn.
YOLO26 không phải là một bản cập nhật gia tăng. Nó đại diện cho một bước nhảy vọt về cấu trúc trong cách AI thị giác cấp sản xuất được huấn luyện, triển khai và mở rộng quy mô.

Hình 1. Benchmarking Ultralytics YOLO26
Link to this sectionNhững gì YOLO26 mang lại#
Một trong những khía cạnh chính của YOLO26 là cách nó xây dựng dựa trên thế mạnh của các mô hình trước đó như Ultralytics YOLO11 đồng thời mở rộng khả năng của thị giác máy tính. Ngay khi sử dụng, YOLO26 hỗ trợ các tác vụ thị giác máy tính cốt lõi giống như YOLO11, bao gồm phát hiện đối tượng, phân đoạn thực thể (instance segmentation) và phân loại hình ảnh.

Hình 2. Ví dụ về việc sử dụng YOLO26 để phát hiện đối tượng trong một hình ảnh.
Nó cũng tiếp tục hỗ trợ ước tính tư thế (pose estimation), phát hiện đối tượng bằng bounding box xoay cho ảnh vệ tinh và ảnh từ trên không, và theo dõi đối tượng qua các luồng video. Giống như YOLO11, YOLO26 có sẵn năm biến thể mô hình: Nano (n), Small (s), Medium (m), Large (l) và Extra large (x), mang đến cho người dùng các tùy chọn cân bằng giữa tốc độ, kích thước và độ chính xác.
Link to this sectionCác tính năng chính của Ultralytics YOLO26#
Ultralytics YOLO26 bao gồm một loạt các cải tiến được thiết kế để nâng cao hiệu suất, độ tin cậy và khả năng sử dụng trong thực tế. Dưới đây là cái nhìn thoáng qua về các tính năng chính của YOLO26:
- Loại bỏ Distribution Focal Loss: YOLO26 loại bỏ Distribution Focal Loss (DFL), giảm độ phức tạp của mô hình và thúc đẩy việc triển khai đơn giản, tương thích hơn trên phần cứng edge và thiết bị tiêu thụ điện năng thấp.
- Suy luận end-to-end không cần NMS: YOLO26 loại bỏ hoàn toàn nhu cầu về Non-Maximum Suppression (NMS), một bước thường được sử dụng để loại bỏ các dự đoán trùng lặp, giúp việc triển khai đơn giản và nhanh hơn cho sử dụng thời gian thực.
- Progressive Loss Balancing + STAL: Progressive Loss Balancing (ProgLoss) và Small Target Aware Label Assignment (STAL) điều chỉnh cách mô hình học trong quá trình training, cho phép phát hiện các đối tượng nhỏ và ở xa trong các khung cảnh phức tạp một cách đáng tin cậy hơn.
- Trình tối ưu hóa MuSGD: YOLO26 giới thiệu trình tối ưu hóa MuSGD, một sự kết hợp giữa Stochastic Gradient Descent (SGD) và các kỹ thuật lấy cảm hứng từ Muon, giúp tăng cường độ ổn định khi training và cho phép hội tụ nhanh hơn, nhất quán hơn.
- Suy luận CPU nhanh hơn tới 43%: Mô hình YOLO26 nano mang lại tốc độ suy luận nhanh hơn tới 43% trên các CPU tiêu chuẩn, cho phép AI thị giác thời gian thực hiệu quả trên thiết bị di động, camera thông minh và các hệ thống edge khác.
Link to this sectionĐằng sau code: Hành trình đến với Ultralytics YOLO26#
Quá trình phát triển YOLO26 là một nỗ lực tập thể được định hình bởi nghiên cứu của đội ngũ chúng tôi và phản hồi từ cộng đồng, các đối tác và khách hàng. Chúng tôi bắt đầu với mục tiêu đơn giản hóa kiến trúc, cải thiện hiệu suất và làm cho mô hình dễ thích nghi hơn cho mục đích sử dụng thực tế.
Nhìn lại hành trình đó, Glenn Jocher giải thích: "Một trong những thách thức lớn nhất là đảm bảo người dùng có thể tận dụng tối đa YOLO26 trong khi vẫn mang lại hiệu suất hàng đầu." Quan điểm của ông nhấn mạnh nguyên tắc thiết kế cốt lõi của YOLO26: giữ cho AI thị giác dễ sử dụng.
Mở rộng về ý tưởng này, Jing Qiu, Senior Machine Learning Engineer của chúng tôi, cho biết thêm: "Việc xây dựng mô hình Ultralytics YOLO mới là sự kiên trì, không vội vàng. Tôi tiếp tục tinh chỉnh, chỉ tập trung vào sự cân bằng giữa tốc độ và độ chính xác. Khi mọi thứ hoàn thiện, đó là một sự hài lòng thầm lặng - bằng chứng cho thấy việc bám sát vào các chi tiết thực sự mang lại kết quả."
Link to this sectionBắt đầu xây dựng với Ultralytics YOLO26#
Ultralytics YOLO26 sẽ được cung cấp công khai từ hôm nay thông qua Ultralytics Platform với sự hỗ trợ đầy đủ trong các quy trình training, suy luận và export. Các tổ chức triển khai YOLO26 trong môi trường thương mại hoặc khép kín có thể truy cập các tùy chọn cấp phép enterprise, bao gồm hỗ trợ triển khai sản xuất, bảo trì dài hạn và triển khai edge quy mô lớn.
Giống như các mô hình trước đây của chúng tôi, nó cũng được hỗ trợ đầy đủ thông qua gói Python của Ultralytics, giúp người dùng có thể bắt đầu ngay lập tức. Người dùng có thể train, validate và triển khai YOLO26 với cùng một quy trình hợp lý mà họ đã biết, đồng thời tận dụng một loạt các tùy chọn export như ONNX, TensorRT, CoreML, TFLite, OpenVINO và nhiều hơn nữa.
Link to this sectionHãy cùng nhau xây dựng tương lai của AI thị giác#
Ultralytics YOLO26 đại diện cho bước tiếp theo của chúng tôi trong việc làm cho AI thị giác nhanh hơn, nhẹ hơn và dễ sử dụng hơn. Nhưng đây mới chỉ là sự khởi đầu.
Tác động thực sự đến từ những gì cộng đồng AI thị giác tạo ra với nó. Chúng tôi mong chờ được thấy những đổi mới của bạn và tiếp tục cùng nhau định hình tương lai của thị giác máy tính.
Kết nối với cộng đồng của chúng tôi và khám phá kho lưu trữ GitHub để tìm hiểu sâu hơn về AI. Khám phá các giải pháp ngành như AI trong robot và thị giác máy tính trong logistics, xem các tùy chọn cấp phép của chúng tôi và bắt đầu xây dựng với thị giác máy tính ngay hôm nay.





























