Ultralytics YOLO

Ultralytics YOLO26 so với YOLO11 so với YOLOv8: Bạn nên sử dụng loại nào?

Khám phá Ultralytics YOLO26 so với Ultralytics YOLO11 so với Ultralytics YOLOv8 và tìm hiểu mô hình thị giác máy tính nào bạn nên chọn cho dự án của mình.

ABAbirami Vina5 min readApril 13, 2026

So sánh các mô hình Ultralytics YOLO26, YOLO11 và YOLOv8

Các hệ thống computer vision hiện đại, thường được vận hành bởi mạng thần kinh tích chập (CNN), cho phép máy móc phân tích và diễn giải dữ liệu thị giác từ hình ảnh và video, và hiện đang được triển khai trên nhiều môi trường khác nhau.

Từ nông nghiệp đến sản xuất và bán lẻ, các hệ thống này vận hành trên nhiều môi trường triển khai, bao gồm các thiết bị biên, phần cứng nhúng, thiết bị Internet of Things (IoT), xử lý tại thiết bị (on-device processing) và các pipeline đám mây quy mô lớn hỗ trợ các ứng dụng thời gian thực.

Trong thực tế, việc triển khai các mô hình này không phải lúc nào cũng đơn giản. Chúng thường cần chạy với tài nguyên tính toán hạn chế, đáp ứng các yêu cầu khắt khe về độ trễ và mở rộng quy mô mà không làm tăng đáng kể chi phí. Những ràng buộc này khiến hiệu suất trở thành một vấn đề đa chiều thay vì chỉ đơn thuần là độ chính xác.

Mặc dù độ chính xác vẫn rất quan trọng, nhưng việc mô hình chạy hiệu quả trong môi trường production cũng quan trọng không kém. Các yếu tố như tốc độ, mức sử dụng tài nguyên và khả năng mở rộng đóng vai trò lớn trong việc hệ thống hoạt động hiệu quả như thế nào theo thời gian.

Các mô hình computer vision như Ultralytics YOLO models đã phát triển với sự cân bằng này. Ví dụ, Ultralytics YOLOv8 đã thiết lập một nền tảng mạnh mẽ và linh hoạt, Ultralytics YOLO11 tiến xa hơn với tốc độ và độ chính xác được cải thiện, và Ultralytics YOLO26 xây dựng trên nền tảng đó bằng cách trở nên nhẹ hơn, nhanh hơn và hiệu quả hơn bao giờ hết.

Sử dụng Ultralytics YOLO26 để phát hiện đối tượng trong hình ảnh

Hình 1. Sử dụng Ultralytics YOLO26 để phát hiện vật thể trong ảnh (Nguồn)

Trong bài viết này, chúng tôi sẽ so sánh Ultralytics YOLO26, YOLO11 và YOLOv8 để giúp bạn chọn đúng mô hình cho dự án computer vision của mình. Hãy bắt đầu thôi!

Link to this sectionTìm hiểu cách các mô hình Ultralytics YOLO đã phát triển#

Mỗi phiên bản của các mô hình Ultralytics YOLO đều giới thiệu những cải tiến để đáp ứng tốt hơn các yêu cầu thực tế và giúp computer vision trở nên dễ tiếp cận hơn. Những cập nhật này đã làm cho các mô hình nhanh hơn, hiệu quả hơn và dễ triển khai hơn, hỗ trợ sự phát triển của hệ sinh thái vision AI.

Chúng cũng được xây dựng trên PyTorch, giúp dễ dàng huấn luyện, tùy chỉnh và tích hợp vào các workflow machine learning thông minh. Ngay từ khi xuất xưởng, các mô hình Ultralytics YOLO đã có sẵn dưới dạng mô hình được huấn luyện trước, thường được đào tạo trên các tập dữ liệu như COCO, cho phép các nhóm bắt đầu nhanh chóng và tinh chỉnh (fine-tune) chúng cho các trường hợp sử dụng cụ thể.

Ngoài ra, Ultralytics Python package đơn giản hóa việc triển khai bằng cách cung cấp hỗ trợ tích hợp để xuất mô hình sang các định dạng như ONNX và TensorRT. Điều này giúp tích hợp các mô hình dễ dàng hơn trên các nền tảng phần cứng khác nhau, từ các thiết bị biên đến các hệ thống tăng tốc bằng GPU.

Link to this sectionTừ Ultralytics YOLOv5 đến Ultralytics YOLO26#

Mô hình Ultralytics YOLO đầu tiên, Ultralytics YOLOv5, đã trở nên phổ biến rộng rãi nhờ khả năng phát hiện vật thể đáng tin cậy. Được xây dựng trên phương pháp phát hiện một giai đoạn (one-stage), nó cho phép dự đoán thời gian thực nhanh chóng chỉ trong một lần truyền, khiến nó rất phù hợp cho các workflow production.

Các bản cập nhật sau đó đã giới thiệu các biến thể không cần anchor (anchor-free), trong đó mô hình dự đoán trực tiếp vị trí vật thể thay vì sử dụng các anchor box được xác định trước, giúp việc phát hiện linh hoạt hơn. Tuy nhiên, mô hình gốc vẫn tập trung chủ yếu vào các tác vụ phát hiện vật thể.

Xây dựng dựa trên nền tảng này, YOLOv8 đã mở rộng phạm vi của dòng mô hình. Thay vì chỉ tập trung vào phát hiện vật thể, nó đã bổ sung hỗ trợ cho nhiều computer vision tasks như phân đoạn đối tượng (instance segmentation), phân loại hình ảnh (image classification), ước tính tư thế (pose estimation) và phát hiện hộp bao xoay (OBB). Nó cũng mang đến những cải tiến về kiến trúc, bao gồm các thiết kế backbone và neck tiên tiến, giúp tăng cường khả năng trích xuất đặc trưng và hiệu suất phát hiện tổng thể.

Hơn nữa, các biến thể như YOLOv8n (Nano), YOLOv8s (Small), YOLOv8m (Medium), YOLOv8l (Large) và YOLOv8x (Extra Large) mang đến cho các lập trình viên sự linh hoạt để cân bằng tốc độ, độ chính xác và mức sử dụng tài nguyên dựa trên nhu cầu của họ. Khả năng rộng hơn này, kết hợp với tính dễ sử dụng, đã biến nó thành lựa chọn hàng đầu cho nhiều ứng dụng thị giác máy tính.

Các model YOLO như YOLOv8, YOLO11 và YOLO26 hỗ trợ nhiều tác vụ thị giác khác nhau

Hình 2. Các mô hình YOLO như YOLOv8, YOLO11 và YOLO26 hỗ trợ một loạt các tác vụ thị giác.

Tiếp theo đó, YOLO11 tập trung vào việc cải thiện hiệu suất trong các workflow thực tế, mang lại độ chính xác cao hơn cùng với tốc độ inference nhanh hơn. Với kiến trúc nhẹ hơn, nó hoạt động tốt trên cả môi trường biên và đám mây, đồng thời tương thích với các pipeline YOLOv8 hiện có.

Sự bổ sung mới nhất vào dòng mô hình Ultralytics YOLO, YOLO26, là một mô hình hiện đại đặt ra tiêu chuẩn mới cho vision AI ưu tiên biên, mang lại cách tiếp cận nhẹ hơn, nhanh hơn và hiệu quả hơn cho việc triển khai thực tế. Nó được thiết kế để chạy hiệu quả trên CPU và hệ thống nhúng, đồng thời đơn giản hóa việc triển khai và cải thiện hiệu suất thời gian thực trên nhiều ứng dụng.

Link to this sectionSo sánh YOLO26, YOLO11 và YOLOv8#

Khi thực hiện các dự án computer vision, bạn có thể bắt gặp các mô hình Ultralytics khác nhau và tự hỏi mô hình nào phù hợp cho dự án của mình. Hãy cùng xem xét cách YOLO26, YOLO11 và YOLOv8 so sánh trong các tình huống thực tế.

YOLOv8 được phát hành vào năm 2023 và đã được cộng đồng computer vision sử dụng rộng rãi kể từ đó. Sự hỗ trợ cộng đồng mạnh mẽ và tính dễ sử dụng đã biến nó thành mô hình được ưa chuộng cho nhiều đội ngũ trong quá khứ. Nếu bạn đang tìm kiếm một mô hình có tài liệu đầy đủ với nhiều hướng dẫn và tài nguyên cộng đồng, YOLOv8 là một điểm khởi đầu tuyệt vời.

Năm 2024, YOLO11 ra đời với những cải tiến về cả hiệu suất và hiệu quả. Nó cung cấp tốc độ và độ chính xác tốt hơn so với YOLOv8, trong khi vẫn duy trì kiến trúc nhỏ gọn và được tối ưu hóa hơn. Đây là một mô hình cân bằng hơn, hoạt động đáng tin cậy trong môi trường production mà không làm tăng đáng kể mức sử dụng tài nguyên.

Năm nay, YOLO26 được phát hành như phiên bản mới nhất, tập trung vào việc triển khai hiệu quả trên quy mô lớn. Nó mang lại tốc độ inference trên CPU nhanh hơn và mức sử dụng tài nguyên được cải thiện, cho phép các đội ngũ chạy nhiều workload hơn trên cùng một phần cứng.

Ví dụ, mô hình YOLO26 nano có thể đạt tốc độ inference nhanh hơn tới 43% so với YOLO11 trên bộ xử lý trung tâm (CPU), biến nó thành một lựa chọn tuyệt vời cho các môi trường biên và hạn chế về tài nguyên. Điều này đặc biệt quan trọng vì các thiết lập truyền thống thường dựa nhiều vào bộ xử lý đồ họa (GPU), vốn có thể đắt đỏ và khó mở rộng quy mô hơn.

Đánh giá hiệu năng của YOLO26 trên CPU

Hình 3. Đo lường hiệu suất của YOLO26 trên CPU (Nguồn)

Nhìn chung, YOLO26 là một lựa chọn vững chắc cho các đội ngũ và cá nhân muốn tối ưu hóa sự đánh đổi giữa hiệu suất, chi phí và khả năng mở rộng.

Link to this sectionCái nhìn sâu hơn về Ultralytics YOLO26#

YOLO26 là một mô hình hiện đại được thiết kế cho việc triển khai thực tế, nơi hiệu quả, tốc độ và khả năng mở rộng quan trọng không kém độ chính xác. Thay vì chỉ tập trung vào việc cải thiện các chỉ số benchmark, nó giới thiệu những thay đổi về kiến trúc và huấn luyện giúp mô hình dễ vận hành hơn, triển khai nhanh hơn và đáng tin cậy hơn trên các môi trường phần cứng khác nhau.

Những cải tiến này đặc biệt quan trọng đối với các hệ thống biên và sản xuất, nơi tài nguyên tính toán hạn chế, ràng buộc về độ trễ và yếu tố chi phí đóng vai trò chủ chốt. Bằng cách đơn giản hóa inference và tối ưu hóa hiệu suất, YOLO26 cho phép những người đam mê AI xây dựng và mở rộng các ứng dụng thị giác hiệu quả hơn.

Dưới đây là cái nhìn sâu hơn về một số tính năng chính của YOLO26:

Inference end-to-end không cần NMS: Một trong những thay đổi quan trọng là thiết kế không cần Non-Maximum Suppression (NMS), giúp loại bỏ nhu cầu xử lý hậu kỳ. Nói đơn giản, mô hình đưa ra các dự đoán cuối cùng trực tiếp. Kết quả là độ trễ trở nên dễ dự đoán hơn và việc triển khai trở nên dễ dàng hơn.
Loại bỏ DFL: YOLO26 chuyển dịch từ module Distribution Focal Loss (DFL) sang một phương pháp dự đoán hộp bao đơn giản hơn. Thay đổi này đồng bộ với thiết kế end-to-end không cần NMS, giúp giảm độ phức tạp của pipeline và cải thiện tính nhất quán khi triển khai.
Bộ tối ưu hóa MuSGD: Các mô hình Ultralytics YOLO mới nhất giới thiệu MuSGD, một bộ tối ưu hóa lai kết hợp Stochastic Gradient Descent (SGD) với các bản cập nhật lấy cảm hứng từ Muon. Điều này cải thiện độ ổn định và khả năng hội tụ khi huấn luyện, dẫn đến việc tối ưu hóa mượt mà hơn và hành vi nhất quán hơn trên các kích thước mô hình khác nhau.
ProgLoss và STAL: Những đổi mới trong huấn luyện, gồm Progressive Loss Balancing (ProgLoss) và Small-Target-Aware Label Assignment (STAL), làm cho mô hình ổn định và đáng tin cậy hơn. ProgLoss giúp mô hình học từ các tập dữ liệu theo từng giai đoạn, trong khi STAL đảm bảo các vật thể nhỏ không bị bỏ qua trong quá trình huấn luyện, cải thiện khả năng phát hiện trong các cảnh phức tạp.

Link to this sectionĐộ chính xác so với hiệu quả: Vượt xa các benchmark để đạt được hiệu suất thực tế#

Để đặt sự khác biệt giữa YOLO26, YOLO11 và YOLOv8 vào bối cảnh, hãy hiểu rõ hơn về các yếu tố thúc đẩy hiệu suất mô hình trong thực tế.

Độ chính xác, thường được đo bằng các chỉ số hiệu suất như mAP, từ lâu đã là một cách quan trọng để đánh giá các mô hình computer vision. Nó cho thấy mô hình hoạt động tốt như thế nào trong các điều kiện tiêu chuẩn và rất hữu ích khi so sánh các phiên bản khác nhau.

Tuy nhiên, khi các mô hình chuyển từ thử nghiệm sang triển khai thực tế, chỉ riêng độ chính xác là không đủ. Hiệu suất trong production phụ thuộc vào các yếu tố như kích thước mô hình, thời gian inference hoặc độ trễ, mức sử dụng tài nguyên tính toán và khả năng mở rộng của hệ thống trên các môi trường khác nhau.

Không giống như các benchmark có kiểm soát, môi trường thực tế thường không thể đoán trước. Điều kiện ánh sáng có thể thay đổi, các vật thể có thể bị che khuất một phần và dữ liệu đầu vào có thể khác biệt đáng kể so với dữ liệu được dùng để huấn luyện mô hình. Những biến đổi này có thể ảnh hưởng đến mức độ nhất quán của mô hình trong thực tế.

YOLO26 được sử dụng trong môi trường không dự đoán trước như công trường xây dựng

Hình 4. Ví dụ về YOLO26 được sử dụng trong một môi trường không thể đoán trước, như công trường xây dựng.

Ví dụ, hãy xem xét một thiết lập với hàng trăm camera trong một thành phố thông minh, cửa hàng bán lẻ hoặc nhà kho. Mỗi luồng cần được xử lý trong thời gian thực, thường yêu cầu tốc độ khung hình (FPS) nhất quán để tránh độ trễ hoặc mất khung hình.

Một mô hình kém hiệu quả hơn có thể xử lý ít luồng đồng thời hơn trên một hệ thống nhất định, điều này có nghĩa là việc mở rộng quy mô thường yêu cầu thêm phần cứng và làm tăng chi phí cơ sở hạ tầng.

Các mô hình hiệu quả hơn như YOLO26 có thể xử lý nhiều luồng hơn trên cùng một phần cứng, tận dụng tốt hơn tài nguyên sẵn có. Điều này cải thiện hiệu suất hệ thống tổng thể và giúp việc mở rộng triển khai dễ dàng hơn theo thời gian.

Để tìm hiểu sâu hơn về YOLO26, YOLO11 và YOLOv8, hãy xem tài liệu chính thức của Ultralytics.

Link to this sectionCác điểm chính cần lưu ý#

Dòng mô hình Ultralytics YOLO đã phát triển để phù hợp hơn với nhu cầu triển khai thực tế. Mỗi phiên bản được xây dựng dựa trên phiên bản trước, với sự tập trung ngày càng tăng vào hiệu quả, khả năng mở rộng và tính dễ triển khai. Nói cách khác, nếu bạn đang xây dựng một ứng dụng phát hiện thời gian thực cần chạy đáng tin cậy ở quy mô lớn, Ultralytics YOLO26 là một lựa chọn hoàn hảo.

Bạn đang muốn đưa vision AI vào hoạt động của mình? Hãy xem các tùy chọn cấp phép của chúng tôi. Bạn cũng có thể truy cập các trang giải pháp của chúng tôi để xem AI trong sản xuất đang chuyển đổi các nhà máy như thế nào và cách vision AI trong robotics đang định hình tương lai. Hãy tham gia cộng đồng đang phát triển của chúng tôi và khám phá kho lưu trữ GitHub để tìm tài nguyên AI.

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Ultralytics YOLO26 so với YOLO11 so với YOLOv8: Bạn nên sử dụng loại nào?

Link to this sectionTìm hiểu cách các mô hình Ultralytics YOLO đã phát triển#

Link to this sectionTừ Ultralytics YOLOv5 đến Ultralytics YOLO26#

Link to this sectionSo sánh YOLO26, YOLO11 và YOLOv8#

Link to this sectionCái nhìn sâu hơn về Ultralytics YOLO26#

Link to this sectionĐộ chính xác so với hiệu quả: Vượt xa các benchmark để đạt được hiệu suất thực tế#

Link to this sectionCác điểm chính cần lưu ý#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!