Hãy theo dõi YOLO Vision 2025!
Ngày 25 tháng 9 năm 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Tầm nhìn Yolo 2024

Gặp gỡ Ultralytics YOLO26: Một mô hình YOLO tốt hơn, nhanh hơn và nhỏ hơn

Abirami Vina

5 phút đọc

Ngày 25 tháng 9 năm 2025

Khám phá mẫu Ultralytics YOLO mới nhất, Ultralytics YOLO26, cùng các tính năng tiên tiến hỗ trợ cân bằng tối ưu giữa tốc độ, độ chính xác và khả năng triển khai.

Vào ngày 25 tháng 9, tại sự kiện kết hợp thường niên YOLO Vision 2025 (YV25) tại London, Glenn Jocher , Nhà sáng lập kiêm Giám đốc điều hành của chúng tôi, đã chính thức công bố bước đột phá mới nhất trong dòng sản phẩm Ultralytics YOLO, Ultralytics YOLO26! Mô hình thị giác máy tính mới của chúng tôi, YOLO26, có thể phân tích và diễn giải hình ảnh và video với kiến trúc hợp lý, cân bằng giữa tốc độ, độ chính xác và khả năng triển khai dễ dàng. 

Mặc dù Ultralytics YOLO26 đơn giản hóa các khía cạnh thiết kế của mô hình và bổ sung các cải tiến mới, nó vẫn tiếp tục cung cấp các tính năng quen thuộc mà người dùng mong đợi từ các mô hình Ultralytics YOLO. Ví dụ: Ultralytics YOLO26 dễ sử dụng, hỗ trợ nhiều tác vụ thị giác máy tính và cung cấp các tùy chọn tích hợp và triển khai linh hoạt. 

Không cần phải nói, điều này giúp việc chuyển sang sử dụng Ultralytics YOLO26 trở nên dễ dàng và chúng tôi rất mong chờ được chứng kiến người dùng tự mình trải nghiệm khi sản phẩm được phát hành rộng rãi vào cuối tháng 10. 

Hình 1. Ví dụ về việc sử dụng YOLO26 để phát hiện đối tượng trong hình ảnh.

Nói một cách đơn giản, Ultralytics YOLO26 là một mô hình Vision AI tốt hơn, nhanh hơn và nhỏ gọn hơn. Trong bài viết này, chúng ta sẽ khám phá các tính năng chính của Ultralytics YOLO26 và những lợi ích mà nó mang lại. Hãy cùng bắt đầu nào! 

Đẩy mạnh ranh giới của Vision AI với Ultralytics YOLO26

Trước khi đi sâu vào các tính năng chính của Ultralytics YOLO26 và các ứng dụng mà nó mang lại, hãy cùng nhìn lại nguồn cảm hứng và động lực thúc đẩy sự phát triển của mô hình này.

Tại Ultralytics, chúng tôi luôn tin tưởng vào sức mạnh của sự đổi mới. Ngay từ những ngày đầu, sứ mệnh của chúng tôi đã được thể hiện qua hai mặt. Một mặt, chúng tôi muốn Vision AI dễ tiếp cận để bất kỳ ai cũng có thể sử dụng mà không gặp bất kỳ rào cản nào. Mặt khác, chúng tôi cũng cam kết duy trì công nghệ này ở mức tiên tiến nhất, vượt qua mọi giới hạn mà các mô hình thị giác máy tính có thể đạt được.

Một yếu tố then chốt đằng sau sứ mệnh này là không gian AI luôn phát triển. Ví dụ, AI biên, bao gồm việc chạy các mô hình AI trực tiếp trên thiết bị thay vì dựa vào đám mây, đang được áp dụng nhanh chóng trên khắp các ngành công nghiệp.

Từ camera thông minh đến hệ thống tự động, các thiết bị biên giờ đây được kỳ vọng sẽ xử lý thông tin theo thời gian thực. Sự thay đổi này đòi hỏi các mô hình nhẹ hơn và nhanh hơn, nhưng vẫn đảm bảo độ chính xác cao.

Đó là lý do tại sao chúng tôi luôn cần phải cải tiến liên tục các mô hình YOLO của Ultralytics. Như Glenn Jocher đã nói, "Một trong những thách thức lớn nhất là đảm bảo người dùng có thể tận dụng tối đa YOLO26 mà vẫn mang lại hiệu suất cao nhất."

Tổng quan về Ultralytics YOLO26

YOLO26 có sẵn với năm phiên bản mẫu khác nhau, mang đến cho bạn sự linh hoạt để tận dụng khả năng của nó trong các ứng dụng ở mọi quy mô.
Tất cả các biến thể mô hình này đều hỗ trợ nhiều tác vụ thị giác máy tính, giống như các mô hình Ultralytics YOLO trước đây. Điều này có nghĩa là dù bạn chọn kích thước nào, bạn cũng có thể tin tưởng YOLO26 sẽ mang lại nhiều khả năng, tương tự như Ultralytics YOLO11 .

Sau đây là tổng quan về các tác vụ thị giác máy tính được YOLO26 hỗ trợ:

  • Phát hiện đối tượng : YOLO26 có thể xác định và định vị nhiều đối tượng trong một khung hình ảnh hoặc video.
  • Phân đoạn thực thể : Vượt xa khả năng phát hiện, YOLO26 có thể tạo ra ranh giới hoàn hảo đến từng pixel xung quanh mỗi đối tượng mà nó xác định.
  • Phân loại hình ảnh : Mô hình có thể phân tích toàn bộ hình ảnh và gán nó vào một danh mục hoặc nhãn cụ thể.

  • Ước tính tư thế : YOLO26 có thể phát hiện các điểm chính và ước tính tư thế của con người cũng như các vật thể khác.

  • Hộp giới hạn định hướng (OBB) : Mô hình có thể phát hiện các vật thể ở mọi góc độ, đặc biệt hữu ích cho ảnh trên không, ảnh máy bay không người lái và ảnh vệ tinh, trong đó các vật thể như tòa nhà, phương tiện hoặc cây trồng có thể không được căn chỉnh với khung ảnh.

  • Theo dõi đối tượng : YOLO26 có thể được sử dụng để theo dõi đối tượng trên các khung hình video hoặc luồng thời gian thực.
Hình 2. Phát hiện đối tượng trong hình ảnh bằng YOLO26.

Một cái nhìn về kiến trúc của YOLO26

Bây giờ chúng ta đã hiểu rõ hơn về khả năng của YOLO26, hãy cùng tìm hiểu một số cải tiến trong kiến trúc của nó.

Thiết kế của mô hình đã được hợp lý hóa bằng cách loại bỏ mô-đun Mất mát tiêu điểm phân phối (DFL), trước đây làm chậm quá trình suy luận và hạn chế hồi quy hộp giới hạn. 

Quy trình dự đoán cũng đã được đơn giản hóa với tùy chọn suy luận đầu cuối (E2E), cho phép mô hình bỏ qua bước NMS (Non-Maximum Suppression) truyền thống. Cải tiến này giúp giảm độ phức tạp và cho phép mô hình đưa ra kết quả nhanh hơn, giúp việc triển khai trong các ứng dụng thực tế dễ dàng hơn.

Các cải tiến khác giúp mô hình thông minh hơn và đáng tin cậy hơn. Cân bằng Mất mát Tiến bộ (ProgLoss) giúp ổn định quá trình huấn luyện và cải thiện độ chính xác, trong khi Gán Nhãn Nhận biết Mục tiêu Nhỏ (STAL) đảm bảo mô hình phát hiện các vật thể nhỏ hiệu quả hơn. Hơn nữa, bộ tối ưu hóa MuSGD mới cải thiện sự hội tụ trong huấn luyện và tăng cường hiệu suất tổng thể.

Trên thực tế, phiên bản nhỏ nhất của YOLO26, mẫu nano, hiện chạy nhanh hơn tới 43% trên CPU tiêu chuẩn, khiến nó đặc biệt phù hợp với các ứng dụng di động, camera thông minh và các thiết bị biên khác, nơi tốc độ và hiệu quả là yếu tố quan trọng.

Sau đây là tóm tắt nhanh về các tính năng của YOLO26 và những gì người dùng có thể mong đợi:

  • Loại bỏ DFL: Chúng tôi đã loại bỏ mô-đun Phân phối Tiêu cự (Distribution Focus Loss) khỏi kiến trúc của mô hình. Bất kể kích thước đối tượng trong ảnh, YOLO26 có thể đặt các hộp giới hạn được tùy chỉnh đồng thời hoạt động hiệu quả hơn.
  • Suy luận không cần NMS đầu cuối: YOLO26 bổ sung chế độ tùy chọn không cần NMS (Non-Maximum Suppression) , một bước thường được sử dụng để loại bỏ các dự đoán trùng lặp, giúp việc triển khai đơn giản hơn và nhanh hơn khi sử dụng theo thời gian thực.
  • ProgLoss và STAL: Những cải tiến này giúp quá trình đào tạo ổn định hơn và tăng đáng kể độ chính xác, đặc biệt là khi phát hiện các vật thể nhỏ trong các cảnh phức tạp.
  • Bộ tối ưu hóa MuSGD: YOLO26 sử dụng bộ tối ưu hóa mới kết hợp sức mạnh của hai bộ tối ưu hóa đào tạo (Muon và SGD), giúp mô hình học nhanh hơn và đạt độ chính xác cao hơn.
Hình 3. So sánh YOLO26.

Đơn giản hóa việc triển khai với Ultralytics YOLO26 

Cho dù bạn đang làm việc trên ứng dụng di động, camera thông minh hay hệ thống doanh nghiệp, việc triển khai YOLO26 đều đơn giản và linh hoạt. Gói Python của Ultralytics hỗ trợ số lượng định dạng xuất dữ liệu ngày càng tăng, giúp dễ dàng tích hợp YOLO26 vào quy trình làm việc hiện có và tương thích với hầu hết mọi nền tảng. 

Một số tùy chọn xuất bao gồm TensorRT để tăng tốc GPU tối đa, ONNX cho khả năng tương thích rộng, CoreML cho ứng dụng iOS gốc, TFLite cho Android và các thiết bị biên, và OpenVINO để tối ưu hóa hiệu suất trên phần cứng Intel. Tính linh hoạt này giúp việc đưa YOLO26 từ giai đoạn phát triển sang giai đoạn sản xuất dễ dàng mà không gặp bất kỳ trở ngại nào.

Một phần quan trọng khác của việc triển khai là đảm bảo các mô hình chạy hiệu quả trên các thiết bị có tài nguyên hạn chế. Đây chính là lúc lượng tử hóa phát huy tác dụng. Nhờ kiến trúc đơn giản hóa, YOLO26 xử lý vấn đề này cực kỳ tốt. Nó hỗ trợ triển khai INT8 (sử dụng nén 8 bit để giảm kích thước và cải thiện tốc độ với độ chính xác tối thiểu) cũng như half-precision (FP16) để suy luận nhanh hơn trên phần cứng được hỗ trợ. 

Quan trọng nhất, YOLO26 mang lại hiệu suất nhất quán trên các mức lượng tử hóa này, vì vậy bạn có thể tin tưởng vào nó cho dù nó chạy trên máy chủ mạnh mẽ hay thiết bị biên nhỏ gọn.

Từ robot đến sản xuất: Các trường hợp sử dụng YOLO26 

YOLO26 có thể được sử dụng trong nhiều ứng dụng thị giác máy tính thuộc nhiều ngành công nghiệp và trường hợp sử dụng khác nhau. Từ robot đến sản xuất, nó có thể tạo ra tác động đáng kể bằng cách cải thiện quy trình làm việc và cho phép ra quyết định nhanh hơn, chính xác hơn.

Ví dụ, trong lĩnh vực robot , YOLO26 có thể giúp robot phân tích môi trường xung quanh theo thời gian thực. Điều này giúp việc điều hướng mượt mà hơn và xử lý vật thể chính xác hơn. Nó cũng cho phép cộng tác an toàn hơn với con người.

Một ví dụ khác là sản xuất , nơi mô hình có thể được sử dụng để phát hiện lỗi. Nó có thể tự động xác định lỗi trên dây chuyền sản xuất nhanh hơn và chính xác hơn so với kiểm tra thủ công.

Hình 4. Phát hiện chai lọ trong nhà máy sản xuất bằng YOLO26.

Nhìn chung, vì YOLO26 tốt hơn, nhanh hơn và nhẹ hơn, nên nó dễ dàng thích ứng với nhiều môi trường khác nhau, từ các thiết bị biên nhẹ đến các hệ thống doanh nghiệp lớn. Điều này khiến nó trở thành lựa chọn thiết thực cho các ngành công nghiệp muốn cải thiện hiệu quả, độ chính xác và độ tin cậy.

Những điểm chính 

Ultralytics YOLO26 là một mô hình thị giác máy tính tốt hơn, nhanh hơn và nhẹ hơn, đồng thời vẫn dễ sử dụng và mang lại hiệu suất mạnh mẽ. Nó hoạt động trên nhiều tác vụ và nền tảng khác nhau và sẽ được cung cấp cho tất cả mọi người vào cuối tháng 10. Chúng tôi rất mong chờ xem cộng đồng sẽ sử dụng nó như thế nào để tạo ra các giải pháp mới và mở rộng ranh giới của thị giác máy tính.

Hãy tham gia cộng đồng đang phát triển của chúng tôi! Khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về AI. Khám phá những đổi mới như thị giác máy tính trong bán lẻAI trong ngành công nghiệp ô tô bằng cách truy cập các trang giải pháp của chúng tôi. Để bắt đầu xây dựng với thị giác máy tính ngay hôm nay, hãy xem qua các tùy chọn cấp phép của chúng tôi.

Hãy cùng xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của máy học

Bắt đầu miễn phí
Liên kết đã được sao chép vào clipboard