Gặp Ultralytics YOLO26: Tốt hơn, nhanh hơn, nhỏ hơn YOLO mô hình

Vào ngày 25 tháng 9, tại sự kiện kết hợp thường niên của chúng tôi, YOLO Vision 2025 (YV25) tại London, Glenn Jocher , Nhà sáng lập & Giám đốc điều hành của chúng tôi, đã chính thức công bố bước đột phá mới nhất trong Ultralytics YOLO loạt mô hình, Ultralytics YOLO26! Mô hình thị giác máy tính mới của chúng tôi, YOLO26, có thể phân tích và diễn giải hình ảnh và video với kiến trúc hợp lý, cân bằng giữa tốc độ, độ chính xác và khả năng triển khai dễ dàng.

Trong khi Ultralytics YOLO26 đơn giản hóa các khía cạnh thiết kế của mô hình và bổ sung các cải tiến mới, nó cũng tiếp tục cung cấp các tính năng quen thuộc mà người dùng mong đợi từ Ultralytics YOLO mô hình. Ví dụ, Ultralytics YOLO26 dễ sử dụng, hỗ trợ nhiều tác vụ thị giác máy tính và cung cấp các tùy chọn tích hợp và triển khai linh hoạt.

Không cần phải nói, điều này làm cho việc chuyển sang sử dụng Ultralytics YOLO26 không gặp rắc rối và chúng tôi rất mong chờ được chứng kiến người dùng tự mình trải nghiệm khi nó được phát hành rộng rãi vào cuối tháng 10.

Hình 1. Một ví dụ về việc sử dụng YOLO26 để detect các đối tượng trong một hình ảnh.

‍

Nói một cách đơn giản, Ultralytics YOLO26 là một mô hình Vision AI tốt hơn, nhanh hơn và nhỏ hơn. Trong bài viết này, chúng ta sẽ khám phá các tính năng chính của Ultralytics YOLO26 và những lợi ích mà nó mang lại. Hãy cùng bắt đầu nhé!

Đẩy mạnh ranh giới của Vision AI với Ultralytics YOLO26

Trước khi chúng ta đi sâu vào các tính năng chính của Ultralytics YOLO26 và những ứng dụng mà nó mang lại, chúng ta hãy cùng lùi lại một bước và thảo luận về nguồn cảm hứng và động lực thúc đẩy sự phát triển của mô hình này.

Tại Ultralytics Chúng tôi luôn tin tưởng vào sức mạnh của sự đổi mới. Ngay từ những ngày đầu, sứ mệnh của chúng tôi đã được thể hiện qua hai mặt. Một mặt, chúng tôi muốn Vision AI dễ tiếp cận để bất kỳ ai cũng có thể sử dụng mà không gặp bất kỳ rào cản nào. Mặt khác, chúng tôi cũng cam kết duy trì công nghệ này ở mức tiên tiến nhất, vượt qua mọi giới hạn mà các mô hình thị giác máy tính có thể đạt được.

Một yếu tố then chốt đằng sau sứ mệnh này là không gian AI luôn phát triển. Chẳng hạn, AI biên, liên quan đến việc chạy các mô hình AI trực tiếp trên thiết bị thay vì dựa vào đám mây, đang được áp dụng nhanh chóng trong các ngành công nghiệp.

Từ camera thông minh đến hệ thống tự động, các thiết bị ở biên (edge) hiện được kỳ vọng xử lý thông tin theo thời gian thực. Sự thay đổi này đòi hỏi các mô hình nhẹ hơn và nhanh hơn, đồng thời vẫn mang lại mức độ chính xác cao tương đương.

Đó là lý do tại sao chúng ta luôn cần phải cải thiện liên tục Ultralytics YOLO mô hình. Như Glenn Jocher đã nói, “Một trong những thách thức lớn nhất là đảm bảo người dùng có thể tận dụng tối đa YOLO26 trong khi vẫn mang lại hiệu suất cao nhất.”

Tổng quan về Ultralytics YOLO26

YOLO26 có sẵn với năm phiên bản mẫu khác nhau, mang đến cho bạn sự linh hoạt để tận dụng khả năng của nó trong các ứng dụng ở mọi quy mô.
Tất cả các biến thể mô hình này đều hỗ trợ nhiều tác vụ thị giác máy tính, giống như trước đây Ultralytics YOLO các mẫu. Điều này có nghĩa là bất kể bạn chọn kích thước nào, bạn có thể tin tưởng rằng YOLO26 sẽ cung cấp nhiều khả năng khác nhau, giống như Ultralytics YOLO11 .

Đây là tổng quan về các tác vụ thị giác máy tính được YOLO26 hỗ trợ:

Phát hiện đối tượng : YOLO26 có thể xác định và định vị nhiều đối tượng trong một khung hình ảnh hoặc video.
Phân đoạn thực thể : Vượt xa khả năng phát hiện, YOLO26 có thể tạo ra ranh giới hoàn hảo đến từng pixel xung quanh mỗi đối tượng mà nó xác định.
Phân loại hình ảnh : Mô hình có thể phân tích toàn bộ hình ảnh và gán nó vào một danh mục hoặc nhãn cụ thể .
Ước tính tư thế : YOLO26 có thể detect các điểm chính và ước tính tư thế cho con người cũng như các vật thể khác .
Hộp giới hạn định hướng (OBB) : Mô hình có thể detect các vật thể ở mọi góc độ, đặc biệt hữu ích cho hình ảnh trên không, máy bay không người lái và vệ tinh, trong đó các vật thể như tòa nhà, phương tiện hoặc cây trồng có thể không được căn chỉnh với khung hình ảnh .
Theo dõi đối tượng : YOLO26 có thể được sử dụng để track các đối tượng trên các khung hình video hoặc luồng thời gian thực.

Hình 2. Phát hiện các đối tượng trong ảnh bằng YOLO26.

‍

Một cái nhìn về kiến trúc của YOLO26

Bây giờ chúng ta đã hiểu rõ hơn về khả năng của YOLOv8, hãy cùng xem xét một số cải tiến trong kiến trúc của nó.

Thiết kế của mô hình đã được tinh giản bằng cách loại bỏ mô-đun Distribution Focal Loss (DFL), mô-đun này trước đây làm chậm quá trình suy luận và hạn chế hồi quy hộp giới hạn.

Quá trình dự đoán cũng đã được đơn giản hóa với tùy chọn suy luận đầu cuối (E2E), cho phép mô hình bỏ qua phương pháp loại bỏ không tối đa truyền thống ( NMS ) bước. Cải tiến này làm giảm độ phức tạp và cho phép mô hình đưa ra kết quả nhanh hơn, giúp triển khai dễ dàng hơn trong các ứng dụng thực tế.

Những cải tiến khác làm cho mô hình thông minh hơn và đáng tin cậy hơn. Cân bằng Mất mát Lũy tiến (ProgLoss) giúp ổn định quá trình huấn luyện và cải thiện độ chính xác, trong khi Gán Nhãn Nhận Biết Mục Tiêu Nhỏ (STAL) đảm bảo mô hình phát hiện các đối tượng nhỏ hiệu quả hơn. Trên hết, một trình tối ưu hóa MuSGD mới cải thiện sự hội tụ huấn luyện và tăng hiệu suất tổng thể.

Trên thực tế, phiên bản nhỏ nhất của YOLO26, mô hình nano, hiện chạy nhanh hơn tới 43% trên CPU tiêu chuẩn, khiến nó đặc biệt phù hợp cho các ứng dụng di động, camera thông minh và các thiết bị biên khác, nơi tốc độ và hiệu quả là rất quan trọng.

Dưới đây là tóm tắt nhanh về các tính năng của YOLO26 và những gì người dùng có thể mong đợi:

Loại bỏ DFL: Chúng tôi đã loại bỏ mô-đun Phân phối Tiêu cự (Distribution Focus Loss) khỏi kiến trúc của mô hình. Bất kể kích thước đối tượng trong ảnh, YOLO26 có thể đặt các hộp giới hạn được tùy chỉnh đồng thời hoạt động hiệu quả hơn.
Suy luận không cần NMS đầu cuối: YOLO26 bổ sung chế độ tùy chọn không cần NMS (Non-Maximum Suppression) , một bước thường được sử dụng để loại bỏ các dự đoán trùng lặp, giúp triển khai đơn giản hơn và nhanh hơn khi sử dụng theo thời gian thực.
ProgLoss và STAL: Những cải tiến này giúp quá trình đào tạo ổn định hơn và tăng đáng kể độ chính xác, đặc biệt là khi phát hiện các vật thể nhỏ trong các cảnh phức tạp.
Bộ tối ưu hóa MuSGD: YOLO26 sử dụng bộ tối ưu hóa mới kết hợp sức mạnh của hai bộ tối ưu hóa đào tạo (Muon và SGD ), giúp mô hình học nhanh hơn và đạt độ chính xác cao hơn.

‍

Đơn giản hóa việc triển khai với Ultralytics YOLO26

Cho dù bạn đang làm việc trên ứng dụng di động, camera thông minh hay hệ thống doanh nghiệp, việc triển khai YOLO26 đều đơn giản và linh hoạt. Gói Python Ultralytics hỗ trợ số lượng định dạng xuất dữ liệu ngày càng tăng, giúp dễ dàng tích hợp YOLO26 vào quy trình làm việc hiện có và tương thích với hầu hết mọi nền tảng.

Một số tùy chọn xuất khẩu bao gồm TensorRT cho tối đa GPU gia tốc, ONNX để có khả năng tương thích rộng rãi, CoreML cho người bản xứ iOS ứng dụng, TFLite vì Android và các thiết bị biên, và OpenVINO để tối ưu hóa hiệu suất trên Intel phần cứng. Tính linh hoạt này giúp dễ dàng đưa YOLO26 từ giai đoạn phát triển sang giai đoạn sản xuất mà không gặp thêm trở ngại nào.

Một phần quan trọng khác của việc triển khai là đảm bảo các mô hình chạy hiệu quả trên các thiết bị có tài nguyên hạn chế. Đây là lúc lượng tử hóa phát huy tác dụng. Nhờ kiến trúc đơn giản hóa, YOLO26 xử lý điều này đặc biệt tốt. Nó hỗ trợ triển khai INT8 (sử dụng nén 8 bit để giảm kích thước và cải thiện tốc độ với mức giảm độ chính xác tối thiểu) cũng như độ chính xác một nửa (FP16) để suy luận nhanh hơn trên phần cứng được hỗ trợ.

Quan trọng nhất, YOLO26 mang lại hiệu suất nhất quán trên các mức lượng tử hóa này, vì vậy bạn có thể tin tưởng vào nó cho dù nó đang chạy trên một máy chủ mạnh mẽ hay một thiết bị biên nhỏ gọn.

Từ robot đến sản xuất: Các trường hợp sử dụng của YOLO26

YOLO26 có thể được sử dụng rộng rãi trong nhiều ứng dụng thị giác máy tính khác nhau trên nhiều ngành và trường hợp sử dụng khác nhau. Từ robot đến sản xuất, nó có thể tạo ra tác động đáng kể bằng cách cải thiện quy trình làm việc và cho phép đưa ra quyết định nhanh hơn, chính xác hơn.

Ví dụ: một ví dụ điển hình là trong ngành robot, nơi YOLO26 có thể giúp robot diễn giải môi trường xung quanh theo thời gian thực. Điều này làm cho việc điều hướng mượt mà hơn và xử lý đối tượng chính xác hơn. Nó cũng cho phép cộng tác an toàn hơn với mọi người.

Một ví dụ khác là sản xuất, nơi mô hình có thể được sử dụng để phát hiện khuyết tật. Nó có thể tự động xác định các lỗi trên dây chuyền sản xuất nhanh chóng và chính xác hơn so với kiểm tra thủ công.

Hình 4. Phát hiện chai trong nhà máy sản xuất bằng YOLO26.

‍

Nói chung, vì YOLO26 tốt hơn, nhanh hơn và nhẹ hơn, nó dễ dàng thích ứng với nhiều môi trường khác nhau, từ các thiết bị biên (edge devices) nhẹ đến các hệ thống doanh nghiệp lớn. Điều này làm cho nó trở thành một lựa chọn thiết thực cho các ngành công nghiệp đang tìm cách cải thiện hiệu quả, độ chính xác và độ tin cậy.

Những điều cần nhớ

Ultralytics YOLO26 là một mô hình thị giác máy tính tốt hơn, nhanh hơn và nhẹ hơn, đồng thời vẫn dễ sử dụng và mang lại hiệu suất mạnh mẽ. Nó hoạt động trên nhiều tác vụ và nền tảng khác nhau, và sẽ được cung cấp cho tất cả mọi người vào cuối tháng 10. Chúng tôi rất mong chờ xem cộng đồng sẽ sử dụng nó như thế nào để tạo ra các giải pháp mới và mở rộng ranh giới của thị giác máy tính.

Tham gia cộng đồng đang phát triển của chúng tôi! Khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về AI. Khám phá những đổi mới như thị giác máy tính trong bán lẻ và AI trong ngành công nghiệp ô tô bằng cách truy cập các trang giải pháp của chúng tôi. Để bắt đầu xây dựng với thị giác máy tính ngay hôm nay, hãy xem các tùy chọn cấp phép của chúng tôi.

Gặp Ultralytics YOLO26: Tốt hơn, nhanh hơn, nhỏ hơn YOLO người mẫu

Đẩy mạnh ranh giới của Vision AI với Ultralytics YOLO26

Tổng quan về Ultralytics YOLO26

Một cái nhìn về kiến trúc của YOLO26

Đơn giản hóa việc triển khai với Ultralytics YOLO26

Từ robot đến sản xuất: Các trường hợp sử dụng của YOLO26

Những điều cần nhớ

Đọc thêm trong danh mục này

Một cái nhìn về việc sử dụng Ultralytics YOLO các mô hình để phát hiện mối đe dọa AI

Tự động hóa quản lý sự cố giao thông với Ultralytics YOLO26

Khám phá lý do tại sao Ultralytics YOLO26 dễ dàng đưa vào sản xuất hơn!

Hãy cùng nhau xây dựng tương lai
của AI!

Gặp Ultralytics YOLO26: Tốt hơn, nhanh hơn, nhỏ hơn YOLO người mẫu

Đẩy mạnh ranh giới của Vision AI với Ultralytics YOLO26

Tổng quan về Ultralytics YOLO26

Một cái nhìn về kiến trúc của YOLO26

Đơn giản hóa việc triển khai với Ultralytics YOLO26

Từ robot đến sản xuất: Các trường hợp sử dụng của YOLO26

Những điều cần nhớ

Đọc thêm trong danh mục này

Một cái nhìn về việc sử dụng Ultralytics YOLO các mô hình để phát hiện mối đe dọa AI

Tự động hóa quản lý sự cố giao thông với Ultralytics YOLO26

Khám phá lý do tại sao Ultralytics YOLO26 dễ dàng đưa vào sản xuất hơn!

Hãy cùng nhau xây dựng tương lai của AI!

Hãy cùng nhau xây dựng tương lai
của AI!