Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Tất cả những gì bạn cần biết về Ultralytics YOLO11 và các ứng dụng của nó

Abirami Vina

4 phút đọc

Ngày 4 tháng 10 năm 2024

Tìm hiểu tất cả về mô hình Ultralytics YOLO11 mới, các tính năng của nó và các ứng dụng thời gian thực trong các ngành khác nhau. Chúng tôi sẽ hướng dẫn bạn mọi thứ bạn cần biết.

Vào Thứ Hai, ngày 30 tháng 9, Ultralytics chính thức ra mắt Ultralytics YOLO11, một bước tiến mới nhất trong lĩnh vực thị giác máy tính, sau khi ra mắt tại YOLO Vision 2024 (YV24), sự kiện kết hợp hàng năm của Ultralytics. Cộng đồng AI đang xôn xao với sự phấn khích khi họ đổ xô đi khám phá các khả năng của mô hình. Với khả năng xử lý nhanh hơn, độ chính xác cao hơn và các mô hình được tối ưu hóa cho cả thiết bị biên và triển khai trên đám mây, YOLO11 định nghĩa lại những gì có thể trong các ứng dụng thị giác máy tính theo thời gian thực.

Trong một cuộc phỏng vấn, Người sáng lập kiêm Giám đốc điều hành của Ultralytics, Glenn Jocher đã chia sẻ, "Thế giới đang hướng tới năng lượng sạch, nhưng không đủ nhanh. Chúng tôi muốn các mô hình của mình có thể được huấn luyện trong ít epochs hơn, với ít dữ liệu tăng cường và ít dữ liệu hơn, vì vậy chúng tôi đang nỗ lực thực hiện điều đó. Mô hình phát hiện đối tượng nhỏ nhất, YOLO11n, chỉ có 2,6 triệu tham số - có kích thước bằng một tệp JPEG, điều này thực sự điên rồ. Mô hình phát hiện đối tượng lớn nhất, YOLO11x, có khoảng 56 triệu tham số và ngay cả con số đó cũng cực kỳ nhỏ so với các mô hình khác. Bạn có thể huấn luyện chúng trên một GPU giá rẻ, như GPU Nvidia năm năm tuổi, chỉ với một chút hứng thú và một chút cà phê."

Trong bài viết này, chúng ta sẽ xem xét kỹ hơn YOLO11, khám phá các tính năng, cải tiến, điểm chuẩn hiệu suất và các ứng dụng thực tế của nó để giúp bạn hiểu những gì mô hình này có thể làm. Hãy cùng bắt đầu!

Tìm hiểu về YOLO11: Các cải tiến so với các phiên bản trước

YOLO11 là một bước tiến mới nhất trong chuỗi mô hình thị giác máy tính YOLO (You Only Look Once), và nó cung cấp những cải tiến đáng kể so với các phiên bản trước như YOLOv5YOLOv8. Nhóm nghiên cứu tại Ultralytics đã kết hợp phản hồi từ cộng đồng và các nghiên cứu tiên tiến để làm cho YOLO11 nhanh hơn, chính xác hơn và hiệu quả hơn. YOLO11 cũng hỗ trợ các tác vụ thị giác máy tính tương tự như YOLOv8, bao gồm phát hiện đối tượng, phân vùng thực thểphân loại ảnh. Trên thực tế, người dùng có thể dễ dàng chuyển sang YOLO11 mà không cần thay đổi quy trình làm việc hiện có.

Một trong những điểm nổi bật chính của YOLO11 là hiệu suất vượt trội về cả độ chính xác và tốc độ so với các phiên bản tiền nhiệm. Với số lượng tham số ít hơn 22% so với YOLOv8m, YOLO11m đạt được độ chính xác trung bình (mAP) cao hơn trên tập dữ liệu COCO, có nghĩa là nó có thể phát hiện các đối tượng chính xác và hiệu quả hơn. Về tốc độ xử lý, YOLO11 vượt trội hơn các mô hình trước đó, khiến nó trở nên lý tưởng cho các ứng dụng thời gian thực, nơi phát hiện và phản hồi nhanh chóng là rất quan trọng và mỗi mili giây đều có giá trị.

Đồ thị điểm chuẩn bên dưới minh họa cách YOLO11 nổi bật so với các mô hình trước đây. Trên trục hoành, nó hiển thị COCO Box Average Precision (AP), đo lường độ chính xác của phát hiện đối tượng. Trục tung hiển thị độ trễ bằng cách sử dụng TensorRT10 FP16 trên NVIDIA T4 GPU, cho biết tốc độ mô hình xử lý dữ liệu. 

__wf_reserved_inherit
Hình 1. YOLO11 cung cấp khả năng object detection theo thời gian thực tiên tiến nhất.

Ra mắt mô hình YOLO11: Các tùy chọn mã nguồn mở và doanh nghiệp

Với sự ra mắt của Ultralytics YOLO11, Ultralytics đang mở rộng dòng YOLO bằng cách cung cấp cả mô hình mã nguồn mởdoanh nghiệp để đáp ứng nhu cầu ngày càng tăng trong các ngành công nghiệp.

__wf_reserved_inherit
Hình 2. Với việc ra mắt này, Ultralytics cung cấp 30 mô hình mới.

YOLO11 có năm kích thước mô hình riêng biệt - Nano, Small, Medium, Large và X. Người dùng có thể chọn mô hình tốt nhất tùy thuộc vào nhu cầu cụ thể của ứng dụng thị giác máy tính của họ. Năm kích thước này mang lại sự linh hoạt trong các tác vụ như phân loại hình ảnh, phát hiện đối tượng, phân đoạn thể hiện, theo dõi, ước tính tư thếphát hiện đối tượng bằng hộp giới hạn định hướng (OBB). Đối với mỗi kích thước, có một mô hình có sẵn cho mỗi tác vụ, dẫn đến tổng cộng 25 mô hình mã nguồn mở tạo thành cốt lõi trong các sản phẩm của Ultralytics. Các mô hình này lý tưởng cho một loạt các ứng dụng, từ các tác vụ nhẹ trên các thiết bị biên, nơi mô hình YOLO11n mang lại hiệu quả ấn tượng, đến các ứng dụng quy mô lớn hơn đòi hỏi các mô hình YOLO11l và YOLO11x.

Lần đầu tiên, Ultralytics giới thiệu các mô hình doanh nghiệp, đánh dấu một cột mốc quan trọng trong các sản phẩm của chúng tôi và chúng tôi rất vui mừng được chia sẻ những đổi mới mới này với người dùng của mình. YOLO11 giới thiệu năm mô hình độc quyền được thiết kế đặc biệt cho các trường hợp sử dụng thương mại. Các mô hình doanh nghiệp này, sẽ có sẵn vào tháng tới, được đào tạo trên bộ dữ liệu độc quyền mới của Ultralytics, bao gồm hơn 1 triệu hình ảnh, cung cấp các mô hình được đào tạo trước mạnh mẽ hơn. Chúng được thiết kế cho các ứng dụng thực tế, đòi hỏi khắt khe, chẳng hạn như phân tích hình ảnh y tếxử lý ảnh vệ tinh, nơi phát hiện đối tượng chính xác là rất quan trọng.

Tìm hiểu các tính năng YOLO11 thế hệ tiếp theo

Sau khi thảo luận về những gì YOLO11 cung cấp, hãy xem điều gì làm cho YOLO11 trở nên đặc biệt.

Một trong những thách thức chính trong việc phát triển YOLO11 là tìm ra sự cân bằng phù hợp giữa các ưu tiên cạnh tranh: làm cho các mô hình nhỏ hơn, nhanh hơn và chính xác hơn. Như Glenn Jocher, Người sáng lập kiêm Giám đốc điều hành của Ultralytics, đã giải thích, "Làm việc về nghiên cứu và phát triển YOLO thực sự là một thách thức vì bạn muốn đi theo ba hướng khác nhau: bạn muốn làm cho các mô hình nhỏ hơn, bạn muốn chúng chính xác hơn, nhưng bạn cũng muốn chúng nhanh hơn trên các nền tảng khác nhau như CPU và GPU. Tất cả những điều này đều là những mối quan tâm cạnh tranh, vì vậy bạn phải thỏa hiệp và chọn nơi để thực hiện các thay đổi." Bất chấp những thách thức này, YOLO11 đạt được sự cân bằng ấn tượng, mang lại cả tốc độ và cải thiện độ chính xác so với các phiên bản trước như YOLOv8.

__wf_reserved_inherit
Hình 3. Một ví dụ về sử dụng YOLO11 để phát hiện đối tượng.

YOLO11 mang lại những cải tiến đáng kể như trích xuất đặc trưng được cải thiện với kiến trúc backbone và neck được thiết kế lại, dẫn đến khả năng phát hiện đối tượng chính xác hơn. Mô hình này cũng được tối ưu hóa về tốc độ và hiệu quả, mang lại thời gian xử lý nhanh hơn trong khi vẫn duy trì độ chính xác cao. Bên cạnh những lợi ích này, YOLO11 có khả năng thích ứng cao trên các môi trường khác nhau, hoạt động liền mạch trên các thiết bị biên, nền tảng đám mây và hệ thống sử dụng GPU NVIDIA. Khả năng thích ứng này làm cho nó trở thành một lựa chọn lý tưởng cho những người dùng cần các tùy chọn triển khai linh hoạt trên nhiều cấu hình phần cứng khác nhau, từ thiết bị di động đến máy chủ quy mô lớn.

Các ứng dụng YOLO11 theo thời gian thực

Tính linh hoạt của YOLO11 làm cho nó trở thành một công cụ đáng tin cậy trong nhiều ngành công nghiệp, đặc biệt là khi xử lý các trường hợp sử dụng phức tạp. Ví dụ: nó hoạt động liền mạch trên các thiết bị biên và có thể được sử dụng cho các ứng dụng yêu cầu phân tích theo thời gian thực trong môi trường có sức mạnh tính toán hạn chế. Một ví dụ tuyệt vời về điều này là lái xe tự động, nơi xe cần đưa ra quyết định trong tích tắc để giữ an toàn cho mọi người. YOLO11 giúp phát hiện và phân tích các vật thể trên đường, như người đi bộ hoặc các xe khác, ngay cả trong điều kiện khó khăn như ánh sáng yếu hoặc khi mọi thứ bị che khuất một phần. Phát hiện nhanh chóng và chính xác giúp ngăn ngừa tai nạn và đảm bảo xe tự lái có thể di chuyển an toàn.

__wf_reserved_inherit
Hình 4. Glenn Jocher trên sân khấu tại YV24, nói về các ứng dụng của YOLO11.

Một ví dụ thú vị khác về phạm vi của YOLO11 là khả năng xử lý hộp giới hạn hướng (OBB). Nó rất cần thiết để phát hiện các đối tượng không được căn chỉnh hoàn hảo. Phát hiện đối tượng OBB là một tính năng đặc biệt hữu ích trong các ngành như nông nghiệp, lập bản đồgiám sát, nơi hình ảnh thường chứa các đối tượng xoay như cây trồng hoặc tòa nhà trong ảnh chụp từ trên không hoặc vệ tinh. Không giống như các mô hình truyền thống, YOLO11 có thể xác định các đối tượng ở mọi góc độ và cung cấp kết quả chính xác hơn nhiều cho các tác vụ yêu cầu độ chính xác.

YOLO11 cho nhà phát triển AI: Hãy tự mình thử nghiệm

Bắt đầu với YOLO11 rất đơn giản và dễ dàng, cho dù bạn thích viết code hay tùy chọn không cần code. Để làm việc với YOLO11 thông qua code, bạn có thể sử dụng gói Ultralytics Python để dễ dàng huấn luyện và triển khai các mô hình. Nếu bạn thích phương pháp không cần code, Ultralytics HUB cho phép bạn dùng thử YOLO11 chỉ với một vài cú nhấp chuột.

Hướng dẫn chi tiết về code YOLO11

Để sử dụng YOLO11 với Python, trước tiên bạn cần cài đặt gói Ultralytics. Tùy thuộc vào sở thích của bạn, bạn có thể thực hiện việc này bằng pip, conda hoặc Docker. Để biết hướng dẫn chi tiết và các phương pháp hay nhất liên quan đến quy trình cài đặt, hãy nhớ xem Hướng dẫn Cài đặt Ultralytics của chúng tôi. Trong khi cài đặt các gói cần thiết cho YOLO11, nếu bạn gặp bất kỳ khó khăn nào, hãy tham khảo Hướng dẫn Các Vấn đề Thường gặp của chúng tôi để biết các giải pháp và mẹo.

Sau khi bạn đã cài đặt gói Ultralytics, việc sử dụng YOLO11 rất đơn giản. Đoạn mã sau đây sẽ hướng dẫn bạn quy trình tải mô hình, huấn luyện nó, kiểm tra hiệu suất của nóxuất nó sang định dạng ONNX. Để biết thêm các ví dụ chuyên sâu và cách sử dụng nâng cao, hãy tham khảo tài liệu chính thức của Ultralytics, nơi bạn sẽ tìm thấy hướng dẫn chi tiết và các phương pháp hay nhất để khai thác tối đa YOLO11.

__wf_reserved_inherit
Hình 5. Sử dụng YOLO11 thông qua gói Ultralytics. 

Đối với những người dùng thích cách tiếp cận không cần mã, Ultralytics HUB cung cấp một cách dễ dàng để đào tạo và triển khai các mô hình YOLO11 chỉ với một vài cú nhấp chuột. Để bắt đầu với HUB, chỉ cần tạo một tài khoản trên nền tảng Ultralytics HUB và bạn có thể bắt đầu đào tạo và quản lý các mô hình của mình thông qua một giao diện trực quan.

YOLO11: Định hình tương lai của thị giác AI

Cộng đồng AI không ngừng nâng cao lĩnh vực thị giác máy tính bằng cách nỗ lực phát triển các mô hình nhanh hơn, chính xác hơn cho các ứng dụng thực tế. Ultralytics YOLO11 là một cột mốc quan trọng trong nỗ lực này, mang lại tốc độ, độ chính xác và tính linh hoạt được cải thiện. Nó được thiết kế cho các ứng dụng thời gian thực và biên, làm cho nó lý tưởng cho các ngành như chăm sóc sức khỏe và lái xe tự động. Cho dù bạn đang sử dụng gói Ultralytics Python hay Ultralytics Hub không cần mã, YOLO11 đơn giản hóa các tác vụ Vision AI phức tạp. Nó cung cấp các khả năng thị giác máy tính mạnh mẽ, làm cho nó trở thành một lựa chọn tuyệt vời cho các nhà phát triển và doanh nghiệp.

Xem kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng năng động của chúng tôi để tìm hiểu thêm về AI. Khám phá cách Vision AI đang thúc đẩy sự đổi mới trong các lĩnh vực như chăm sóc sức khỏenông nghiệp.

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard