Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Tìm hiểu tất cả về mô hình Ultralytics YOLO11 mới, các tính năng và ứng dụng thời gian thực trong nhiều ngành công nghiệp khác nhau. Chúng tôi sẽ hướng dẫn bạn mọi thứ bạn cần biết.
Vào thứ Hai, ngày 30 tháng 9, Ultralytics chính thức ra mắt Ultralytics YOLO11 , tiến bộ mới nhất trong lĩnh vực thị giác máy tính , sau lần ra mắt tại YOLO Vision 2024 (YV24) , sự kiện kết hợp thường niên của Ultralytics. Cộng đồng AI đã rất phấn khích khi họ vội vã khám phá các khả năng của mô hình. Với tốc độ xử lý nhanh hơn, độ chính xác cao hơn và các mô hình được tối ưu hóa cho cả thiết bị biên và triển khai đám mây, YOLO11 định nghĩa lại những gì có thể trong các ứng dụng thị giác máy tính thời gian thực.
Trong một cuộc phỏng vấn , Nhà sáng lập và Tổng giám đốc điều hành của Ultralytics Glenn Jocher đã chia sẻ, “Thế giới đang hướng tới năng lượng sạch , nhưng không đủ nhanh. Chúng tôi muốn các mô hình của mình có thể đào tạo được trong ít kỷ nguyên hơn, với ít sự gia tăng và ít dữ liệu hơn, vì vậy chúng tôi đang nỗ lực hết mình cho điều đó. Mô hình phát hiện vật thể nhỏ nhất, YOLO11n , chỉ có 2,6 triệu tham số - khoảng bằng kích thước của một tệp JPEG, điều này thực sự điên rồ. Mô hình phát hiện vật thể lớn nhất, YOLO11x, có khoảng 56 triệu tham số và thậm chí con số đó vẫn cực kỳ nhỏ so với các mô hình khác. Bạn có thể đào tạo chúng trên một GPU giá rẻ, như GPU Nvidia năm năm tuổi, chỉ với một chút phấn khích và một chút cà phê."
Trong bài viết này, chúng ta sẽ xem xét kỹ hơn YOLO11, khám phá các tính năng, cải tiến, chuẩn hiệu suất và ứng dụng thực tế để giúp bạn hiểu được mô hình này có thể làm được gì. Hãy bắt đầu nào!
Hiểu về YOLO11: Những cải tiến so với các phiên bản trước
YOLO11 là tiến bộ mới nhất trong loạt mô hình thị giác máy tính YOLO (You Only Look Once) và cung cấp những cải tiến đáng kể so với các phiên bản trước như YOLOv5 và YOLOv8 . Nhóm tại Ultralytics đã kết hợp phản hồi của cộng đồng và nghiên cứu tiên tiến để làm cho YOLO11 nhanh hơn, chính xác hơn và hiệu quả hơn. YOLO11 cũng hỗ trợ các tác vụ thị giác máy tính giống như YOLOv8, bao gồm phát hiện đối tượng , phân đoạn thể hiện và phân loại hình ảnh . Trên thực tế, người dùng có thể dễ dàng chuyển sang YOLO11 mà không cần phải thay đổi quy trình làm việc hiện có.
Một trong những điểm nổi bật chính của YOLO11 là hiệu suất vượt trội về cả độ chính xác và tốc độ so với các phiên bản trước. Với ít hơn 22% tham số so với YOLOv8m, YOLO11m đạt được độ chính xác trung bình (mAP) cao hơn trên tập dữ liệu COCO , nghĩa là nó có thể phát hiện các đối tượng chính xác và hiệu quả hơn. Về tốc độ xử lý, YOLO11 vượt trội hơn các mô hình trước đó, khiến nó trở nên lý tưởng cho các ứng dụng thời gian thực, nơi phát hiện và phản hồi nhanh là rất quan trọng và mỗi mili giây đều có giá trị.
Biểu đồ chuẩn bên dưới minh họa cách YOLO11 nổi bật so với các mô hình trước đó. Trên trục ngang, nó hiển thị Độ chính xác trung bình (AP) của COCO Box , đo độ chính xác của việc phát hiện đối tượng. Trục dọc hiển thị độ trễ bằng TensorRT10 FP16 trên GPU NVIDIA T4 , cho biết mô hình xử lý dữ liệu nhanh như thế nào.
Hình 1. YOLO11 cung cấp khả năng phát hiện đối tượng theo thời gian thực hiện đại.
Ra mắt mô hình YOLO11: Tùy chọn mã nguồn mở và doanh nghiệp
Lần đầu tiên, Ultralytics giới thiệu các mô hình doanh nghiệp , đánh dấu một cột mốc quan trọng trong các sản phẩm của chúng tôi và chúng tôi rất vui mừng được chia sẻ những cải tiến mới này với người dùng. YOLO11 giới thiệu năm mô hình độc quyền được thiết kế riêng cho các trường hợp sử dụng thương mại. Các mô hình doanh nghiệp này, sẽ có vào tháng tới, được đào tạo trên bộ dữ liệu độc quyền mới của Ultralytics, bao gồm hơn 1 triệu hình ảnh, cung cấp các mô hình được đào tạo trước mạnh mẽ hơn. Chúng được thiết kế cho các ứng dụng thực tế, đòi hỏi khắt khe , chẳng hạn như phân tích hình ảnh y tế và xử lý hình ảnh vệ tinh , trong đó phát hiện đối tượng chính xác là rất quan trọng.
Khám phá các tính năng YOLO11 thế hệ tiếp theo
Sau khi thảo luận về những gì YOLO11 cung cấp, hãy cùng xem điều gì làm cho YOLO11 trở nên đặc biệt.
Một trong những thách thức chính trong quá trình phát triển YOLO11 là tìm ra sự cân bằng phù hợp giữa các ưu tiên cạnh tranh: làm cho các mô hình nhỏ hơn, nhanh hơn và chính xác hơn. Như Glenn Jocher, Nhà sáng lập kiêm Tổng giám đốc điều hành của Ultralytics, giải thích, “ Làm việc trên nghiên cứu và phát triển YOLO thực sự là một thách thức vì bạn muốn đi theo ba hướng khác nhau: bạn muốn làm cho các mô hình nhỏ hơn, bạn muốn chúng chính xác hơn, nhưng bạn cũng muốn chúng nhanh hơn trên các nền tảng khác nhau như CPU và GPU. Tất cả những điều này đều là những lợi ích cạnh tranh, vì vậy bạn phải thỏa hiệp và chọn nơi để thực hiện thay đổi.” Bất chấp những thách thức này, YOLO11 đạt được sự cân bằng ấn tượng, mang lại cả cải tiến về tốc độ và độ chính xác so với các phiên bản trước như YOLOv8.
Hình 3. Ví dụ về việc sử dụng YOLO11 để phát hiện đối tượng.
YOLO11 mang đến những cải tiến đáng kể như cải thiện khả năng trích xuất tính năng với kiến trúc xương sống và cổ được thiết kế lại, dẫn đến khả năng phát hiện đối tượng chính xác hơn. Mô hình này cũng được tối ưu hóa về tốc độ và hiệu quả, cung cấp thời gian xử lý nhanh hơn trong khi vẫn duy trì độ chính xác cao. Ngoài những lợi ích này, YOLO11 có khả năng thích ứng cao trên nhiều môi trường khác nhau, hoạt động liền mạch trên các thiết bị biên, nền tảng đám mây và hệ thống sử dụng GPU NVIDIA. Khả năng thích ứng này khiến nó trở thành lựa chọn lý tưởng cho những người dùng cần các tùy chọn triển khai linh hoạt trên nhiều thiết lập phần cứng khác nhau, từ thiết bị di động đến máy chủ quy mô lớn.
Ứng dụng YOLO11 thời gian thực
Tính linh hoạt của YOLO11 khiến nó trở thành một công cụ đáng tin cậy trong nhiều ngành, đặc biệt là khi xử lý các trường hợp sử dụng phức tạp . Ví dụ, nó hoạt động liền mạch trên các thiết bị biên và có thể được sử dụng cho các ứng dụng yêu cầu phân tích thời gian thực trong môi trường có công suất tính toán hạn chế. Một ví dụ tuyệt vời về điều này là lái xe tự động , khi các phương tiện cần đưa ra quyết định trong tích tắc để đảm bảo an toàn cho mọi người. YOLO11 giúp phát hiện và phân tích các vật thể trên đường , như người đi bộ hoặc các xe khác, ngay cả trong điều kiện khắc nghiệt như ánh sáng yếu hoặc khi mọi thứ bị ẩn một phần. Phát hiện nhanh chóng và chính xác giúp ngăn ngừa tai nạn và đảm bảo xe tự lái có thể điều hướng an toàn .
Hình 4. Glenn Jocher trên sân khấu tại YV24, đang nói về các ứng dụng YOLO11.
Một ví dụ thú vị khác về phạm vi của YOLO11 là khả năng xử lý các hộp giới hạn định hướng (OBB) . Tính năng này rất cần thiết để phát hiện các vật thể không được căn chỉnh hoàn hảo. Phát hiện vật thể OBB là một tính năng đặc biệt hữu ích trong các ngành như nông nghiệp , lập bản đồ và giám sát , trong đó hình ảnh thường chứa các vật thể xoay như cây trồng hoặc tòa nhà trong ảnh hàng không hoặc vệ tinh. Không giống như các mô hình truyền thống, YOLO11 có thể xác định các vật thể ở mọi góc độ và cung cấp kết quả chính xác hơn nhiều cho các tác vụ đòi hỏi độ chính xác.
YOLO11 dành cho các nhà phát triển AI: Hãy tự mình thử nghiệm
Bắt đầu với YOLO11 rất đơn giản và dễ tiếp cận, cho dù bạn thích mã hóa hay tùy chọn không cần mã hóa. Để làm việc với YOLO11 thông qua mã hóa, bạn có thể sử dụng gói Ultralytics Python để dễ dàng đào tạo và triển khai các mô hình. Nếu bạn thích phương pháp không cần mã hóa, Ultralytics HUB cho phép bạn dùng thử YOLO11 chỉ bằng vài cú nhấp chuột.
Hướng dẫn sử dụng mã YOLO11
Để sử dụng YOLO11 với Python, trước tiên bạn cần cài đặt gói Ultralytics. Tùy thuộc vào sở thích của bạn, bạn có thể thực hiện việc này bằng pip, conda hoặc Docker. Để biết hướng dẫn chi tiết và các biện pháp thực hành tốt nhất liên quan đến quy trình cài đặt, hãy nhớ kiểm tra Hướng dẫn cài đặt Ultralytics của chúng tôi. Trong khi cài đặt các gói bắt buộc cho YOLO11, nếu bạn gặp bất kỳ khó khăn nào, hãy tham khảo Hướng dẫn sự cố thường gặp của chúng tôi để biết các giải pháp và mẹo.
Đối với người dùng thích cách tiếp cận không cần mã, Ultralytics HUB cung cấp một cách dễ dàng để đào tạo và triển khai các mô hình YOLO11 chỉ bằng một vài cú nhấp chuột. Để bắt đầu với HUB , chỉ cần tạo một tài khoản trên nền tảng Ultralytics HUB và bạn có thể bắt đầu đào tạo và quản lý các mô hình của mình thông qua một giao diện trực quan.
YOLO11: Định hình tương lai của AI tầm nhìn
Cộng đồng AI liên tục thúc đẩy lĩnh vực thị giác máy tính bằng cách nỗ lực phát triển các mô hình nhanh hơn, chính xác hơn cho các ứng dụng trong thế giới thực. Ultralytics YOLO11 là một cột mốc quan trọng trong nỗ lực này, mang lại tốc độ, độ chính xác và tính linh hoạt được cải thiện. Nó được thiết kế cho các ứng dụng thời gian thực và biên, khiến nó trở nên lý tưởng cho các ngành như chăm sóc sức khỏe và lái xe tự động. Cho dù bạn đang sử dụng gói Ultralytics Python hay Ultralytics Hub không cần mã, YOLO11 đều đơn giản hóa các tác vụ AI thị giác phức tạp. Nó cung cấp các khả năng thị giác máy tính mạnh mẽ, khiến nó trở thành lựa chọn tuyệt vời cho các nhà phát triển và doanh nghiệp.