Ultralytics YOLO11 đã ra mắt! Định nghĩa lại những gì có thể trong AI!

Abirami Vina

5 phút đọc

Ngày 27 tháng 9 năm 2024

Tìm hiểu tất cả về các tính năng đột phá của Ultralytics YOLO11, mô hình AI mới nhất của chúng tôi, định nghĩa lại tầm nhìn máy tính với độ chính xác và hiệu quả vô song.

Chúng tôi rất vui mừng được giới thiệu sự phát triển tiếp theo của các mô hình Ultralytics : YOLO11! Dựa trên những tiến bộ ấn tượng của các phiên bản mô hình YOLO trước đó, YOLO11 mang đến một loạt các tính năng và tối ưu hóa mạnh mẽ giúp mô hình này nhanh hơn, chính xác hơn và cực kỳ linh hoạt. Được công bố tại sự kiện YOLO Vision 2024 (YV24) , cuộc họp thường niên kết hợp giữa các chuyên gia, nhà đổi mới và nhà phát triển AI của Ultralytics, sự bổ sung mới nhất này cho gia đình Ultralytics được thiết lập để định nghĩa lại những gì có thể với thị giác máy tính

Với kiến trúc cải tiến, YOLO11 có thể được sử dụng cho nhiều tác vụ thị giác máy tính khác nhau, từ phát hiện đối tượng theo thời gian thực đến phân loại, khiến nó trở thành một công cụ thay đổi cuộc chơi cho cả nhà phát triển và nhà nghiên cứu. Những cải tiến chính bao gồm trích xuất tính năng nâng cao để nắm bắt chi tiết chính xác hơn, độ chính xác cao hơn với ít tham số hơn và tốc độ xử lý nhanh hơn giúp cải thiện đáng kể hiệu suất theo thời gian thực. Trong bài viết này, chúng ta sẽ xem xét kỹ hơn các tính năng khiến YOLO11 trở nên nổi bật và cách nó có thể biến đổi các ứng dụng thị giác máy tính của bạn. Hãy bắt đầu nào!

__wf_reserved_thừa kế
Hình 1. Glenn Jocher trên sân khấu, công bố YOLO11 tại YOLO Vision 24.

Làm quen với YOLO11

YOLO11 đánh dấu một chương mới cho gia đình YOLO, cung cấp một mô hình có khả năng và linh hoạt hơn, đưa tầm nhìn máy tính lên một tầm cao mới. Với kiến trúc tinh tế và khả năng nâng cao, mô hình hỗ trợ các tác vụ tầm nhìn máy tính như ước tính tư thế và phân đoạn trường hợp mà cộng đồng Vision AI yêu thích ở Ultralytics YOLOv8 , nhưng với hiệu suất và độ chính xác thậm chí còn cao hơn. Glenn Jocher , Nhà sáng lập kiêm Tổng giám đốc điều hành của Ultralytics, chia sẻ: “Với YOLO11, chúng tôi đặt mục tiêu phát triển một mô hình vừa mạnh mẽ vừa thiết thực cho các ứng dụng trong thế giới thực. Hiệu quả và độ chính xác được cải thiện của nó khiến nó trở thành một công cụ mạnh mẽ có thể thích ứng với những thách thức độc đáo mà nhiều ngành công nghiệp khác nhau phải đối mặt. Tôi rất mong chờ xem cộng đồng Vision AI sử dụng YOLO11 để tạo ra các giải pháp sáng tạo và đưa tầm nhìn máy tính lên một tầm cao mới như thế nào”.

__wf_reserved_thừa kế
Hình 2. Glenn Jocher trên sân khấu, giới thiệu YOLO11 tại YV24.

Sau đây là cái nhìn tổng quan về các tác vụ thị giác máy tính mà YOLO11 hỗ trợ:

__wf_reserved_thừa kế
Hình 3. Nhiệm vụ thị giác máy tính được hỗ trợ bởi YOLO11.

Điều gì làm YOLO11 khác biệt?

YOLO11 xây dựng dựa trên những tiến bộ đã được giới thiệu trong YOLOv9YOLOv10 vào đầu năm nay, kết hợp các thiết kế kiến trúc được cải tiến, các kỹ thuật trích xuất tính năng nâng cao và các phương pháp đào tạo được tối ưu hóa. Điều thực sự làm cho YOLO11 nổi bật là sự kết hợp ấn tượng giữa tốc độ, độ chính xác và hiệu quả, khiến nó trở thành một trong những mô hình có khả năng nhất mà Ultralytics đã tạo ra cho đến nay. Với thiết kế được cải tiến, YOLO11 cung cấp khả năng trích xuất tính năng tốt hơn, đây là quá trình xác định các mẫu và chi tiết quan trọng từ hình ảnh, giúp có thể nắm bắt các khía cạnh phức tạp chính xác hơn, ngay cả trong các tình huống đầy thách thức.

Đáng chú ý, YOLO11m đạt được điểm số Độ chính xác trung bình (mAP) cao hơn trên tập dữ liệu COCO trong khi sử dụng ít hơn 22% tham số so với YOLOv8m , giúp nó nhẹ hơn về mặt tính toán mà không làm giảm hiệu suất. Điều này có nghĩa là nó cung cấp kết quả chính xác hơn trong khi vẫn hiệu quả hơn khi chạy. Trên hết, YOLO11 mang lại tốc độ xử lý nhanh hơn, với thời gian suy luận nhanh hơn khoảng 2% so với YOLOv10, khiến nó trở nên lý tưởng cho các ứng dụng thời gian thực. 

__wf_reserved_thừa kế
Hình 4. Sử dụng YOLO11 để phát hiện đối tượng.

Nó được xây dựng để xử lý các tác vụ phức tạp trong khi vẫn tiết kiệm tài nguyên và được thiết kế để cải thiện hiệu suất của các mô hình quy mô lớn, khiến nó trở nên phù hợp tuyệt vời cho các dự án AI đòi hỏi cao. Các cải tiến đối với đường ống tăng cường cũng đã cải thiện quy trình đào tạo, giúp YOLO11 dễ dàng thích ứng với các tác vụ khác nhau, cho dù bạn đang làm việc trên các dự án nhỏ hay các ứng dụng quy mô lớn. 

Trên thực tế, YOLO11 có hiệu suất xử lý cao và hoàn toàn phù hợp để triển khai trên cả thiết bị đám mây và thiết bị biên, đảm bảo tính linh hoạt trên nhiều môi trường khác nhau. Nói một cách đơn giản, YOLO11 không chỉ là bản nâng cấp; mà là mô hình chính xác hơn, hiệu quả hơn và linh hoạt hơn đáng kể, được trang bị tốt hơn để xử lý mọi thách thức về thị giác máy tính. Cho dù đó là lái xe tự động , giám sát , hình ảnh chăm sóc sức khỏe , bán lẻ thông minh hay các trường hợp sử dụng công nghiệp , YOLO11 đủ linh hoạt để đáp ứng hầu hết mọi ứng dụng thị giác máy tính.

YOLO11 đã sẵn sàng cho hệ thống và nền tảng của bạn

YOLO11 được thiết kế để tích hợp liền mạch với các hệ thống và nền tảng bạn đang sử dụng. Dựa trên sự hỗ trợ được cung cấp bởi YOLOv8 , YOLO11 tương thích với nhiều môi trường khác nhau để đào tạo , thử nghiệmtriển khai . Cho dù bạn đang làm việc với GPU NVIDIA , thiết bị biên hay triển khai trên nền tảng đám mây , YOLO11 đều được tối ưu hóa để phù hợp với quy trình làm việc của bạn một cách dễ dàng.

Những tích hợp này là tiện ích bổ sung tuyệt vời giúp YOLO11 có thể thích ứng với nhiều ngành công nghiệp khác nhau, giúp các doanh nghiệp dễ dàng triển khai mô hình trong các quy trình hiện có của họ. Ví dụ, giả sử bạn muốn sử dụng YOLO11 cho nông nghiệp , cụ thể là để theo dõi mùa màng . Bạn có thể cần triển khai mô hình trên máy bay không người lái để xác định các vấn đề về sức khỏe thực vật theo thời gian thực trên các cánh đồng rộng lớn. Tuy nhiên, nếu bạn làm trong lĩnh vực an ninh, bạn có thể thích sử dụng YOLO11 với hệ thống dựa trên đám mây để theo dõi nhiều nguồn cấp dữ liệu camera để phát hiện đối tượng .

__wf_reserved_thừa kế
Hình 5. Sử dụng YOLO11 trong nông nghiệp.

Trao quyền cho cộng đồng AI với YOLO11

Cộng đồng AI tầm nhìn có thể mong đợi những tiến bộ thú vị với sự ra mắt của YOLO11. Nhờ độ chính xác và hiệu quả được cải thiện, mô hình mới này có tiềm năng chuyển đổi các ứng dụng hiện có và tạo ra các ứng dụng mới. Một yếu tố chính trong tiến trình này là Ultralytics HUB . Ultralytics HUB là một nền tảng thân thiện với người dùng giúp đơn giản hóa việc đào tạo và triển khai các mô hình YOLO, bao gồm YOLO11. 

__wf_reserved_thừa kế
Hình 6. Chạy suy luận YOLO11 trên Ultralytics HUB.

Ultralytics HUB hợp lý hóa quy trình phát triển bằng cách cho phép người dùng tải lên các tập dữ liệu, truy cập vào một loạt các mô hình được đào tạo trước và quản lý các dự án của họ ở một nơi. HUB cũng hỗ trợ cộng tác, giúp các nhóm dễ dàng làm việc cùng nhau trong các dự án AI. Sau đây là một số tính năng chính khác của Ultralytics HUB:

  • Đào tạo đám mây : Ultralytics HUB cung cấp đào tạo mô hình đám mây liền mạch để có khả năng mở rộng và hiệu quả.
  • Các mô hình được đào tạo trước : Nền tảng này cung cấp quyền truy cập vào nhiều mô hình YOLOv5, YOLOv8 và YOLO11 đã được đào tạo trước.
  • Xuất mô hình : Các mô hình đã được đào tạo có thể được xuất sang nhiều định dạng khác nhau để triển khai.
  • Tích hợp : Ultralytics HUB tích hợp liền mạch với các nền tảng như Roboflow, Google Colab và Weights & Biases.
  • Tài liệu chi tiết : Ultralytics HUB cung cấp hướng dẫn toàn diện và câu hỏi thường gặp để hỗ trợ người dùng.
  • Hỗ trợ cộng đồng : Cộng đồng Discord luôn sẵn sàng giải đáp thắc mắc và thảo luận.

Với thiết kế trực quan của HUB, cả nhà phát triển có kinh nghiệm và người mới đều có thể nhanh chóng bắt đầu. Khi ngày càng nhiều nhà phát triển sử dụng YOLO11 thông qua HUB, chúng ta có thể mong đợi sự gia tăng các ứng dụng hiệu suất cao, mở rộng ranh giới của thị giác máy tính và định hình tương lai của công nghệ AI.

Thực hành cùng YOLO11

Giống như YOLOv8, YOLO11 sẽ sớm có sẵn để dùng thử thông qua Ultralytics HUBgói Ultralytics Python . Bạn có thể đăng nhập vào HUB hoặc xem hướng dẫn bắt đầu nhanh của chúng tôi để biết hướng dẫn từng bước về cách cài đặt gói. Sau khi phát hành, bạn sẽ có thể khám phá các tính năng của nó, thử nghiệm với các tập dữ liệu khác nhau và xem YOLO11 hoạt động như thế nào trong nhiều tình huống khác nhau. Chúng tôi rất mong được thấy cộng đồng AI tham gia vào YOLO11 và đóng góp vào quá trình phát triển, cung cấp phản hồi hoặc xây dựng dựa trên nó.

Cho dù bạn là nhà phát triển đang tìm cách tối ưu hóa các dự án hiện có hay là người quan tâm đến việc tạo ra các ứng dụng mới, sự tham gia của bạn có thể giúp thúc đẩy sự đổi mới. Tham gia thảo luận, chia sẻ kinh nghiệm của bạn và cộng tác với những người khác để khai thác hết tiềm năng của YOLO11. Chúng tôi rất mong chờ xem bạn sử dụng YOLO11 để giải quyết những thách thức trong thế giới thực và biến những ý tưởng sáng tạo của mình thành hiện thực như thế nào!

Một chương mới bắt đầu với YOLO11

YOLO11 là bước tiến tiếp theo trong thị giác máy tính, kết hợp độ chính xác, tốc độ và hiệu quả ấn tượng. Được công bố tại YV24, các tính năng tiên tiến của nó làm cho nó trở nên linh hoạt cho nhiều ứng dụng thời gian thực, từ xe tự hành đến các giải pháp bán lẻ thông minh. Khi cộng đồng AI bắt đầu khám phá và sử dụng mô hình này, chúng tôi rất vui mừng khi thấy những cách sáng tạo mà YOLO11 sẽ thúc đẩy sự đổi mới và mang lại những khả năng mới cho cuộc sống. Nếu bạn đang muốn khám phá những tiến bộ mới nhất trong AI, hãy thử YOLO11 và xem cách nó có thể nâng cao các dự án thị giác máy tính của bạn!

Để tìm hiểu thêm về AI, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng năng động của chúng tôi . Khám phá cách AI đang đạt được những bước tiến trong các lĩnh vực như chăm sóc sức khỏenông nghiệp .

Hãy cùng xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của máy học

Bắt đầu miễn phí
Liên kết đã được sao chép vào clipboard