Ultralytics YOLO11 : AI thị giác nhanh và chính xác

Vào thứ Hai, ngày 30 tháng 9, Ultralytics chính thức ra mắt Ultralytics YOLO11 , bước tiến mới nhất trong lĩnh vực thị giác máy tính , sau lần ra mắt đầu tiên tại YOLO Vision 2024 (YV24) , Ultralytics 'Sự kiện kết hợp thường niên. Cộng đồng AI đang rất hào hứng khi họ ráo riết khám phá các khả năng của mô hình. Với tốc độ xử lý nhanh hơn, độ chính xác cao hơn và các mô hình được tối ưu hóa cho cả thiết bị biên và triển khai trên nền tảng đám mây, YOLO11 định nghĩa lại những gì có thể làm được trong các ứng dụng thị giác máy tính thời gian thực.

Trong một cuộc phỏng vấn , Ultralytics Nhà sáng lập kiêm CEO Glenn Jocher chia sẻ: “Thế giới đang hướng tới năng lượng sạch , nhưng vẫn chưa đủ nhanh. Chúng tôi muốn các mô hình của mình có thể được huấn luyện trong ít thời gian hơn, với ít phép tăng cường và ít dữ liệu hơn, vì vậy chúng tôi đang nỗ lực hết mình cho điều đó. Mô hình phát hiện vật thể nhỏ nhất, YOLO11n , chỉ có 2,6 triệu tham số - tương đương với kích thước của một file JPEG, một con số thực sự ấn tượng. Mô hình phát hiện vật thể lớn nhất, YOLO11x, có khoảng 56 triệu tham số, và con số đó vẫn cực kỳ nhỏ so với các mô hình khác. Bạn có thể huấn luyện chúng với chi phí thấp GPU , giống như một đứa trẻ năm tuổi Nvidia GPU , chỉ với một chút phấn khích và một chút cà phê."

Trong bài viết này, chúng ta sẽ xem xét kỹ hơn YOLO11 , khám phá các tính năng, cải tiến, điểm chuẩn hiệu suất và ứng dụng thực tế để giúp bạn hiểu rõ hơn về những gì mô hình này có thể làm được. Hãy bắt đầu thôi!

Hiểu biết YOLO11 : Cải tiến so với các phiên bản trước

YOLO11 là tiến bộ mới nhất trong YOLO (Bạn chỉ nhìn một lần) là một loạt các mô hình thị giác máy tính và nó mang lại những cải tiến đáng kể so với các phiên bản trước như YOLOv5 và YOLOv8 . Nhóm tại Ultralytics đã kết hợp phản hồi của cộng đồng và nghiên cứu tiên tiến để tạo ra YOLO11 nhanh hơn, chính xác hơn và hiệu quả hơn. YOLO11 cũng hỗ trợ các tác vụ thị giác máy tính giống như YOLOv8 , bao gồm phát hiện đối tượng , phân đoạn thể hiện và phân loại hình ảnh . Trên thực tế, người dùng có thể dễ dàng chuyển sang YOLO11 mà không cần phải thay đổi quy trình làm việc hiện tại.

Một trong những điểm nổi bật chính của YOLO11 là hiệu suất vượt trội về cả độ chính xác và tốc độ so với các thế hệ trước. Với số lượng thông số ít hơn 22% so với YOLOv8m , YOLO11m đạt được độ chính xác trung bình ( mAP ) cao hơn trên tập dữ liệu COCO , nghĩa là nó có thể detect các đối tượng chính xác và hiệu quả hơn. Về tốc độ xử lý, YOLO11 vượt trội hơn các mô hình trước đó, khiến nó trở nên lý tưởng cho các ứng dụng thời gian thực, nơi phát hiện và phản hồi nhanh chóng là rất quan trọng và từng mili giây đều có giá trị.

Biểu đồ đánh giá chuẩn dưới đây minh họa cách YOLO11 nổi bật so với các mô hình trước đó. Trên trục hoành, nó hiển thị Độ chính xác trung bình ( AP ) của COCO Box , đo lường độ chính xác của việc phát hiện đối tượng. Trục tung hiển thị độ trễ sử dụng TensorRT10 FP16 trên GPU NVIDIA T4 , cho biết tốc độ xử lý dữ liệu của mô hình.

Hình 1. YOLO11 cung cấp khả năng phát hiện đối tượng theo thời gian thực tiên tiến nhất.

‍

YOLO11 ra mắt mô hình: Các tùy chọn nguồn mở và doanh nghiệp

Với sự ra mắt của Ultralytics YOLO11 , Ultralytics đang mở rộng YOLO bằng cách cung cấp cả mô hình nguồn mở và mô hình doanh nghiệp để đáp ứng nhu cầu ngày càng tăng trong nhiều ngành.

Hình 2. Với lần ra mắt này, Ultralytics đang cung cấp 30 mẫu xe mới.

‍

YOLO11 có năm kích thước mô hình riêng biệt - Nano, Nhỏ, Trung bình, Lớn và X. Người dùng có thể chọn mô hình phù hợp nhất tùy theo nhu cầu cụ thể của ứng dụng thị giác máy tính . Năm kích thước này mang lại sự linh hoạt cho các tác vụ như phân loại hình ảnh , phát hiện đối tượng , phân đoạn thực thể , theo dõi , ước tính tư thế và phát hiện đối tượng hộp giới hạn định hướng (OBB) . Với mỗi kích thước, có một mô hình khả dụng cho từng tác vụ, tạo nên tổng cộng 25 mô hình nguồn mở , tạo thành cốt lõi của Ultralytics ' cung cấp. Các mẫu máy này lý tưởng cho nhiều ứng dụng khác nhau, từ các tác vụ nhẹ trên thiết bị biên, nơi mẫu máy YOLO11n mang lại hiệu quả ấn tượng, đến các ứng dụng quy mô lớn hơn yêu cầu mẫu máy YOLO11l và YOLO11x.

Lần đầu tiên, Ultralytics đang giới thiệu các mô hình doanh nghiệp , đánh dấu một cột mốc quan trọng trong các sản phẩm của chúng tôi và chúng tôi rất vui mừng được chia sẻ những cải tiến mới này với người dùng. YOLO11 giới thiệu năm mô hình độc quyền được thiết kế riêng cho các trường hợp sử dụng thương mại. Các mô hình doanh nghiệp này, sẽ có mặt vào tháng tới, được đào tạo về Ultralytics ' Bộ dữ liệu độc quyền mới, bao gồm hơn 1 triệu hình ảnh, cung cấp các mô hình được đào tạo trước mạnh mẽ hơn. Chúng được thiết kế cho các ứng dụng thực tế đòi hỏi khắt khe , chẳng hạn như phân tích hình ảnh y tế và xử lý hình ảnh vệ tinh , trong đó việc phát hiện vật thể chính xác là rất quan trọng.

Khám phá thế hệ tiếp theo YOLO11 đặc trưng

Bây giờ chúng ta đã thảo luận về những gì YOLO11 cung cấp, chúng ta hãy xem xét những gì làm cho YOLO11 thật đặc biệt.

Một trong những thách thức chính trong việc phát triển YOLO11 là tìm ra sự cân bằng phù hợp giữa các ưu tiên cạnh tranh: làm cho các mô hình nhỏ hơn, nhanh hơn và chính xác hơn. Như Glenn Jocher, Ultralytics ' Nhà sáng lập và Giám đốc điều hành giải thích, “ Làm việc về nghiên cứu và phát triển YOLO thực sự là một thách thức vì bạn muốn đi theo ba hướng khác nhau: bạn muốn làm cho các mô hình nhỏ hơn, bạn muốn chúng chính xác hơn, nhưng bạn cũng muốn chúng nhanh hơn trên các nền tảng khác nhau như CPU Và GPU . Tất cả những điều này đều là những lợi ích cạnh tranh, vì vậy bạn phải thỏa hiệp và lựa chọn nơi để thực hiện thay đổi.” Bất chấp những thách thức này, YOLO11 đạt được sự cân bằng ấn tượng, mang lại cả cải tiến về tốc độ và độ chính xác so với các phiên bản trước như YOLOv8 .

Hình 3. Một ví dụ về việc sử dụng YOLO11 để phát hiện đối tượng.

‍

YOLO11 mang đến những cải tiến đáng kể như cải thiện khả năng trích xuất đặc điểm với kiến trúc xương sống và cổ được thiết kế lại, giúp phát hiện đối tượng chính xác hơn. Mô hình cũng được tối ưu hóa về tốc độ và hiệu suất, mang lại thời gian xử lý nhanh hơn mà vẫn duy trì độ chính xác cao. Bên cạnh những lợi ích này, YOLO11 còn có khả năng thích ứng cao trên nhiều môi trường khác nhau, hoạt động liền mạch trên các thiết bị biên, nền tảng đám mây và hệ thống sử dụng NVIDIA GPU. Khả năng thích ứng này khiến nó trở thành lựa chọn lý tưởng cho những người dùng cần các tùy chọn triển khai linh hoạt trên nhiều thiết lập phần cứng khác nhau, từ thiết bị di động đến máy chủ quy mô lớn.

Thời gian thực YOLO11 các ứng dụng

YOLO11 Tính linh hoạt của nó khiến nó trở thành một công cụ đáng tin cậy trong nhiều ngành công nghiệp, đặc biệt là khi xử lý các trường hợp sử dụng phức tạp . Ví dụ, nó hoạt động liền mạch trên các thiết bị biên và có thể được sử dụng cho các ứng dụng yêu cầu phân tích thời gian thực trong môi trường có sức mạnh tính toán hạn chế. Một ví dụ điển hình là xe tự hành , nơi các phương tiện cần đưa ra quyết định trong tích tắc để đảm bảo an toàn cho mọi người. YOLO11 giúp phát hiện và phân tích các vật thể trên đường , chẳng hạn như người đi bộ hoặc xe khác, ngay cả trong điều kiện khó khăn như thiếu sáng hoặc khi vật thể bị che khuất một phần. Khả năng phát hiện nhanh chóng và chính xác giúp ngăn ngừa tai nạn và đảm bảo xe tự lái có thể di chuyển an toàn .

Hình 4. Glenn Jocher trên sân khấu tại YV24, đang nói về YOLO11 ứng dụng.

‍

Một ví dụ thú vị khác của YOLO11 Phạm vi của OBB nằm ở khả năng xử lý các hộp giới hạn định hướng (OBB) . Tính năng này rất cần thiết để phát hiện các vật thể không được căn chỉnh hoàn hảo. Phát hiện vật thể OBB là một tính năng đặc biệt hữu ích trong các ngành như nông nghiệp , lập bản đồ và giám sát , nơi hình ảnh thường chứa các vật thể bị xoay như cây trồng hoặc tòa nhà trong ảnh hàng không hoặc ảnh vệ tinh. Không giống như các mô hình truyền thống, YOLO11 có thể xác định các vật thể ở mọi góc độ và cung cấp kết quả chính xác hơn nhiều cho các nhiệm vụ đòi hỏi độ chính xác.

YOLO11 dành cho các nhà phát triển AI: Hãy tự mình thử nghiệm

Bắt đầu với YOLO11 Nó đơn giản và dễ sử dụng, cho dù bạn thích lập trình hay không cần lập trình. Để làm việc với YOLO11 Thông qua mã lập trình, bạn có thể sử dụng gói Python Ultralytics để dễ dàng huấn luyện và triển khai các mô hình. Nếu bạn thích phương pháp không cần mã lập trình, Nền tảng Ultralytics cho phép bạn thử nghiệm. YOLO11 Chỉ với vài cú nhấp chuột.

YOLO11 hướng dẫn mã

Để sử dụng YOLO11 với Python , trước tiên bạn sẽ cần phải cài đặt Ultralytics gói. Tùy thuộc vào sở thích của bạn, bạn có thể thực hiện việc này bằng pip, conda hoặc Docker. Để biết hướng dẫn chi tiết và các phương pháp hay nhất liên quan đến quy trình cài đặt, hãy nhớ xem Hướng dẫn Cài đặt Ultralytics của chúng tôi. Trong khi cài đặt các gói cần thiết cho YOLO11 Nếu bạn gặp bất kỳ khó khăn nào, hãy tham khảo Hướng dẫn về các sự cố thường gặp của chúng tôi để biết giải pháp và mẹo.

Một khi bạn có Ultralytics Sau khi cài đặt gói, việc sử dụng YOLO11 rất đơn giản . Đoạn mã sau đây hướng dẫn bạn quy trình tải mô hình , huấn luyện , kiểm tra hiệu suất và xuất mô hình sang định dạng ONNX . Để biết thêm các ví dụ chuyên sâu và cách sử dụng nâng cao, hãy tham khảo tài liệu chính thức Ultralytics , nơi bạn sẽ tìm thấy hướng dẫn chi tiết và các phương pháp hay nhất để tận dụng tối đa YOLO11 .

Hình 5. Sử dụng YOLO11 thông qua Ultralytics bưu kiện.

‍

Đối với người dùng ưa thích phương pháp không cần lập trình, Ultralytics Platform cung cấp một cách dễ dàng để đào tạo và triển khai. YOLO11 Tạo mô hình chỉ với vài cú nhấp chuột. Để bắt đầu sử dụng Nền tảng Ultralytics , chỉ cần tạo tài khoản trên... Ultralytics Nền tảng này cho phép bạn bắt đầu huấn luyện và quản lý mô hình của mình thông qua giao diện trực quan.

YOLO11 : Định hình tương lai của AI thị giác

Cộng đồng trí tuệ nhân tạo không ngừng thúc đẩy lĩnh vực thị giác máy tính bằng cách nỗ lực phát triển các mô hình nhanh hơn, chính xác hơn cho các ứng dụng thực tế. Ultralytics YOLO11 Đây là một cột mốc quan trọng trong nỗ lực này, mang lại tốc độ, độ chính xác và tính linh hoạt được cải thiện. Nó được thiết kế cho các ứng dụng thời gian thực và ứng dụng biên, lý tưởng cho các ngành như chăm sóc sức khỏe và lái xe tự động. Cho dù bạn đang sử dụng Ultralytics Python gói hoặc không cần mã Ultralytics Nền tảng, YOLO11 Nó đơn giản hóa các tác vụ Trí tuệ Nhân tạo Thị giác phức tạp. Nó cung cấp khả năng thị giác máy tính mạnh mẽ, trở thành lựa chọn tuyệt vời cho các nhà phát triển và doanh nghiệp.

Xem kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng năng động của chúng tôi để tìm hiểu thêm về AI. Khám phá cách Vision AI đang thúc đẩy sự đổi mới trong các lĩnh vực như chăm sóc sức khỏe và nông nghiệp.

Tất cả những gì bạn cần biết về Ultralytics YOLO11 và các ứng dụng của nó

Hiểu biết YOLO11 : Cải tiến so với các phiên bản trước

YOLO11 ra mắt mô hình: Các tùy chọn nguồn mở và doanh nghiệp

Khám phá thế hệ tiếp theo YOLO11 đặc trưng

Thời gian thực YOLO11 các ứng dụng

YOLO11 dành cho các nhà phát triển AI: Hãy tự mình thử nghiệm

YOLO11 hướng dẫn mã

YOLO11 : Định hình tương lai của AI thị giác

Đọc thêm trong danh mục này

Một cái nhìn về việc sử dụng Ultralytics YOLO các mô hình để phát hiện mối đe dọa AI

Tự động hóa quản lý sự cố giao thông với Ultralytics YOLO26

Khám phá lý do tại sao Ultralytics YOLO26 dễ dàng đưa vào sản xuất hơn!

Hãy cùng nhau xây dựng tương lai
của AI!

Tất cả những gì bạn cần biết về Ultralytics YOLO11 và các ứng dụng của nó

Hiểu biết YOLO11 : Cải tiến so với các phiên bản trước

YOLO11 ra mắt mô hình: Các tùy chọn nguồn mở và doanh nghiệp

Khám phá thế hệ tiếp theo YOLO11 đặc trưng

Thời gian thực YOLO11 các ứng dụng

YOLO11 dành cho các nhà phát triển AI: Hãy tự mình thử nghiệm

YOLO11 hướng dẫn mã

YOLO11 : Định hình tương lai của AI thị giác

Đọc thêm trong danh mục này

Một cái nhìn về việc sử dụng Ultralytics YOLO các mô hình để phát hiện mối đe dọa AI

Tự động hóa quản lý sự cố giao thông với Ultralytics YOLO26

Khám phá lý do tại sao Ultralytics YOLO26 dễ dàng đưa vào sản xuất hơn!

Hãy cùng nhau xây dựng tương lai của AI!

Hãy cùng nhau xây dựng tương lai
của AI!