Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay

Cách sử dụng Ultralytics YOLO11 ví dụ như phân khúc

Abirami Vina

5 phút đọc

5 tháng 11, 2024

Hiểu cách thức mới Ultralytics YOLO11 mô hình có thể được sử dụng để phân đoạn nhằm đạt được độ chính xác cao hơn trong các ứng dụng như quản lý chất thải và giám sát ngọn lửa.

Thị giác máy tính , một lĩnh vực trong trí tuệ nhân tạo (AI) giúp máy móc diễn giải và hiểu thông tin hình ảnh, cho phép thực hiện các tác vụ như phân đoạn thực thể. Phân đoạn thực thể có thể được sử dụng để phân tích hình ảnh hoặc khung hình video nhằm đánh dấu ranh giới chính xác của từng đối tượng riêng biệt trong ảnh, ngay cả khi có nhiều đối tượng cùng loại. Với độ chính xác cao, phân đoạn thực thể có nhiều ứng dụng, từ hỗ trợ xe tự lái đến hỗ trợ các hệ thống tự động hóa. detect những trở ngại trên con đường xác định khối u trong quá trình chụp chiếu y tế .

Qua nhiều năm, phân đoạn trường hợp đã phát triển đáng kể. Một phát triển gần đây đã được giới thiệu trong Ultralytics ' Sự kiện kết hợp thường niên , YOLO Vision 2024 (YV24) , dưới dạng mô hình Ultralytics YOLO11 . Mô hình mới hỗ trợ các tác vụ thị giác máy tính tương tự (bao gồm phân đoạn thực thể) như mô hình Ultralytics YOLOv8 , vì vậy người dùng đã quen thuộc với các phiên bản trước có thể dễ dàng áp dụng mô hình mới.

Hình 1. Một ví dụ về việc sử dụng Ultralytics YOLO11 mô hình ví dụ phân đoạn.

Trong bài viết này, chúng ta sẽ tìm hiểu về phân đoạn thể hiện và sự khác biệt của nó với các tác vụ thị giác máy tính khác như phân đoạn ngữ nghĩa, cũng như thảo luận về một số ứng dụng của nó. Chúng tôi cũng sẽ hướng dẫn bạn cách sử dụng YOLO11 Mô hình phân đoạn phiên bản sử dụng gói Python Ultralytics và nền tảng Ultralytics HUB . Hãy bắt đầu thôi!

Phân đoạn thể hiện là gì?

Phân đoạn thể hiện có thể được sử dụng để xác định các đối tượng trong hình ảnh và phác thảo chúng ở cấp độ pixel. Quá trình này thường bao gồm việc phát hiện các đối tượng và vẽ khung giới hạn xung quanh chúng. Sau đó, một thuật toán phân đoạn phân loại từng pixel trong khung giới hạn để tạo ra một mặt nạ chính xác cho mỗi đối tượng.

Phân đoạn thể hiện cũng khác với các tác vụ như phân đoạn ngữ nghĩa và phân đoạn toàn cảnh. Phân đoạn ngữ nghĩa gán nhãn cho mỗi pixel dựa trên danh mục chung của một đối tượng, mà không phân biệt các thể hiện riêng lẻ. Phân đoạn toàn cảnh, mặt khác, kết hợp cả phân đoạn thể hiện và phân đoạn ngữ nghĩa bằng cách gán nhãn cho mỗi pixel cả lớp và ID thể hiện, xác định các đối tượng riêng lẻ trong mỗi danh mục.

Hình 2. Sử dụng YOLO11 ĐẾN detect Và segment một người và một con chó.

Khả năng phân đoạn thực thể có thể được áp dụng trong nhiều tình huống khác nhau, đòi hỏi các mô hình khác nhau. Ví dụ: một mô hình gọn nhẹ có thể lý tưởng cho xử lý thời gian thực trong các ứng dụng di động, trong khi một mô hình phức tạp hơn có thể được sử dụng cho các tác vụ có độ chính xác cao như kiểm soát chất lượng trong sản xuất.

Giống như các mô hình trước, mô hình phân đoạn thực thể YOLO11 cũng đi kèm với một số biến thể tùy thuộc vào nhu cầu của bạn. Các biến thể này bao gồm YOLO11n-seg (Nano), YOLO11s-seg (Nhỏ), YOLO11m-seg (Trung bình), YOLO11l-seg (Lớn) và YOLO11x-seg (Cực lớn). Các mô hình này khác nhau về kích thước, tốc độ xử lý, độ chính xác và lượng sức mạnh tính toán cần thiết. Dựa trên các yêu cầu cụ thể, bạn có thể chọn mô hình phù hợp nhất với ứng dụng của mình.

Ứng dụng phân đoạn phiên bản cho YOLO11

Khả năng phân đoạn phiên bản nâng cao của YOLO11 mở ra nhiều ứng dụng trong nhiều ngành công nghiệp khác nhau. Hãy cùng xem xét kỹ hơn một số ứng dụng này.

Sử dụng YOLO11 phân khúc trong ngành dầu khí

Khai thác dầu khí liên quan đến việc quản lý sự biến động áp suất cực kỳ cao. Các kỹ thuật như đốt khí (gas flaring) giúp đốt cháy khí tự nhiên được tạo ra trong quá trình khai thác dầu. Điều này là cần thiết vì lý do an toàn. Ví dụ: trong khai thác dầu thô, một sự tăng vọt áp suất đột ngột hoặc đáng kể có thể dẫn đến nổ. Mặc dù không phổ biến, nhưng tai nạn công nghiệp trong lĩnh vực sản xuất dầu khí có thể dẫn đến các đám cháy dữ dội, khó kiểm soát và dập tắt. Đốt khí giúp người vận hành giảm áp thiết bị một cách an toàn và quản lý các biến động áp suất lớn, khó lường bằng cách đốt lượng khí dư thừa.

Các hệ thống AI có thể cải thiện quy trình giám sát này và nguy cơ tai nạn có thể được giảm thiểu bằng cách sử dụng hệ thống giám sát đốt khí dựa trên phân đoạn thực thể. Giám sát quá trình đốt khí cũng rất quan trọng vì lý do môi trường, vì đốt quá nhiều khí có thể tác động tiêu cực đến môi trường. 

Ultralytics YOLO11 Các mô hình phân đoạn trường hợp có thể được sử dụng để theo dõi lượng lửa và khói do cháy bùng phát. Diện tích điểm ảnh của đám cháy và khói được phát hiện và phân đoạn có thể được tính toán. Sử dụng thông tin này, người vận hành có thể có được thông tin chi tiết theo thời gian thực về đám cháy và khói do cháy bùng phát, giúp họ ngăn ngừa tai nạn và tác động tiêu cực đến môi trường. 

Hình 3. Một ví dụ về giám sát bùng phát bằng cách sử dụng YOLO11 trong sản xuất dầu khí.

Phân đoạn trường hợp với YOLO11 để quản lý chất thải nhựa 

Công nhân tại các cơ sở quản lý và tái chế chất thải có thể sử dụng YOLO11 hệ thống phân đoạn dựa trên trường hợp để xác định vật liệu thải nhựa. YOLO11 có thể được tích hợp với hệ thống phân loại bằng robot để nhận dạng chính xác các loại rác thải khác nhau, như bìa cứng và nhựa (cần được xử lý riêng). Điều này đặc biệt quan trọng khi xét đến việc trong số 7 tỷ tấn rác thải nhựa được tạo ra trên toàn cầu, chỉ có khoảng 10% được tái chế.

Việc tự động hóa việc nhận dạng và phân loại rác thải nhựa giúp giảm đáng kể thời gian cần thiết so với các phương pháp truyền thống, nơi công nhân phân loại vật liệu bằng tay. Các mô hình thị giác máy tính thậm chí có thể segment nhựa mềm như màng bọc và túi, đặc biệt khó khăn vì chúng thường bị rối. Các mô hình YOLO11 cũng có thể được đào tạo riêng để segment các loại nhựa khác nhau. Chúng tôi sẽ tìm hiểu thêm về cách bạn có thể đào tạo riêng YOLO11 mô hình trong các phần sau.

Hình 4. Nhận dạng rác thải nhựa bằng cách sử dụng Ultralytics YOLO11 . 

YOLO11 phân khúc trong xe tự hành

Một trường hợp sử dụng thú vị khác của phân đoạn trường hợp là trong xe tự hành . YOLO11 cho phép xe tự lái cải thiện sự an toàn của hành khách và những người khác trên đường bằng cách nhận dạng chính xác các vật thể ở cấp độ pixel. Hệ thống camera tích hợp trên xe có thể chụp ảnh môi trường xung quanh và phân tích chúng bằng YOLO11 và phân đoạn thực thể. Mỗi đối tượng (người đi bộ, đèn giao thông, phương tiện khác, v.v.) trong hình ảnh đều được phân đoạn và gắn nhãn. Độ chính xác cao này giúp xe tự hành có khả năng nhận dạng từng đối tượng xung quanh. 

Hình 5. Sử dụng YOLO11 và phân đoạn trường hợp để xác định phương tiện và người đi bộ trên đường.

Thử phân đoạn trường hợp với YOLO11 người mẫu

Bây giờ chúng ta đã khám phá phân đoạn trường hợp và thảo luận về một số ứng dụng của nó, hãy xem bạn có thể dùng thử nó bằng cách nào Ultralytics YOLO11 người mẫu. 

Có hai cách để thực hiện điều này: bạn có thể sử dụng Ultralytics Python gói hoặc Ultralytics HUB. Chúng ta sẽ khám phá cả hai, bắt đầu với Python bưu kiện.

Chạy suy luận bằng cách sử dụng YOLO11

Chạy suy luận liên quan đến việc sử dụng mô hình để phân tích dữ liệu mới, chưa từng thấy trước đây. Để chạy suy luận bằng cách sử dụng YOLO11 Để phân đoạn mô hình thực thể thông qua mã, chúng ta cần cài đặt gói Python Ultralytics bằng pip, conda hoặc docker. Nếu bạn gặp bất kỳ sự cố nào trong quá trình cài đặt, bạn có thể tham khảo Hướng dẫn Xử lý Sự cố Thường gặp của chúng tôi để được hỗ trợ khắc phục sự cố. Sau khi gói được cài đặt, bạn có thể chạy mã được hiển thị bên dưới để tải gói. YOLO11 mô hình phân đoạn trường hợp và chạy dự đoán trên hình ảnh.

Hình 6. Chạy suy luận trên một hình ảnh bằng YOLO11n-seg.

Đào tạo một phong tục YOLO11 người mẫu

Với cùng một thiết lập mã, bạn cũng có thể đào tạo một tùy chỉnh YOLO11 mô hình. Bằng cách tinh chỉnh một YOLO11 mô hình, bạn có thể tạo phiên bản tùy chỉnh của mô hình đáp ứng tốt hơn các yêu cầu cụ thể của dự án . Ví dụ: các nhà bán lẻ có thể sử dụng mô hình tùy chỉnh để segment đặc điểm ngoại hình của khách hàng để đề xuất trang phục vừa vặn. Đoạn mã dưới đây cho thấy cách tải và đào tạo YOLO11 Ví dụ, bạn có thể bắt đầu từ cấu hình YAML hoặc mô hình được đào tạo trước, chuyển trọng số và đào tạo trên tập dữ liệu như COCO để đạt được phân đoạn hiệu quả. 

Sau khi hoàn tất, bạn có thể thực hiện suy luận bằng mô hình tùy chỉnh cho các ứng dụng cụ thể của mình. Sử dụng tùy chọn xuất, bạn cũng có thể xuất mô hình tùy chỉnh của mình sang một định dạng khác.

YOLO11 phân đoạn trường hợp trên Ultralytics TRUNG TÂM

Bây giờ chúng ta đã khám phá việc chạy suy luận và đào tạo tùy chỉnh YOLO11 mô hình phân đoạn phiên bản thông qua mã, chúng ta hãy xem xét một giải pháp thay thế không cần mã: Ultralytics HUB . Ultralytics HUB là một nền tảng AI thị giác trực quan giúp đơn giản hóa quá trình đào tạo và triển khai YOLO các mô hình, bao gồm YOLO11 mô hình phân đoạn trường hợp. 

Để chạy suy luận trên hình ảnh, tất cả những gì bạn phải làm là; tạo một tài khoản , đi đến phần 'Mô hình' và chọn YOLO11 Biến thể mô hình phân đoạn thực thể tùy chọn. Bạn có thể tải lên hình ảnh và xem kết quả dự đoán trong phần xem trước, như hiển thị bên dưới.

Hình 7. Chạy suy luận trên Ultralytics TRUNG TÂM.

Những điều cần nhớ

YOLO11 cung cấp khả năng phân đoạn dữ liệu đáng tin cậy, mở ra vô vàn tiềm năng cho nhiều ngành công nghiệp khác nhau. Từ việc nâng cao an toàn cho xe tự hành và giám sát việc đốt khí thải trong ngành dầu khí cho đến tự động hóa việc phân loại rác thải tại các cơ sở tái chế, YOLO11 Độ chính xác ở cấp độ pixel khiến nó trở nên lý tưởng cho các tác vụ phân đoạn phức tạp. 

Với các tùy chọn đào tạo tùy chỉnh thông qua Ultralytics Python gói và thiết lập không cần mã thông qua Ultralytics HUB, người dùng có thể tích hợp liền mạch YOLO11 vào quy trình làm việc của họ. Cho dù là ứng dụng công nghiệp, chăm sóc sức khỏe, bán lẻ hay giám sát môi trường, YOLO11 mang lại sự linh hoạt và độ chính xác để đáp ứng các nhu cầu phân khúc đa dạng.

Để khám phá thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia với cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong xe tự láinông nghiệp trên các trang giải pháp của chúng tôi. 🚀

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí