Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay

Phân đoạn hình ảnh với Ultralytics YOLO11 TRÊN Google Colab

Abirami Vina

4 phút đọc

30 tháng 12, 2024

Khám phá cách sử dụng hiệu quả Ultralytics YOLO11 để phân đoạn hình ảnh, tận dụng bộ dữ liệu phụ tùng ô tô trên Google Colab cho việc đào tạo và kiểm tra liền mạch.

Ultralytics YOLO Các mô hình, chẳng hạn như Ultralytics YOLO11 mới nhất, hỗ trợ nhiều tác vụ thị giác máy tính như phát hiện đối tượng, phân loại hình ảnh và phân đoạn thực thể. Mỗi tác vụ này đều nhằm mục đích mô phỏng một khía cạnh cụ thể của thị giác con người, giúp máy móc có thể nhìn và diễn giải thế giới xung quanh. 

Ví dụ: hãy xem xét cách một học sinh trong lớp học vẽ có thể cầm bút chì và phác thảo một đối tượng trong bản vẽ. Đằng sau hậu trường, bộ não của họ đang thực hiện phân đoạn - phân biệt đối tượng với nền và các yếu tố khác. Phân đoạn hình ảnh đạt được một mục tiêu tương tự bằng cách sử dụng trí tuệ nhân tạo (AI), chia nhỏ dữ liệu trực quan thành các phần có ý nghĩa để máy móc hiểu được. Kỹ thuật này có thể được sử dụng trong nhiều ứng dụng trên nhiều ngành công nghiệp. 

__wf_reserved_inherit
Hình 1. Ultralytics YOLO11 được sử dụng để segment các đối tượng trong một hình ảnh.

Một ví dụ thực tế là phân đoạn các bộ phận xe hơi. Bằng cách xác định và phân loại các thành phần cụ thể của xe, phân đoạn hình ảnh có thể hợp lý hóa các quy trình trong các ngành như sản xuất ô tô, sửa chữa và lập danh mục thương mại điện tử.

Trong bài viết này, chúng ta sẽ khám phá cách bạn có thể sử dụng Ultralytics YOLO11 , Google Colab và Roboflow Bộ dữ liệu phân đoạn Carparts để xây dựng giải pháp có thể xác định chính xác và segment phụ tùng ô tô.

Ultralytics YOLO11 dễ sử dụng

Ultralytics YOLO11 có sẵn dưới dạng mô hình được đào tạo trước trên tập dữ liệu COCO , bao gồm 80 lớp đối tượng khác nhau. Tuy nhiên, đối với các ứng dụng cụ thể, chẳng hạn như phân đoạn phụ tùng ô tô, mô hình có thể được đào tạo tùy chỉnh để phù hợp hơn với tập dữ liệu và trường hợp sử dụng của bạn. Tính linh hoạt này cho phép YOLO11 để thực hiện tốt cả nhiệm vụ có mục đích chung và nhiệm vụ có tính chuyên môn cao.

Đào tạo tùy chỉnh bao gồm việc sử dụng các đào tạo trước YOLO11 mô hình và tinh chỉnh nó trên một tập dữ liệu mới. Bằng cách cung cấp các ví dụ được gắn nhãn cụ thể cho nhiệm vụ của bạn, mô hình sẽ học cách nhận dạng và segment các đối tượng riêng biệt cho dự án của bạn. Đào tạo tùy chỉnh đảm bảo độ chính xác và tính phù hợp cao hơn so với việc dựa vào các trọng số được đào tạo chung trước đó.

Việc thiết lập YOLO11 cho mục đích huấn luyện tùy chỉnh rất đơn giản. Chỉ cần thiết lập tối thiểu, bạn có thể tải mô hình và tập dữ liệu, bắt đầu huấn luyện và theo dõi các chỉ số như độ mất mát và độ chính xác trong suốt quá trình. YOLO11 cũng bao gồm các công cụ tích hợp để xác thực và đánh giá, giúp bạn dễ dàng đánh giá hiệu suất hoạt động của mô hình. 

Đang chạy Ultralytics YOLO11 TRÊN Google Colab

Khi đào tạo tùy chỉnh YOLO11 Có một số tùy chọn khác nhau để thiết lập môi trường. Một trong những lựa chọn dễ tiếp cận và thuận tiện nhất là Google Colab. Dưới đây là một số lợi ích khi sử dụng Google Colab cho YOLO11 đào tạo:

  • Truy cập miễn phí vào các nguồn tài nguyên: Google Colab cung cấp GPU (Bộ xử lý đồ họa) và TPU ( Tensor Đơn vị xử lý), cho phép bạn đào tạo YOLO11 không cần phần cứng tốn kém.
  • Môi trường hợp tác: Google Colab giúp bạn chia sẻ sổ tay, lưu trữ công việc trong Google Thúc đẩy và đơn giản hóa hoạt động nhóm thông qua khả năng cộng tác và theo dõi phiên bản dễ dàng.
  • Thư viện được cài đặt sẵn: Với các công cụ được cài đặt sẵn như PyTorch Và TensorFlow , Google Colab đơn giản hóa quá trình thiết lập và giúp bạn bắt đầu nhanh chóng.
  • Tích hợp đám mây: Bạn có thể dễ dàng tải các tập dữ liệu từ Google Drive, GitHub hoặc các nguồn đám mây khác, giúp đơn giản hóa việc chuẩn bị và lưu trữ dữ liệu.
__wf_reserved_inherit
Hình 2. Các Google Colab YOLO11 sổ tay.

Ultralytics cũng cung cấp một sổ tay Google Colab được cấu hình sẵn dành riêng cho YOLO11 đào tạo. Sổ tay này bao gồm mọi thứ bạn cần, từ đào tạo mô hình đến đánh giá hiệu suất, giúp quy trình trở nên đơn giản và dễ dàng theo dõi. Đây là điểm khởi đầu tuyệt vời, cho phép bạn tập trung tinh chỉnh mô hình cho phù hợp với nhu cầu cụ thể mà không cần lo lắng về các bước thiết lập phức tạp.

Tổng quan về Roboflow Bộ dữ liệu phân khúc phụ tùng ô tô

Sau khi quyết định môi trường đào tạo của bạn, bước tiếp theo là thu thập dữ liệu hoặc chọn một tập dữ liệu phù hợp để phân đoạn các bộ phận ô tô. Roboflow Bộ dữ liệu phân khúc phụ tùng ô tô , có sẵn trên Roboflow Vũ trụ được duy trì bởi Roboflow , một nền tảng cung cấp các công cụ để xây dựng, đào tạo và triển khai các mô hình thị giác máy tính. Bộ dữ liệu này bao gồm 3.156 hình ảnh đào tạo, 401 hình ảnh xác thực và 276 hình ảnh thử nghiệm, tất cả đều có chú thích chất lượng cao cho các bộ phận ô tô như cản xe, cửa xe, gương chiếu hậu và bánh xe.

Thông thường, bạn sẽ cần phải tải xuống tập dữ liệu từ Roboflow Vũ trụ và thiết lập thủ công để đào tạo trên Google Hợp tác. Tuy nhiên, gói Python Ultralytics đơn giản hóa quy trình này bằng cách cung cấp khả năng tích hợp liền mạch và các công cụ được cấu hình sẵn.

__wf_reserved_inherit
Hình 3. Các ví dụ từ bộ dữ liệu phân đoạn các bộ phận xe hơi.

Với Ultralytics , tập dữ liệu đã sẵn sàng để sử dụng thông qua tệp YAML được cấu hình sẵn, bao gồm đường dẫn tập dữ liệu, nhãn lớp và các tham số huấn luyện khác. Tệp này sẽ tự động thiết lập cho bạn, giúp bạn có thể nhanh chóng tải tập dữ liệu và bắt đầu huấn luyện mô hình ngay lập tức. Ngoài ra, tập dữ liệu được cấu trúc với các tập huấn luyện, xác thực và kiểm tra chuyên biệt, giúp theo dõi tiến độ và đánh giá hiệu suất dễ dàng hơn.

Bằng cách tận dụng Roboflow Bộ dữ liệu phân đoạn phụ tùng ô tô với các công cụ được cung cấp bởi Ultralytics YOLO11 , bạn có một quy trình làm việc liền mạch để xây dựng các mô hình phân khúc hiệu quả trên các nền tảng như Google Colab. Phương pháp này giúp giảm thời gian thiết lập và cho phép bạn tập trung vào việc tinh chỉnh mô hình của mình cho các ứng dụng thực tế.

Các ứng dụng thực tế của phân đoạn bộ phận xe hơi

Phân đoạn bộ phận xe hơi có nhiều ứng dụng thực tế trong các ngành công nghiệp khác nhau. Ví dụ, trong các cửa hàng sửa chữa, nó có thể giúp nhanh chóng xác định và phân loại các thành phần bị hư hỏng để làm cho quá trình sửa chữa nhanh hơn và hiệu quả hơn. Tương tự, trong ngành bảo hiểm, các mô hình phân đoạn có thể tự động hóa việc đánh giá yêu cầu bồi thường bằng cách phân tích hình ảnh của các phương tiện bị hư hỏng để xác định các bộ phận bị ảnh hưởng. Điều này tăng tốc quá trình yêu cầu bồi thường, giảm lỗi và tiết kiệm thời gian cho cả công ty bảo hiểm và khách hàng.

__wf_reserved_inherit
Hình 4. Phân đoạn các bộ phận ô tô bằng cách sử dụng YOLO .

Đối với sản xuất, phân đoạn hỗ trợ kiểm soát chất lượng bằng cách kiểm tra các bộ phận ô tô để tìm lỗi, đảm bảo tính nhất quán và giảm lãng phí. Các ứng dụng này thể hiện cách phân đoạn bộ phận ô tô có thể thay đổi các ngành công nghiệp bằng cách làm cho quy trình an toàn hơn, nhanh hơn và chính xác hơn.

Hướng dẫn từng bước: sử dụng YOLO11 TRÊN Google Colab 

Bây giờ chúng ta đã nắm được tất cả các chi tiết, đã đến lúc tổng hợp lại mọi thứ. Để bắt đầu, bạn có thể xem video trên YouTube của chúng tôi , video này sẽ hướng dẫn bạn toàn bộ quá trình thiết lập, đào tạo và xác thực. YOLO11 mô hình phân khúc phụ tùng ô tô.

Sau đây là tổng quan nhanh về các bước thực hiện:

  • Thiết lập môi trường của bạn trên Google Colab : Bật GPU hỗ trợ và cài đặt Ultralytics Python gói chuẩn bị cho việc đào tạo người mẫu.
  • Tải mô hình YOLO11 : Bắt đầu với mô hình được đào tạo trước YOLO11 mô hình phân khúc để tiết kiệm thời gian và tận dụng các tính năng hiện có cho phân khúc phụ tùng ô tô.
  • Huấn luyện mô hình với tập dữ liệu : Sử dụng “carparts-seg. yaml ” tập tin trong quá trình đào tạo để tự động tải xuống, cấu hình và sử dụng Roboflow Bộ dữ liệu phân đoạn Carparts. Điều chỉnh các thông số như thời gian, kích thước hình ảnh và kích thước lô để tinh chỉnh mô hình.
  • Theo dõi tiến độ đào tạo : Theo dõi các số liệu hiệu suất chính , chẳng hạn như mất phân đoạn và Độ chính xác trung bình ( mAP ), để đảm bảo mô hình cải thiện như mong đợi.
  • Xác thực và triển khai mô hình: Kiểm tra mô hình đã huấn luyện trên tập dữ liệu xác thực để xác nhận độ chính xác của nó và xuất nó cho các ứng dụng thực tế như kiểm soát chất lượng hoặc xử lý yêu cầu bảo hiểm.

Lợi ích của việc sử dụng YOLO11 để phân khúc phụ tùng ô tô

YOLO11 là một công cụ đáng tin cậy và hiệu quả để phân loại phụ tùng ô tô, mang lại nhiều lợi thế lý tưởng cho nhiều ứng dụng thực tế. Dưới đây là những lợi ích chính:

  • Tốc độ và hiệu quả: YOLO11 xử lý hình ảnh nhanh chóng trong khi vẫn duy trì độ chính xác cao, phù hợp với các tác vụ thời gian thực như kiểm soát chất lượng và xe tự hành.
  • Độ chính xác cao: Mô hình vượt trội trong việc phát hiện và phân đoạn nhiều đối tượng trong một hình ảnh duy nhất, đảm bảo xác định chính xác các bộ phận của xe.
  • Khả năng mở rộng : YOLO11 có thể xử lý các tập dữ liệu lớn và các tác vụ phân đoạn phức tạp, giúp nó có khả năng mở rộng cho các ứng dụng công nghiệp.
  • Nhiều tích hợp : Ultralytics hỗ trợ tích hợp với các nền tảng như Google Colab, Ultralytics Hub và các công cụ phổ biến khác, tăng cường tính linh hoạt và khả năng truy cập cho các nhà phát triển.

Mẹo làm việc với YOLO11 TRÊN Google Hợp tác

Trong khi Google Colab giúp quy trình làm việc với máy học dễ dàng hơn rất nhiều, nhưng có thể mất một chút thời gian để làm quen nếu bạn mới sử dụng. Việc điều hướng thiết lập trên nền tảng đám mây, cài đặt thời gian chạy và giới hạn phiên có thể hơi khó khăn lúc đầu, nhưng có một vài mẹo có thể giúp mọi việc suôn sẻ hơn nhiều.

Dưới đây là một vài điều cần cân nhắc:

  • Bắt đầu bằng cách kích hoạt GPU tăng tốc trong cài đặt thời gian chạy để tăng tốc độ đào tạo.
  • Vì Colab chạy trên đám mây, hãy đảm bảo bạn có kết nối internet ổn định để truy cập các tài nguyên như bộ dữ liệu và kho lưu trữ. 
  • Tổ chức các tập tin và bộ dữ liệu của bạn trong Google Drive hoặc GitHub để dễ dàng tải và quản lý trong Colab.
  • Nếu bạn gặp phải giới hạn bộ nhớ trên gói miễn phí của Colab, hãy thử giảm kích thước hình ảnh hoặc kích thước lô trong quá trình huấn luyện. 
  • Hãy nhớ lưu mô hình và kết quả của bạn thường xuyên, vì các phiên Colab có giới hạn thời gian và bạn không muốn mất tiến trình của mình. 

Đạt được nhiều hơn với YOLO11

Ultralytics YOLO11 , kết hợp với các nền tảng như Google Colab và các tập dữ liệu như Roboflow Bộ dữ liệu Phân đoạn Carparts giúp việc phân đoạn hình ảnh trở nên đơn giản và dễ dàng. Với các công cụ trực quan, mô hình được đào tạo sẵn và thiết lập dễ dàng, YOLO11 cho phép bạn dễ dàng thực hiện các tác vụ thị giác máy tính nâng cao. 

Cho dù bạn đang cải thiện an toàn ô tô, tối ưu hóa sản xuất hay xây dựng các ứng dụng AI sáng tạo, sự kết hợp này cung cấp các công cụ giúp bạn thành công. Với Ultralytics YOLO11 , bạn không chỉ xây dựng các mô hình - bạn đang mở đường cho các giải pháp thông minh hơn, hiệu quả hơn trong thế giới thực.

Để tìm hiểu thêm, hãy xem kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong xe tự láicomputer vision cho nông nghiệp trên các trang giải pháp của chúng tôi. 🚀

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí