Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay

Đào tạo tùy chỉnh Ultralytics YOLO11 với các tập dữ liệu thị giác máy tính

Abirami Vina

4 phút đọc

7 tháng 1, 2025

Khám phá cách Roboflow tích hợp có thể đơn giản hóa đào tạo tùy chỉnh Ultralytics YOLO11 bằng cách tạo ra các tập dữ liệu thị giác máy tính nguồn mở dễ truy cập.

Việc đào tạo một mô hình thị giác máy tính như Ultralytics YOLO11 thường bao gồm việc thu thập hình ảnh cho tập dữ liệu của bạn, chú thích chúng, chuẩn bị dữ liệu và tinh chỉnh mô hình để đáp ứng các yêu cầu cụ thể. Mặc dù gói Python Ultralytics giúp các bước này trở nên đơn giản và dễ sử dụng, việc phát triển Vision AI vẫn có thể tốn nhiều thời gian.

Điều này đặc biệt đúng khi bạn đang làm việc với thời hạn gấp rút hoặc đang phát triển một nguyên mẫu. Trong những trường hợp này, việc có các công cụ hoặc tích hợp giúp đơn giản hóa một số phần của quy trình - chẳng hạn như hợp lý hóa việc chuẩn bị dữ liệu hoặc tự động hóa các tác vụ lặp lại - có thể tạo ra sự khác biệt lớn. Bằng cách giảm thời gian và công sức cần thiết, các giải pháp này giúp bạn tập trung vào việc xây dựng và tinh chỉnh mô hình của mình. Đó chính xác là những gì Roboflow cung cấp tích hợp.

Các Roboflow tích hợp cho phép bạn dễ dàng truy cập các tập dữ liệu từ Roboflow Universe, một thư viện lớn các tập dữ liệu thị giác máy tính nguồn mở. Thay vì dành hàng giờ để thu thập và sắp xếp dữ liệu, bạn có thể nhanh chóng tìm và sử dụng các tập dữ liệu hiện có để khởi động YOLO11 quá trình đào tạo. Sự tích hợp này giúp việc thử nghiệm và lặp lại quá trình phát triển mô hình thị giác máy tính của bạn nhanh hơn và đơn giản hơn nhiều.

Trong bài viết này, chúng ta sẽ đi sâu vào cách bạn có thể tận dụng Roboflow Tích hợp để phát triển mô hình nhanh hơn. Hãy bắt đầu thôi!

Là gì Roboflow Vũ trụ?

Roboflow Vũ trụ là một nền tảng được duy trì bởi Roboflow , một công ty tập trung vào việc đơn giản hóa quá trình phát triển thị giác máy tính. Công ty bao gồm hơn 350 triệu hình ảnh, 500.000 tập dữ liệu và 100.000 mô hình được tinh chỉnh cho các tác vụ như phát hiện đối tượng , phân loại và phân đoạn hình ảnh. Với sự đóng góp từ các nhà phát triển và nhà nghiên cứu trên toàn thế giới, Roboflow Universe là trung tâm cộng tác dành cho bất kỳ ai muốn khởi động hoặc nâng cao các dự án thị giác máy tính của mình.

Hình 1. Ví dụ về tập dữ liệu phát hiện đối tượng trên Roboflow Vũ trụ.

Roboflow Universe bao gồm các tính năng chính sau:

  • Công cụ khám phá bộ dữ liệu: Khám phá, lọc và trực quan hóa các bộ dữ liệu để nhanh chóng tìm thấy các tài nguyên phù hợp với yêu cầu dự án của bạn.
  • Tùy chọn xuất : Xuất dữ liệu theo các định dạng như COCO , YOLO , TFRecord, CSV và nhiều định dạng khác phù hợp với quy trình làm việc của bạn.
  • Phân tích bộ dữ liệu: Thu thập thông tin chi tiết về các bộ dữ liệu khác nhau bằng các công cụ phân tích cung cấp hình ảnh trực quan về phân phối nhãn, sự mất cân bằng lớp và chất lượng bộ dữ liệu. 
  • Theo dõi phiên bản : Xem và truy cập các phiên bản khác nhau của bộ dữ liệu do người đóng góp tải lên, cho phép bạn track cập nhật, so sánh các thay đổi và chọn phiên bản phù hợp nhất với nhu cầu dự án của bạn. 

Các Roboflow tích hợp giúp bạn tìm đúng dữ liệu

Việc tìm kiếm bộ dữ liệu phù hợp thường là một trong những phần khó khăn nhất của việc xây dựng một mô hình thị giác máy tính. Tạo một bộ dữ liệu thường bao gồm việc thu thập một lượng lớn hình ảnh, đảm bảo rằng chúng có liên quan đến nhiệm vụ của bạn và sau đó dán nhãn chúng một cách chính xác. 

Quá trình này có thể tốn rất nhiều thời gian và nguồn lực, đặc biệt nếu bạn đang thử nghiệm các cách tiếp cận khác nhau trong một khoảng thời gian ngắn. Ngay cả việc tìm kiếm các tập dữ liệu có sẵn từ trước cũng có thể khó khăn, vì chúng thường nằm rải rác trên các nền tảng, không được ghi chép đúng cách hoặc thiếu các chú thích cụ thể mà bạn cần.

Ví dụ, nếu bạn đang xây dựng một ứng dụng thị giác máy tính để detect Cỏ dại trên các cánh đồng nông nghiệp, bạn có thể muốn thử nghiệm các phương pháp Vision AI khác nhau, chẳng hạn như phát hiện đối tượng so với phân đoạn thực thể. Điều này cho phép bạn thử nghiệm và tìm ra phương pháp nào hiệu quả nhất trước khi dành thời gian và công sức thu thập và dán nhãn tập dữ liệu của riêng bạn.

Hình 2. Phát hiện các bộ phận ô tô bằng cách sử dụng YOLO11 .

Sử dụng Roboflow Với sự tích hợp này, bạn có thể duyệt qua nhiều bộ dữ liệu liên quan đến nông nghiệp, bao gồm các bộ dữ liệu tập trung vào phát hiện cỏ dại, sức khỏe cây trồng hoặc giám sát đồng ruộng. Các bộ dữ liệu sẵn sàng sử dụng này cho phép bạn thử nghiệm các kỹ thuật khác nhau và tinh chỉnh mô hình mà không cần tốn công sức tạo dữ liệu riêng. 

Làm thế nào Roboflow công trình tích hợp

Bây giờ chúng ta đã thảo luận về cách bạn có thể sử dụng Roboflow tích hợp để tìm đúng tập dữ liệu, hãy xem nó phù hợp với quy trình làm việc của bạn như thế nào. Sau khi bạn đã chọn một tập dữ liệu từ Roboflow Vũ trụ, bạn có thể xuất hoặc tải xuống trong YOLO11 định dạng. Sau khi tập dữ liệu của bạn được xuất, bạn có thể sử dụng nó để tùy chỉnh đào tạo YOLO11 sử dụng Ultralytics Python bưu kiện. 

Trong khi tải xuống tập dữ liệu của bạn, bạn có thể nhận thấy rằng Roboflow Universe cũng hỗ trợ các định dạng khác để huấn luyện các mô hình khác nhau. Vậy tại sao bạn nên chọn huấn luyện tùy chỉnh? Ultralytics YOLO11 ? 

YOLO11 là phiên bản mới nhất của Ultralytics YOLO Mô hình này được xây dựng để phát hiện đối tượng nhanh hơn và chính xác hơn. Nó sử dụng ít hơn 22% tham số (giá trị nội bộ mà mô hình điều chỉnh trong quá trình huấn luyện để đưa ra dự đoán) so với YOLOv8m , nhưng vẫn đạt được độ chính xác trung bình cao hơn ( mAP ) trên COCO tập dữ liệu. Sự cân bằng giữa tốc độ và độ chính xác này làm cho YOLO11 một lựa chọn linh hoạt cho nhiều ứng dụng thị giác máy tính, đặc biệt là khi tùy chỉnh các mô hình đào tạo phù hợp với các nhiệm vụ cụ thể.

Sau đây là cái nhìn sâu hơn về cách thức hoạt động của chương trình đào tạo tùy chỉnh YOLO11 :

  • Cung cấp dữ liệu : YOLO11 mô hình xử lý tập dữ liệu của bạn, học cách detect Và classify các đối tượng từ hình ảnh và chú thích của chúng.
  • Dự đoán và phản hồi: Mô hình đưa ra dự đoán về các đối tượng trong hình ảnh và so sánh chúng với các câu trả lời chính xác được cung cấp trong tập dữ liệu.
  • Theo dõi hiệu năng: Các số liệu như độ chính xác (số lần phát hiện đúng), độ phủ (số lần phát hiện bị bỏ sót) và loss (lỗi dự đoán) được theo dõi để đánh giá tiến độ.
  • Học lặp đi lặp lại: Mô hình điều chỉnh các tham số của nó qua nhiều vòng (epoch) để cải thiện độ chính xác phát hiện và giảm thiểu lỗi.
  • Đầu ra mô hình cuối cùng: Sau khi huấn luyện, mô hình được tối ưu hóa sẽ được lưu và sẵn sàng để triển khai.

Các tích hợp khác tập trung vào phát triển thị giác máy tính

Khi bạn khám phá Roboflow tích hợp, bạn sẽ thấy các tích hợp khác được đề cập trong tài liệu Ultralytics . Chúng tôi hỗ trợ nhiều tích hợp liên quan đến các giai đoạn phát triển thị giác máy tính khác nhau. 

Điều này nhằm cung cấp cho cộng đồng của chúng tôi nhiều lựa chọn khác nhau, để bạn có thể chọn những gì phù hợp nhất với quy trình làm việc cụ thể của mình.

Hình 3. Tổng quan về các tích hợp được hỗ trợ bởi Ultralytics .

Ngoài bộ dữ liệu, các tích hợp khác được Ultralytics hỗ trợ tập trung vào nhiều khía cạnh khác nhau của quy trình thị giác máy tính, chẳng hạn như đào tạo, triển khai và tối ưu hóa. Dưới đây là một số ví dụ về các tích hợp khác mà chúng tôi hỗ trợ:

  • Tích hợp đào tạo: Tích hợp như Amazon SageMaker và Paperspace Hợp lý hóa quy trình đào tạo bằng cách cung cấp nền tảng đám mây để phát triển và thử nghiệm mô hình hiệu quả.
  • Tích hợp theo dõi quy trình làm việc và thử nghiệm: ClearML , MLFlow và Weights & Biases (W&B) giúp tự động hóa quy trình làm việc, track các thí nghiệm và cải thiện sự cộng tác, giúp quản lý các dự án học máy dễ dàng hơn.
  • Tích hợp tối ưu hóa và triển khai: CoreML , ONNX , Và OpenVINO cho phép triển khai được tối ưu hóa trên nhiều thiết bị và khuôn khổ khác nhau, đảm bảo hiệu suất hiệu quả trên các nền tảng như phần cứng Apple và Intel CPU.
  • Tích hợp giám sát và trực quan hóa: TensorBoard và Weights & Biases cung cấp các công cụ để trực quan hóa tiến độ đào tạo và theo dõi hiệu suất, đưa ra thông tin chi tiết để tinh chỉnh mô hình.

YOLO11 ứng dụng và vai trò của tích hợp

Các tích hợp hỗ trợ phát triển thị giác máy tính, kết hợp với khả năng đáng tin cậy của YOLO11 , giúp giải quyết các thách thức trong thế giới thực dễ dàng hơn. Hãy xem xét các đổi mới như thị giác máy tính trong sản xuất , nơi AI thị giác được sử dụng để detect Các khiếm khuyết trên dây chuyền sản xuất - chẳng hạn như vết xước trên các bộ phận kim loại hoặc thiếu linh kiện. Việc thu thập dữ liệu phù hợp cho những nhiệm vụ như vậy thường chậm và khó khăn, đòi hỏi phải tiếp cận các môi trường chuyên biệt. 

Nó thường liên quan đến việc thiết lập camera hoặc cảm biến dọc theo dây chuyền sản xuất để chụp ảnh sản phẩm. Những hình ảnh này cần được chụp với số lượng lớn, thường dưới ánh sáng và góc độ nhất quán, để đảm bảo độ rõ nét và đồng nhất. 

Sau khi chụp, hình ảnh phải được chú thích tỉ mỉ với các nhãn chính xác cho mọi loại lỗi, chẳng hạn như trầy xước, vết lõm hoặc thiếu bộ phận. Quá trình này đòi hỏi thời gian và nguồn lực đáng kể, cũng như chuyên môn, để đảm bảo bộ dữ liệu phản ánh chính xác sự thay đổi trong thế giới thực. Các yếu tố như kích thước, hình dạng và vật liệu lỗi khác nhau phải được tính đến để tạo ra một bộ dữ liệu mạnh mẽ và đáng tin cậy.

Các tích hợp cung cấp các tập dữ liệu có sẵn tạo điều kiện thuận lợi cho các nhiệm vụ như kiểm soát chất lượng công nghiệp và với YOLO11 Với khả năng phát hiện thời gian thực, các nhà sản xuất có thể theo dõi dây chuyền sản xuất, phát hiện lỗi ngay lập tức và cải thiện hiệu quả.

Hình 4. Một ví dụ về việc sử dụng Ultralytics YOLO11 ĐẾN detect và đếm số lon đang được sản xuất.

Ngoài sản xuất, tích hợp liên quan đến tập dữ liệu có thể được sử dụng trong nhiều ngành công nghiệp khác. Bằng cách kết hợp YOLO11 Với tốc độ và độ chính xác cao cùng các tập dữ liệu dễ truy cập, doanh nghiệp có thể nhanh chóng phát triển và triển khai các giải pháp phù hợp với nhu cầu cụ thể của mình. Ví dụ, trong lĩnh vực chăm sóc sức khỏe, tích hợp tập dữ liệu có thể giúp phát triển các giải pháp phân tích hình ảnh y tế để detect Những bất thường như khối u. Tương tự, trong xe tự lái, những tích hợp như vậy có thể giúp nhận dạng phương tiện, người đi bộ và biển báo giao thông để tăng cường an toàn.

Những điều cần nhớ

Việc tìm kiếm tập dữ liệu phù hợp thường là một trong những phần tốn thời gian nhất khi xây dựng mô hình thị giác máy tính. Tuy nhiên, Roboflow tích hợp giúp bạn dễ dàng tìm thấy tập dữ liệu tốt nhất để đào tạo tùy chỉnh Ultralytics YOLO mô hình, ngay cả khi bạn mới làm quen với thị giác máy tính. 

Với quyền truy cập vào bộ sưu tập dữ liệu khổng lồ cho các tác vụ thị giác máy tính như phát hiện đối tượng, phân loại hình ảnh hoặc phân đoạn trường hợp, Roboflow Universe giúp bạn loại bỏ những rắc rối trong quá trình khám phá dữ liệu. Nó giúp bạn bắt đầu nhanh chóng và tập trung vào việc xây dựng mô hình thay vì tốn thời gian thu thập và sắp xếp dữ liệu. Phương pháp tiếp cận hợp lý này cho phép các nhà phát triển tạo nguyên mẫu, lặp lại và phát triển các giải pháp thị giác máy tính hiệu quả hơn.

Để tìm hiểu thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi. Khám phá những đổi mới trong các lĩnh vực như AI trong xe tự láithị giác máy tính trong nông nghiệp trên các trang giải pháp của chúng tôi. 🚀

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí