Đào tạo tùy chỉnh Ultralytics YOLO11 với bộ dữ liệu thị giác máy tính

Abirami Vina

4 phút đọc

Ngày 7 tháng 1 năm 2025

Khám phá cách tích hợp Roboflow có thể đơn giản hóa quá trình đào tạo tùy chỉnh Ultralytics YOLO11 bằng cách giúp truy cập dễ dàng vào các tập dữ liệu thị giác máy tính nguồn mở.

Đào tạo mô hình thị giác máy tính như Ultralytics YOLO11 thường bao gồm thu thập hình ảnh cho tập dữ liệu của bạn, chú thích chúng, chuẩn bị dữ liệu và tinh chỉnh mô hình để đáp ứng các yêu cầu cụ thể của bạn. Mặc dù gói Ultralytics Python giúp các bước này trở nên đơn giản và thân thiện với người dùng, nhưng việc phát triển Vision AI vẫn có thể tốn thời gian.

Điều này đặc biệt đúng khi bạn đang làm việc với thời hạn gấp hoặc đang phát triển một nguyên mẫu. Trong những tình huống này, việc có các công cụ hoặc tích hợp giúp đơn giản hóa một số phần của quy trình - chẳng hạn như hợp lý hóa việc chuẩn bị tập dữ liệu hoặc tự động hóa các tác vụ lặp lại - có thể tạo ra sự khác biệt lớn. Bằng cách giảm thời gian và công sức cần thiết, các giải pháp này giúp bạn tập trung vào việc xây dựng và tinh chỉnh mô hình của mình. Đó chính xác là những gì tích hợp Roboflow cung cấp.

Tích hợp Roboflow cho phép bạn dễ dàng truy cập các tập dữ liệu từ Roboflow Universe, một thư viện lớn các tập dữ liệu thị giác máy tính nguồn mở. Thay vì dành hàng giờ để thu thập và sắp xếp dữ liệu, bạn có thể nhanh chóng tìm và sử dụng các tập dữ liệu hiện có để khởi động quy trình đào tạo YOLO11 của mình. Tích hợp này giúp bạn thử nghiệm và lặp lại quá trình phát triển mô hình thị giác máy tính nhanh hơn và đơn giản hơn nhiều.

Trong bài viết này, chúng ta sẽ tìm hiểu cách bạn có thể tận dụng tích hợp Roboflow để phát triển mô hình nhanh hơn. Hãy bắt đầu nào!

Roboflow Universe là gì?

Roboflow Universe là một nền tảng được duy trì bởi Roboflow, một công ty tập trung vào việc đơn giản hóa quá trình phát triển thị giác máy tính. Nó bao gồm hơn 350 triệu hình ảnh, 500.000 tập dữ liệu và 100.000 mô hình được tinh chỉnh cho các tác vụ như phát hiện đối tượng , phân loại hình ảnh và phân đoạn. Với sự đóng góp của các nhà phát triển và nhà nghiên cứu trên toàn thế giới, Roboflow Universe là một trung tâm cộng tác cho bất kỳ ai muốn khởi động hoặc nâng cao các dự án thị giác máy tính của họ.

Hình 1. Ví dụ về tập dữ liệu phát hiện đối tượng trên Roboflow Universe.

Roboflow Universe bao gồm các tính năng chính sau:

  • Công cụ khám phá tập dữ liệu : Khám phá, lọc và trực quan hóa các tập dữ liệu để nhanh chóng tìm ra các tài nguyên phù hợp với yêu cầu dự án của bạn.
  • Tùy chọn xuất : Xuất dữ liệu theo các định dạng như COCO, YOLO, TFRecord, CSV, v.v. để phù hợp với quy trình làm việc của bạn.
  • Phân tích tập dữ liệu : Tìm hiểu sâu hơn về nhiều tập dữ liệu khác nhau bằng các công cụ phân tích cung cấp hình ảnh trực quan về phân phối nhãn, mất cân bằng lớp và chất lượng tập dữ liệu.
  • Theo dõi phiên bản : Xem và truy cập các phiên bản khác nhau của bộ dữ liệu do người đóng góp tải lên, cho phép bạn theo dõi các bản cập nhật, so sánh các thay đổi và chọn phiên bản phù hợp nhất với nhu cầu dự án của bạn. 

Tích hợp Roboflow giúp bạn tìm đúng dữ liệu

Việc tìm đúng tập dữ liệu thường là một trong những phần khó khăn nhất khi xây dựng mô hình thị giác máy tính . Việc tạo tập dữ liệu thường liên quan đến việc thu thập một lượng lớn hình ảnh, đảm bảo chúng có liên quan đến nhiệm vụ của bạn và sau đó dán nhãn chính xác cho chúng. 

Quá trình này có thể tốn nhiều thời gian và tài nguyên, đặc biệt là nếu bạn đang thử nghiệm nhiều cách tiếp cận khác nhau trong thời gian ngắn. Ngay cả việc tìm kiếm các tập dữ liệu có sẵn cũng có thể khó khăn, vì chúng thường nằm rải rác trên nhiều nền tảng, không được ghi chép đúng cách hoặc thiếu các chú thích cụ thể mà bạn cần.

Ví dụ, nếu bạn đang xây dựng một ứng dụng thị giác máy tính để phát hiện cỏ dại trên các cánh đồng nông nghiệp, bạn có thể muốn thử nghiệm các phương pháp tiếp cận Vision AI khác nhau, như phát hiện đối tượng so với phân đoạn thể hiện. Điều này cho phép bạn thử nghiệm và tìm ra phương pháp nào hiệu quả nhất trước khi dành thời gian và công sức để thu thập và dán nhãn tập dữ liệu của riêng bạn.

Hình 2. Phát hiện các bộ phận ô tô bằng YOLO11.

Sử dụng tích hợp Roboflow, bạn có thể duyệt qua nhiều tập dữ liệu liên quan đến nông nghiệp, bao gồm các tập dữ liệu tập trung vào phát hiện cỏ dại, sức khỏe cây trồng hoặc giám sát đồng ruộng. Các tập dữ liệu sẵn sàng sử dụng này cho phép bạn thử nghiệm các kỹ thuật khác nhau và tinh chỉnh mô hình của mình mà không cần nỗ lực tạo dữ liệu riêng ngay từ đầu. 

Tích hợp Roboflow hoạt động như thế nào

Bây giờ chúng ta đã thảo luận về cách bạn có thể sử dụng tích hợp Roboflow để tìm đúng tập dữ liệu, hãy cùng xem cách tích hợp này phù hợp với quy trình làm việc của bạn như thế nào. Sau khi bạn đã chọn một tập dữ liệu từ Roboflow Universe, bạn có thể xuất hoặc tải xuống tập dữ liệu đó ở định dạng YOLO11. Sau khi tập dữ liệu của bạn được xuất, bạn có thể sử dụng nó để đào tạo tùy chỉnh YOLO11 bằng gói Ultralytics Python. 

Khi tải xuống tập dữ liệu của bạn, bạn có thể nhận thấy Roboflow Universe cũng hỗ trợ các định dạng khác để đào tạo các mô hình khác nhau. Vậy, tại sao bạn nên chọn đào tạo tùy chỉnh Ultralytics YOLO11? 

YOLO11 là phiên bản mới nhất của các mô hình YOLO của Ultralytics và được xây dựng để cung cấp khả năng phát hiện đối tượng nhanh hơn và chính xác hơn. Nó sử dụng ít hơn 22% tham số (các giá trị nội bộ mà mô hình điều chỉnh trong quá trình đào tạo để đưa ra dự đoán) so với YOLOv8m, nhưng đạt được độ chính xác trung bình (mAP) cao hơn trên tập dữ liệu COCO. Sự cân bằng giữa tốc độ và độ chính xác này khiến YOLO11 trở thành lựa chọn linh hoạt cho nhiều ứng dụng thị giác máy tính, đặc biệt là khi tùy chỉnh các mô hình đào tạo để phù hợp với các tác vụ cụ thể.

Sau đây là cái nhìn sâu hơn về cách thức hoạt động của chương trình đào tạo tùy chỉnh YOLO11 :

  • Cung cấp dữ liệu : Mô hình YOLO11 xử lý tập dữ liệu của bạn, học cách phát hiện và phân loại các đối tượng từ hình ảnh và chú thích của chúng.
  • Dự đoán và phản hồi : Mô hình đưa ra dự đoán về các đối tượng trong hình ảnh và so sánh chúng với câu trả lời đúng có trong tập dữ liệu.
  • Theo dõi hiệu suất : Các số liệu như độ chính xác (phát hiện đúng), khả năng thu hồi (phát hiện bỏ sót) và mất mát (lỗi dự đoán) được theo dõi để đánh giá tiến độ.
  • Học lặp đi lặp lại : Mô hình điều chỉnh các tham số của nó qua nhiều vòng (thời đại) để cải thiện độ chính xác phát hiện và giảm thiểu lỗi.
  • Đầu ra mô hình cuối cùng : Sau khi đào tạo, mô hình được tối ưu hóa sẽ được lưu và sẵn sàng để triển khai.

Các tích hợp khác tập trung vào phát triển thị giác máy tính

Khi bạn khám phá tích hợp Roboflow, bạn sẽ thấy các tích hợp khác được đề cập trong tài liệu Ultralytics . Chúng tôi hỗ trợ nhiều tích hợp liên quan đến nhiều giai đoạn phát triển thị giác máy tính. 

Điều này nhằm cung cấp cho cộng đồng của chúng tôi nhiều lựa chọn để bạn có thể chọn phương án phù hợp nhất với quy trình làm việc cụ thể của mình.

Hình 3. Tổng quan về các tích hợp được Ultralytics hỗ trợ.

Ngoài các tập dữ liệu, các tích hợp khác được Ultralytics hỗ trợ tập trung vào nhiều phần khác nhau của quy trình thị giác máy tính, chẳng hạn như đào tạo, triển khai và tối ưu hóa. Sau đây là một số ví dụ về các tích hợp khác mà chúng tôi hỗ trợ:

  • Tích hợp đào tạo: Các tích hợp như Amazon SageMaker và Paperspace Gradient hợp lý hóa quy trình đào tạo bằng cách cung cấp nền tảng đám mây để phát triển và thử nghiệm mô hình hiệu quả.
  • Tích hợp theo dõi quy trình làm việc và thử nghiệm: ClearML, MLFlow và Weights & Biases (W&B) giúp tự động hóa quy trình làm việc, theo dõi thử nghiệm và cải thiện khả năng cộng tác, giúp quản lý các dự án học máy dễ dàng hơn.
  • Tích hợp tối ưu hóa và triển khai: CoreML, ONNX và OpenVINO cho phép triển khai tối ưu trên nhiều thiết bị và khuôn khổ khác nhau, đảm bảo hiệu suất hiệu quả trên các nền tảng như phần cứng Apple và CPU Intel.
  • Tích hợp giám sát và trực quan hóa: TensorBoard và Weights & Biases cung cấp các công cụ để trực quan hóa tiến trình đào tạo và theo dõi hiệu suất, đưa ra thông tin chi tiết để tinh chỉnh mô hình.

Ứng dụng YOLO11 và vai trò của tích hợp

Các tích hợp hỗ trợ phát triển thị giác máy tính, kết hợp với khả năng đáng tin cậy của YOLO11, giúp giải quyết các thách thức trong thế giới thực dễ dàng hơn. Hãy xem xét các sáng kiến như thị giác máy tính trong sản xuất , nơi AI thị giác được sử dụng để phát hiện các khiếm khuyết trên dây chuyền sản xuất - như vết xước trên các bộ phận kim loại hoặc các thành phần bị thiếu. Việc thu thập dữ liệu phù hợp cho các nhiệm vụ như vậy thường có thể chậm và đầy thách thức, đòi hỏi phải truy cập vào các môi trường chuyên biệt. 

Thông thường, nó bao gồm việc thiết lập máy ảnh hoặc cảm biến dọc theo dây chuyền sản xuất để chụp ảnh sản phẩm. Những hình ảnh này cần được chụp với số lượng lớn, thường dưới ánh sáng và góc độ nhất quán, để đảm bảo độ rõ nét và đồng nhất. 

Sau khi chụp, hình ảnh phải được chú thích tỉ mỉ bằng nhãn chính xác cho mọi loại khuyết tật, chẳng hạn như vết xước, vết lõm hoặc thiếu thành phần. Quá trình này đòi hỏi nhiều thời gian và nguồn lực, cũng như chuyên môn, để đảm bảo tập dữ liệu phản ánh chính xác sự thay đổi trong thế giới thực. Các yếu tố như kích thước, hình dạng và vật liệu khuyết tật khác nhau phải được tính đến để tạo ra một tập dữ liệu mạnh mẽ và đáng tin cậy.

Các tích hợp cung cấp bộ dữ liệu có sẵn giúp thực hiện các tác vụ như kiểm soát chất lượng công nghiệp dễ dàng hơn và với khả năng phát hiện thời gian thực của YOLO11, các nhà sản xuất có thể theo dõi dây chuyền sản xuất, phát hiện lỗi ngay lập tức và cải thiện hiệu quả.

Hình 4. Ví dụ về việc sử dụng Ultralytics YOLO11 để phát hiện và đếm số lượng lon đang được sản xuất.

Ngoài sản xuất, tích hợp liên quan đến tập dữ liệu có thể được sử dụng trong nhiều ngành công nghiệp khác. Bằng cách kết hợp tốc độ và độ chính xác của YOLO11 với các tập dữ liệu dễ truy cập, các doanh nghiệp có thể nhanh chóng phát triển và triển khai các giải pháp phù hợp với nhu cầu cụ thể của họ. Lấy ví dụ, chăm sóc sức khỏe - tích hợp tập dữ liệu có thể giúp phát triển các giải pháp phân tích hình ảnh y tế để phát hiện các bất thường như khối u. Tương tự như vậy, trong lái xe tự động, các tích hợp như vậy có thể giúp xác định phương tiện, người đi bộ và biển báo giao thông để tăng cường an toàn.

Những điểm chính

Việc tìm đúng tập dữ liệu thường là một trong những phần tốn thời gian nhất khi xây dựng mô hình thị giác máy tính. Tuy nhiên, tích hợp Roboflow giúp bạn dễ dàng tìm được tập dữ liệu tốt nhất để đào tạo tùy chỉnh các mô hình YOLO Ultralytics của mình, ngay cả khi bạn mới làm quen với thị giác máy tính. 

Với quyền truy cập vào bộ sưu tập dữ liệu khổng lồ cho các tác vụ thị giác máy tính như phát hiện đối tượng, phân loại hình ảnh hoặc phân đoạn thể hiện, Roboflow Universe giúp bạn thoát khỏi rắc rối trong quá trình khám phá dữ liệu. Nó giúp bạn bắt đầu nhanh chóng và tập trung vào việc xây dựng mô hình của mình thay vì dành thời gian thu thập và sắp xếp dữ liệu. Phương pháp tiếp cận hợp lý này giúp các nhà phát triển tạo nguyên mẫu, lặp lại và phát triển các giải pháp thị giác máy tính hiệu quả hơn.

Để tìm hiểu thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng của chúng tôi. Khám phá những đổi mới trong các lĩnh vực như AI trong xe tự láithị giác máy tính trong nông nghiệp trên các trang giải pháp của chúng tôi. 🚀

Hãy cùng xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của máy học

Bắt đầu miễn phí
Liên kết đã được sao chép vào clipboard