Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Tích hợp

Huấn luyện tùy chỉnh Ultralytics YOLO11 với các tập dữ liệu thị giác máy tính

Khám phá cách tích hợp Roboflow có thể đơn giản hóa việc huấn luyện tùy chỉnh Ultralytics YOLO11 bằng cách làm cho các tập dữ liệu thị giác máy tính mã nguồn mở dễ dàng truy cập.

ABAbirami Vina
4 min read
Các ví dụ về tập dữ liệu phát hiện vật thể trên Roboflow Universe

Việc huấn luyện một model thị giác máy tính như Ultralytics YOLO11 thường bao gồm các bước thu thập hình ảnh cho tập dữ liệu, gán nhãn, chuẩn bị dữ liệu và tinh chỉnh model để đáp ứng các yêu cầu cụ thể của bạn. Mặc dù gói Python của Ultralytics giúp các bước này trở nên đơn giản và thân thiện với người dùng, quá trình phát triển AI thị giác vẫn có thể tiêu tốn nhiều thời gian.

Điều này đặc biệt đúng khi bạn đang làm việc với thời hạn gấp rút hoặc phát triển một bản mẫu (prototype). Trong những tình huống như vậy, việc sở hữu các công cụ hoặc tích hợp giúp đơn giản hóa một phần quy trình - chẳng hạn như tối ưu hóa khâu chuẩn bị tập dữ liệu hoặc tự động hóa các tác vụ lặp đi lặp lại - có thể tạo ra sự khác biệt lớn. Bằng cách giảm thiểu thời gian và công sức cần thiết, các giải pháp này giúp bạn tập trung vào việc xây dựng và tinh chỉnh model của mình. Đó chính là những gì mà tích hợp Roboflow mang lại.

Tích hợp Roboflow cho phép bạn dễ dàng truy cập các tập dữ liệu từ Roboflow Universe, một thư viện lớn các tập dữ liệu thị giác máy tính mã nguồn mở. Thay vì mất hàng giờ để thu thập và sắp xếp dữ liệu, bạn có thể nhanh chóng tìm thấy và sử dụng các tập dữ liệu có sẵn để khởi động nhanh quy trình huấn luyện YOLO11 của mình. Tích hợp này giúp cho việc thử nghiệm và lặp lại quá trình phát triển model thị giác máy tính trở nên nhanh chóng và đơn giản hơn nhiều.

Trong bài viết này, chúng ta sẽ tìm hiểu cách tận dụng tích hợp Roboflow để phát triển model nhanh hơn. Hãy cùng bắt đầu!

Link to this sectionRoboflow Universe là gì?#

Roboflow Universe là một nền tảng được duy trì bởi Roboflow, một công ty tập trung vào việc đơn giản hóa quá trình phát triển thị giác máy tính. Nền tảng này bao gồm hơn 350 triệu hình ảnh, 500.000 tập dữ liệu và 100.000 model đã được tinh chỉnh cho các tác vụ như object detection, phân loại hình ảnh và phân đoạn (segmentation). Với sự đóng góp từ các nhà phát triển và nhà nghiên cứu trên toàn thế giới, Roboflow Universe là một trung tâm hợp tác cho bất kỳ ai muốn khởi động nhanh hoặc nâng cao các dự án thị giác máy tính của mình.

Các ví dụ về tập dữ liệu phát hiện đối tượng trên Roboflow Universe

Hình 1. Ví dụ về các tập dữ liệu object detection trên Roboflow Universe.

Roboflow Universe bao gồm các tính năng chính sau:

  • Công cụ khám phá tập dữ liệu: Khám phá, lọc và trực quan hóa các tập dữ liệu để tìm kiếm nhanh các tài nguyên phù hợp với yêu cầu dự án của bạn.
  • Tùy chọn xuất dữ liệu: Xuất dữ liệu sang các định dạng như COCO, YOLO, TFRecord, CSV và nhiều định dạng khác để phù hợp với quy trình làm việc của bạn.
  • Phân tích tập dữ liệu: Nhận thông tin chi tiết về các tập dữ liệu khác nhau với các công cụ phân tích cung cấp khả năng trực quan hóa về phân bổ nhãn, sự mất cân bằng lớp và chất lượng tập dữ liệu.
  • Theo dõi phiên bản: Xem và truy cập các phiên bản khác nhau của các tập dữ liệu do những người đóng góp tải lên, cho phép bạn theo dõi các bản cập nhật, so sánh các thay đổi và chọn phiên bản phù hợp nhất với nhu cầu dự án của bạn.

Link to this sectionTích hợp Roboflow giúp bạn tìm kiếm dữ liệu phù hợp#

Tìm kiếm tập dữ liệu phù hợp thường là một trong những phần thách thức nhất của việc xây dựng một model thị giác máy tính. Tạo một tập dữ liệu thường bao gồm việc thu thập một lượng lớn hình ảnh, đảm bảo chúng liên quan đến tác vụ của bạn và sau đó gắn nhãn chúng một cách chính xác.

Quá trình này có thể chiếm rất nhiều thời gian và tài nguyên, đặc biệt nếu bạn đang thử nghiệm với các phương pháp tiếp cận khác nhau trong một khoảng thời gian ngắn. Ngay cả việc tìm kiếm các tập dữ liệu có sẵn cũng có thể khó khăn vì chúng thường nằm rải rác trên các nền tảng, không được ghi tài liệu đầy đủ hoặc thiếu các chú thích cụ thể mà bạn cần.

Ví dụ, nếu bạn đang xây dựng một ứng dụng thị giác máy tính để phát hiện cỏ dại trên các cánh đồng nông nghiệp, bạn có thể muốn thử nghiệm các phương pháp AI thị giác khác nhau, như object detection so với instance segmentation. Điều này cho phép bạn thử nghiệm và tìm ra phương pháp nào hoạt động tốt nhất trước khi tốn thời gian và công sức để thu thập và tự gắn nhãn cho tập dữ liệu của riêng mình.

Phát hiện phụ tùng ô tô sử dụng YOLO11

Hình 2. Phát hiện phụ tùng ô tô sử dụng YOLO11.

Sử dụng tích hợp Roboflow, bạn có thể duyệt qua nhiều tập dữ liệu liên quan đến nông nghiệp, bao gồm các tập dữ liệu tập trung vào phát hiện cỏ dại, sức khỏe cây trồng hoặc giám sát đồng ruộng. Những tập dữ liệu sẵn sàng để sử dụng này cho phép bạn thử nghiệm các kỹ thuật khác nhau và tinh chỉnh model của mình mà không cần nỗ lực ban đầu để tạo ra dữ liệu của riêng bạn.

Link to this sectionCách thức hoạt động của tích hợp Roboflow#

Bây giờ chúng ta đã thảo luận về cách bạn có thể sử dụng tích hợp Roboflow để tìm kiếm các tập dữ liệu phù hợp, hãy xem cách nó khớp với quy trình làm việc của bạn. Sau khi đã chọn một tập dữ liệu từ Roboflow Universe, bạn có thể xuất hoặc tải xuống tập dữ liệu đó ở định dạng YOLO11. Sau khi tập dữ liệu của bạn được xuất, bạn có thể sử dụng nó để huấn luyện tùy chỉnh YOLO11 bằng gói Python của Ultralytics.

Trong khi tải xuống tập dữ liệu của mình, bạn có thể nhận thấy rằng Roboflow Universe cũng hỗ trợ các định dạng khác để huấn luyện các model khác nhau. Vậy tại sao bạn nên chọn huấn luyện tùy chỉnh Ultralytics YOLO11?

YOLO11 là phiên bản mới nhất của các model Ultralytics YOLO và được xây dựng để mang lại khả năng object detection nhanh hơn và chính xác hơn. Nó sử dụng ít hơn 22% tham số (các giá trị nội bộ mà model điều chỉnh trong quá trình huấn luyện để đưa ra dự đoán) so với YOLOv8m, nhưng lại đạt được mean average precision (mAP) cao hơn trên tập dữ liệu COCO. Sự cân bằng giữa tốc độ và độ chính xác này giúp YOLO11 trở thành một lựa chọn linh hoạt cho nhiều ứng dụng thị giác máy tính, đặc biệt là khi huấn luyện tùy chỉnh các model để phù hợp với các tác vụ cụ thể.

Dưới đây là cái nhìn sâu hơn về cách huấn luyện tùy chỉnh YOLO11 hoạt động:

  • Nạp dữ liệu (Data feeding): Model YOLO11 xử lý tập dữ liệu của bạn, học cách phát hiện và phân loại các đối tượng từ hình ảnh và chú thích của chúng.
  • Dự đoán và phản hồi: Model đưa ra các dự đoán về các đối tượng trong hình ảnh và so sánh chúng với các câu trả lời chính xác được cung cấp trong tập dữ liệu.
  • Theo dõi hiệu suất: Các chỉ số như độ chính xác (precision - phát hiện đúng), recall (phát hiện bị bỏ lỡ) và mất mát (loss - lỗi dự đoán) được theo dõi để đánh giá tiến độ.
  • Học lặp lại: Model điều chỉnh các tham số của nó qua nhiều vòng (epochs) để cải thiện độ chính xác phát hiện và giảm thiểu lỗi.
  • Kết quả model cuối cùng: Sau khi huấn luyện, model đã được tối ưu hóa sẽ được lưu lại và sẵn sàng để triển khai.

Link to this sectionCác tích hợp khác tập trung vào phát triển thị giác máy tính#

Khi bạn khám phá tích hợp Roboflow, bạn sẽ nhận thấy các tích hợp khác được đề cập trong tài liệu của Ultralytics. Chúng tôi hỗ trợ nhiều tích hợp liên quan đến các giai đoạn khác nhau của quá trình phát triển thị giác máy tính.

Điều này nhằm cung cấp cho cộng đồng của chúng tôi nhiều lựa chọn, để bạn có thể chọn phương án hiệu quả nhất cho quy trình làm việc cụ thể của mình.

Tổng quan về các tích hợp được hỗ trợ bởi Ultralytics

Hình 3. Tổng quan về các tích hợp được hỗ trợ bởi Ultralytics.

Ngoài các tập dữ liệu, các tích hợp được Ultralytics hỗ trợ khác tập trung vào các phần khác nhau của quy trình thị giác máy tính, như huấn luyện, triển khai và tối ưu hóa. Dưới đây là một vài ví dụ về các tích hợp khác mà chúng tôi hỗ trợ:

  • Tích hợp huấn luyện: Các tích hợp như Amazon SageMaker và Paperspace Gradient giúp tối ưu hóa quy trình huấn luyện bằng cách cung cấp các nền tảng dựa trên đám mây để phát triển và thử nghiệm model hiệu quả.
  • Tích hợp theo dõi quy trình và thí nghiệm: ClearML, MLflow và Weights & Biases (W&B) giúp tự động hóa quy trình làm việc, theo dõi thí nghiệm và cải thiện sự hợp tác, giúp việc quản lý các dự án học máy trở nên dễ dàng hơn.
  • Tích hợp tối ưu hóa và triển khai: CoreML, ONNX và OpenVINO cho phép triển khai được tối ưu hóa trên nhiều thiết bị và framework khác nhau, đảm bảo hiệu suất hiệu quả trên các nền tảng như phần cứng của Apple và các CPU của Intel.
  • Tích hợp giám sát và trực quan hóa: TensorBoard và Weights & Biases cung cấp các công cụ để trực quan hóa tiến trình huấn luyện và giám sát hiệu suất, mang lại thông tin chi tiết để tinh chỉnh model.

Link to this sectionCác ứng dụng của YOLO11 và vai trò của các tích hợp#

Các tích hợp hỗ trợ phát triển thị giác máy tính, kết hợp với khả năng đáng tin cậy của YOLO11, giúp giải quyết các thách thức trong thế giới thực dễ dàng hơn. Hãy cân nhắc các đổi mới như thị giác máy tính trong sản xuất, nơi AI thị giác được sử dụng để phát hiện lỗi trên dây chuyền sản xuất - như các vết trầy xước trên các bộ phận kim loại hoặc các linh kiện bị thiếu. Việc thu thập dữ liệu phù hợp cho các tác vụ như vậy thường có thể chậm và khó khăn, đòi hỏi quyền truy cập vào các môi trường chuyên biệt.

Quá trình này thường bao gồm việc lắp đặt camera hoặc cảm biến dọc theo dây chuyền sản xuất để chụp hình ảnh sản phẩm. Những hình ảnh này cần được chụp với số lượng lớn, thường dưới ánh sáng và góc độ nhất định, để đảm bảo độ rõ nét và tính đồng nhất.

Sau khi chụp, hình ảnh phải được gắn nhãn tỉ mỉ với các nhãn chính xác cho từng loại lỗi, chẳng hạn như vết xước, vết móp hoặc các linh kiện bị thiếu. Quá trình này đòi hỏi thời gian, tài nguyên và chuyên môn đáng kể để đảm bảo tập dữ liệu phản ánh chính xác sự biến đổi trong thế giới thực. Các yếu tố như kích thước, hình dạng và vật liệu của lỗi phải được tính đến để tạo ra một tập dữ liệu mạnh mẽ và đáng tin cậy.

Các tích hợp cung cấp các tập dữ liệu làm sẵn giúp hỗ trợ các tác vụ như kiểm soát chất lượng công nghiệp, và với khả năng phát hiện theo thời gian thực của YOLO11, các nhà sản xuất có thể giám sát dây chuyền sản xuất, phát hiện lỗi ngay lập tức và cải thiện hiệu quả.

Sử dụng YOLO11 để phát hiện và đếm số lượng lon đang được sản xuất

Hình 4. Một ví dụ về việc sử dụng Ultralytics YOLO11 để phát hiện và đếm các lon đang được sản xuất.

Ngoài lĩnh vực sản xuất, các tích hợp liên quan đến tập dữ liệu có thể được sử dụng trong nhiều ngành công nghiệp khác. Bằng cách kết hợp tốc độ và độ chính xác của YOLO11 với các tập dữ liệu dễ dàng tiếp cận, các doanh nghiệp có thể nhanh chóng phát triển và triển khai các giải pháp phù hợp với nhu cầu cụ thể của họ. Ví dụ, trong y tế - các tích hợp tập dữ liệu có thể giúp phát triển các giải pháp để phân tích hình ảnh y tế nhằm phát hiện các bất thường như khối u. Tương tự, trong lĩnh vực lái xe tự động, các tích hợp như vậy có thể hỗ trợ việc nhận dạng phương tiện, người đi bộ và biển báo giao thông để tăng cường an toàn.

Link to this sectionCác điểm chính cần lưu ý#

Tìm kiếm tập dữ liệu phù hợp thường là một trong những phần tiêu tốn nhiều thời gian nhất của việc xây dựng một model thị giác máy tính. Tuy nhiên, tích hợp Roboflow giúp việc tìm kiếm tập dữ liệu tốt nhất để huấn luyện tùy chỉnh các model Ultralytics YOLO của bạn trở nên dễ dàng hơn, ngay cả khi bạn mới làm quen với thị giác máy tính.

Với quyền truy cập vào một bộ sưu tập khổng lồ các tập dữ liệu cho các tác vụ thị giác máy tính như object detection, phân loại hình ảnh hoặc instance segmentation, Roboflow Universe loại bỏ những rắc rối trong quá trình tìm kiếm dữ liệu. Nó giúp bạn bắt đầu nhanh chóng và tập trung vào việc xây dựng model thay vì tốn thời gian thu thập và sắp xếp dữ liệu. Cách tiếp cận hợp lý này trao quyền cho các nhà phát triển tạo mẫu, lặp lại và phát triển các giải pháp thị giác máy tính một cách hiệu quả hơn.

Để tìm hiểu thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia cùng cộng đồng của chúng tôi. Khám phá các đổi mới trong các lĩnh vực như AI trong xe tự láithị giác máy tính trong nông nghiệp trên các trang giải pháp của chúng tôi. 🚀

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning