Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay

Cách sử dụng Ultralytics YOLO11 để phân loại hình ảnh

Abirami Vina

4 phút đọc

11 tháng 11 năm 2024

Tìm hiểu cách thức mới Ultralytics YOLO11 mô hình cải thiện khả năng phân loại hình ảnh, mang lại độ chính xác cao hơn cho các nhiệm vụ trong nông nghiệp, bán lẻ và giám sát động vật hoang dã.

Giả sử một robot đang nhìn vào hai con mèo, một con màu đen và một con màu trắng, và nó cần tìm ra con nào là con nào. Để làm như vậy, nó có thể sử dụng phân loại hình ảnh, một tác vụ thị giác máy tính giúp xác định và phân loại các đối tượng hoặc cảnh trong một hình ảnh. Trên thực tế, nhờ những tiến bộ gần đây trong trí tuệ nhân tạo (AI), phân loại hình ảnh có thể được sử dụng trong nhiều ứng dụng khác nhau, từ giám sát động vật đến sản xuất và nông nghiệp với phát hiện bệnh cây trồng.

Một trong những tiến bộ mới nhất trong phân loại hình ảnhmô hình YOLO11 Ultralytics . Ra mắt tại sự kiện kết hợp thường niên của Ultralytics , YOLO Vision 2024 (YV24) , YOLO11 được thiết kế để xử lý nhiều tác vụ AI thị giác khác nhau, bao gồm phân loại hình ảnh , một cách dễ dàng và chính xác.

Trong bài viết này, chúng ta sẽ tìm hiểu những kiến thức cơ bản về phân loại hình ảnh , thảo luận về các ứng dụng thực tế và hướng dẫn bạn cách sử dụng YOLO11 để phân loại hình ảnh thông qua gói Ultralytics Python . Chúng ta cũng sẽ xem xét cách bạn có thể dùng thử các tính năng của YOLO11 trên Ultralytics HUB chỉ trong vài bước đơn giản. Hãy bắt đầu thôi!

__wf_reserved_inherit
Hình 1. Một ví dụ về việc sử dụng Ultralytics YOLO11 ĐẾN classify một con mèo Ba Tư.

Phân loại ảnh là gì?

Phân loại hình ảnh hoạt động bằng cách gán nhãn hoặc thẻ cho hình ảnh dựa trên các mẫu học được từ các hình ảnh đã được gắn nhãn trước đó. Bằng cách phân tích cẩn thận các điểm ảnh của hình ảnh, mô hình thị giác máy tính có thể tìm ra kết quả khớp nhất với hình ảnh. Các mô hình đáng tin cậy như YOLO11 có thể xử lý quy trình này một cách liền mạch. YOLO11 Kiến trúc mô hình của 's cho phép xử lý hình ảnh hoặc khung hình video gần như ngay lập tức, lý tưởng cho các ứng dụng cần phân loại hình ảnh nhanh và chính xác.

Để thực sự hiểu phạm vi của phân loại ảnh, việc phân biệt nó với các tác vụ khác như phát hiện đối tượng là rất hữu ích. Trong khi phân loại ảnh gán nhãn cho toàn bộ ảnh, thì phát hiện đối tượng xác định và định vị từng đối tượng trong ảnh. 

__wf_reserved_inherit
Hình 2. So sánh giữa phân loại ảnh, phát hiện đối tượng và phân vùng ảnh.

Hãy xem xét một hình ảnh về một con hươu cao cổ. Trong phân loại ảnh, mô hình có thể chỉ đơn giản gán nhãn toàn bộ hình ảnh là một con hươu cao cổ dựa trên nội dung tổng thể của nó. Tuy nhiên, với phát hiện đối tượng, mô hình không chỉ dừng lại ở việc xác định con hươu cao cổ; nó còn đặt một khung giới hạn xung quanh con hươu cao cổ, xác định chính xác vị trí của nó trong ảnh.

Bây giờ, hãy tưởng tượng con hươu cao cổ đang đứng gần một cái cây trong một thảo nguyên với những động vật khác. Một mô hình phân loại ảnh có thể gán nhãn toàn bộ cảnh là thảo nguyên hoặc chỉ là động vật hoang dã. Tuy nhiên, với phát hiện đối tượng, mô hình sẽ xác định từng yếu tố riêng lẻ, nhận ra con hươu cao cổ, cái cây và các động vật khác, mỗi đối tượng có khung giới hạn riêng.

YOLO11 ứng dụng phân loại hình ảnh

Độ chính xác và hiệu suất của Ultralytics YOLO11 Mô hình phân loại hình ảnh giúp nó hữu ích trong nhiều ngành công nghiệp. Hãy cùng khám phá một số ứng dụng chính của YOLO11 trong phân loại hình ảnh.

YOLO11 phân loại hình ảnh trong nông nghiệp

Phân loại hình ảnh có thể giúp đơn giản hóa nhiều chức năng trong ngành nông nghiệp và chăn nuôi. Cụ thể, việc sử dụng các mô hình phân loại hình ảnh như YOLO11 , nông dân có thể liên tục theo dõi sức khỏe của cây trồng của họ, detect các bệnh nghiêm trọng và xác định bất kỳ sự xâm nhập của sâu bệnh nào với độ chính xác cao. 

Đây là cách nó hoạt động:

  • Chụp ảnh: Các thiết bị Internet of Things (IoT) như máy ảnh và máy bay không người lái có thể được triển khai để chụp ảnh cây trồng theo thời gian thực từ nhiều góc độ và vị trí khác nhau trên các cánh đồng.
  • Xử lý: Tùy thuộc vào tài nguyên và khả năng kết nối có sẵn, hình ảnh có thể được xử lý tại chỗ thông qua điện toán biên hoặc tải lên đám mây để phân tích chuyên sâu hơn.
  • Phân loại hình ảnh với YOLO11 : YOLO11 mô hình có thể phân tích những hình ảnh này để classify nhiều điều kiện cây trồng khác nhau. Các loại phổ biến có thể bao gồm cây khỏe mạnh, cây bị bệnh, cây bị sâu bệnh hoặc cây thiếu dinh dưỡng, giúp xác định các vấn đề cụ thể ảnh hưởng đến các khu vực khác nhau của cánh đồng.
  • Tạo ra hiểu biết sâu sắc : Dựa trên các phân loại, YOLO11 cung cấp thông tin chi tiết về các chỉ số sức khỏe cây trồng, giúp nông dân detect dấu hiệu sớm của bệnh, xác định điểm nóng gây hại hoặc phát hiện tình trạng thiếu hụt chất dinh dưỡng .
  • Ra quyết định sáng suốt: Với những thông tin chi tiết này, nông dân có thể đưa ra các quyết định có mục tiêu về tưới tiêu, bón phân và kiểm soát sâu bệnh, chỉ áp dụng các nguồn lực ở những nơi cần thiết nhất.
__wf_reserved_inherit
Hình 3. Một ví dụ về các lớp lá khác nhau từ khỏe mạnh đến bị nhiễm bệnh.

YOLO11 phân loại hình ảnh trong bán lẻ

Phân loại ảnh có thể cải thiện đáng kể trải nghiệm mua sắm bán lẻ, làm cho nó trở nên cá nhân hóa và thân thiện hơn với người dùng. Các nhà bán lẻ có thể sử dụng các mô hình thị giác máy tính được đào tạo tùy chỉnh để nhận dạng các sản phẩm trong kho của họ và tích hợp khả năng này vào các ứng dụng di động hoặc trang web của họ. Sau đó, khách hàng có thể tìm kiếm sản phẩm chỉ bằng cách tải lên ảnh, giúp việc mua sắm nhanh hơn và thuận tiện hơn.

Khi khách hàng tải lên một hình ảnh lên hệ thống tìm kiếm trực quan, một số điều sẽ xảy ra phía sau trước khi kết quả tìm kiếm hiển thị. 

Đầu tiên, phát hiện đối tượng có thể được sử dụng để chọn ra các mục chính trong hình ảnh, như xác định một món quần áo hoặc một món đồ nội thất và tách nó ra khỏi nền. Tiếp theo, phân loại ảnh có thể được sử dụng để phân loại thêm từng mục, nhận ra đó là áo khoác, áo sơ mi, ghế sofa hoặc bàn. 

Với thông tin này, hệ thống có thể hiển thị các sản phẩm tương tự có sẵn để mua, điều này đặc biệt hữu ích để tìm các mặt hàng độc đáo hoặc hợp thời trang mà khó mô tả bằng lời. Công nghệ tương tự cũng có thể giúp hợp lý hóa các tác vụ bán lẻ khác, như quản lý hàng tồn kho, bằng cách tự động nhận dạng và phân loại các mặt hàng.

__wf_reserved_inherit
Hình 4. Nền tảng tìm kiếm trực quan dựa trên phân loại ảnh đang hoạt động.

Giám sát động vật hoang dã với YOLO11 phân loại hình ảnh

Theo truyền thống, việc theo dõi động vật hoang dã là một nhiệm vụ tẻ nhạt, đòi hỏi nhiều người phải phân loại và phân tích thủ công hàng nghìn bức ảnh. Với các chế độ thị giác máy tính như YOLO11 Các nhà nghiên cứu có thể tự động theo dõi động vật nhanh hơn. Camera có thể được đặt trong môi trường sống tự nhiên để chụp ảnh. Mô hình AI thị giác sau đó có thể được sử dụng để phân tích những bức ảnh này và classify các loài động vật trong đó (nếu có). Một hệ thống như vậy có thể giúp các nhà nghiên cứu nghiên cứu và track quần thể động vật, mô hình di cư của chúng, v.v.

Một cách khác AI và các mô hình thị giác máy tính như YOLO11 Một giải pháp có thể giúp ích trong lĩnh vực này là đơn giản hóa quy trình phân loại các loài có nguy cơ tuyệt chủng. Bằng cách xác định các loài hoặc nhóm giống tiềm năng mà một loài động vật có thể thuộc về, các mô hình này có thể cung cấp dữ liệu thiết yếu cho các nhà nghiên cứu. Ví dụ, Đại học Tasmania (UTAS) đã phát triển một hệ thống phân loại hình ảnh để theo dõi các loài động vật hoang dã khác nhau ở Tasmania . Dự đoán từ các mô hình sau đó có thể giúp các nhà khoa học và nhà nghiên cứu theo dõi hoạt động và hành vi của động vật, từ đó có thể báo hiệu các mối đe dọa như săn trộm hoặc mất môi trường sống

__wf_reserved_inherit
Hình 5. YOLO11 dự đoán những giống chó có thể thuộc về.

Thử nghiệm phân loại hình ảnh với YOLO11 người mẫu

Bây giờ chúng ta đã thảo luận về phân loại hình ảnh và khám phá một số ứng dụng của nó. Hãy cùng xem cách bạn có thể thử phân loại hình ảnh với công cụ mới này. YOLO11 mô hình. Có hai cách dễ dàng để bắt đầu: sử dụng gói Ultralytics Python hoặc thông qua Ultralytics HUB . Chúng tôi sẽ hướng dẫn cả hai tùy chọn.

Chạy suy luận bằng cách sử dụng YOLO11

Để bắt đầu với Ultralytics Python gói, chỉ cần cài đặt bằng pip, conda hoặc Docker. Nếu bạn gặp bất kỳ sự cố nào, hãy tham khảo Hướng dẫn Xử lý Sự cố Thường gặp của chúng tôi để biết các mẹo khắc phục sự cố hữu ích.

Sau khi gói được cài đặt, bạn có thể sử dụng mã sau để tải một biến thể của YOLO11 Mô hình phân loại hình ảnh và chạy suy luận trên hình ảnh. Chạy suy luận nghĩa là sử dụng một mô hình đã được đào tạo để đưa ra dự đoán dựa trên dữ liệu mới, chưa từng thấy. Bạn có thể thử nghiệm với hình ảnh tùy chọn!

__wf_reserved_inherit
Hình 6. Chạy suy luận bằng cách sử dụng YOLO11 Người mẫu.

Đào tạo một phong tục YOLO11 mô hình phân loại

Bạn cũng có thể sử dụng tương tự Python gói để đào tạo một tùy chỉnh YOLO11 mô hình phân loại. Đào tạo tùy chỉnh giúp bạn có thể tinh chỉnh YOLO11 mô hình cho nhu cầu cụ thể của bạn. Ví dụ, nếu bạn đang phát triển một ứng dụng để classify các giống mèo khác nhau, bạn có thể huấn luyện riêng YOLO11 mô hình chỉ dành cho mục đích đó.

Mã dưới đây cho thấy cách tải và đào tạo một YOLO11 Mô hình phân loại hình ảnh. Nó cho phép bạn chuyển các trọng số đã được đào tạo trước , sử dụng kiến thức từ một mô hình hiện có để tăng hiệu suất của mô hình của riêng bạn. Bạn có thể chỉ định một tập dữ liệu , chẳng hạn như tập dữ liệu "fashion-mnist", một tập hợp ảnh xám phổ biến về các mặt hàng quần áo (áo sơ mi, quần, giày dép, v.v.). Việc huấn luyện mô hình trên tập dữ liệu này sẽ giúp nó nhận dạng các loại quần áo khác nhau. Bạn có thể thay thế "fashion-mnist" bằng bất kỳ tập dữ liệu nào phù hợp với dự án của mình, chẳng hạn như giống mèo hoặc loại cây.

__wf_reserved_inherit
Hình 7. Đào tạo tùy chỉnh a YOLO11 mô hình phân loại hình ảnh.

Hãy thử YOLO11 TRÊN Ultralytics TRUNG TÂM

Mặc dù sử dụng Ultralytics gói rất đơn giản, nó đòi hỏi một số kiến thức về Python . Nếu bạn đang tìm kiếm một lựa chọn thân thiện hơn với người mới bắt đầu, bạn có thể sử dụng Ultralytics HUB, một nền tảng được thiết kế để thực hiện đào tạo và triển khai khác nhau YOLO Các mô hình đơn giản và dễ tiếp cận. Để bắt đầu, bạn cần tạo một tài khoản .

Sau khi bạn đã đăng nhập, hãy điều hướng đến phần 'Mô hình' và chọn YOLO11 Mô hình phân loại hình ảnh. Bạn sẽ thấy một loạt kích thước mô hình khả dụng: nano, nhỏ, trung bình, lớn và cực lớn. Sau khi chọn mô hình, bạn có thể tải ảnh lên trong phần "Xem trước", nơi các dự đoán sẽ xuất hiện ở bên trái trang sau khi ảnh được xử lý.

__wf_reserved_inherit
Hình 8. Sử dụng Ultralytics HUB để chạy suy luận.

Những điều cần nhớ

YOLO11 cung cấp khả năng phân loại hình ảnh mạnh mẽ, mở ra những khả năng mới trong nhiều ngành công nghiệp khác nhau. Từ việc cải thiện việc giám sát cây trồng trong nông nghiệp và nâng cao khả năng tìm kiếm sản phẩm trong bán lẻ đến việc hỗ trợ bảo tồn động vật hoang dã, YOLO11 Tốc độ và độ chính xác của nó làm cho nó lý tưởng cho các ứng dụng đa dạng. Với các tùy chọn đào tạo tùy chỉnh thông qua Ultralytics Python gói hoặc thiết lập thân thiện với người dùng, không cần mã trên Ultralytics HUB, người dùng có thể dễ dàng kết hợp YOLO11 vào quy trình làm việc của họ. Khi ngày càng nhiều ngành công nghiệp áp dụng các giải pháp AI, YOLO11 cung cấp một công cụ linh hoạt, hiệu suất cao hỗ trợ sự đổi mới và tiến bộ thực tế.

Để khám phá thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tương tác với cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong xe tự láichăm sóc sức khỏe trên các trang giải pháp của chúng tôi. 🚀

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí