Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Cách sử dụng Ultralytics YOLO11 để phân loại ảnh

Abirami Vina

4 phút đọc

11 tháng 11 năm 2024

Tìm hiểu cách mô hình Ultralytics YOLO11 mới cải thiện khả năng phân loại hình ảnh, mang lại độ chính xác tốt hơn cho các tác vụ trong nông nghiệp, bán lẻ và giám sát động vật hoang dã.

Giả sử một robot đang nhìn vào hai con mèo, một con màu đen và một con màu trắng, và nó cần tìm ra con nào là con nào. Để làm như vậy, nó có thể sử dụng phân loại hình ảnh, một tác vụ thị giác máy tính giúp xác định và phân loại các đối tượng hoặc cảnh trong một hình ảnh. Trên thực tế, nhờ những tiến bộ gần đây trong trí tuệ nhân tạo (AI), phân loại hình ảnh có thể được sử dụng trong nhiều ứng dụng khác nhau, từ giám sát động vật đến sản xuất và nông nghiệp với phát hiện bệnh cây trồng.

Một trong những tiến bộ mới nhất trong phân loại hình ảnhmô hình Ultralytics YOLO11. Được ra mắt tại sự kiện kết hợp thường niên của Ultralytics, YOLO Vision 2024 (YV24), YOLO11 được thiết kế để giải quyết nhiều tác vụ Vision AI, bao gồm phân loại hình ảnh, một cách dễ dàng và chính xác.

Trong bài viết này, chúng ta sẽ khám phá các nguyên tắc cơ bản của phân loại hình ảnh, thảo luận về các ứng dụng thực tế và chỉ cho bạn cách bạn có thể sử dụng YOLO11 để phân loại hình ảnh thông qua gói Ultralytics Python. Chúng ta cũng sẽ xem xét cách bạn có thể dùng thử các khả năng của YOLO11 trên Ultralytics HUB chỉ trong một vài bước đơn giản. Hãy bắt đầu!

__wf_reserved_inherit
Hình 1. Một ví dụ về việc sử dụng Ultralytics YOLO11 để phân loại một con mèo Ba Tư.

Phân loại ảnh là gì?

Phân loại ảnh hoạt động bằng cách gán nhãn hoặc thẻ cho một ảnh dựa trên các mẫu đã học từ những ảnh được gắn nhãn trước đó. Bằng cách phân tích cẩn thận các pixel của một ảnh, một mô hình thị giác máy tính có thể tìm thấy kết quả phù hợp nhất cho ảnh đó. Các mô hình đáng tin cậy như YOLO11 có thể xử lý quy trình này một cách liền mạch. Kiến trúc mô hình của YOLO11 cho phép xử lý ảnh hoặc khung hình video gần như ngay lập tức, khiến nó trở nên lý tưởng cho các ứng dụng cần phân loại ảnh nhanh chóng và chính xác.

Để thực sự hiểu phạm vi của phân loại ảnh, việc phân biệt nó với các tác vụ khác như phát hiện đối tượng là rất hữu ích. Trong khi phân loại ảnh gán nhãn cho toàn bộ ảnh, thì phát hiện đối tượng xác định và định vị từng đối tượng trong ảnh. 

__wf_reserved_inherit
Hình 2. So sánh giữa phân loại ảnh, phát hiện đối tượng và phân vùng ảnh.

Hãy xem xét một hình ảnh về một con hươu cao cổ. Trong phân loại ảnh, mô hình có thể chỉ đơn giản gán nhãn toàn bộ hình ảnh là một con hươu cao cổ dựa trên nội dung tổng thể của nó. Tuy nhiên, với phát hiện đối tượng, mô hình không chỉ dừng lại ở việc xác định con hươu cao cổ; nó còn đặt một khung giới hạn xung quanh con hươu cao cổ, xác định chính xác vị trí của nó trong ảnh.

Bây giờ, hãy tưởng tượng con hươu cao cổ đang đứng gần một cái cây trong một thảo nguyên với những động vật khác. Một mô hình phân loại ảnh có thể gán nhãn toàn bộ cảnh là thảo nguyên hoặc chỉ là động vật hoang dã. Tuy nhiên, với phát hiện đối tượng, mô hình sẽ xác định từng yếu tố riêng lẻ, nhận ra con hươu cao cổ, cái cây và các động vật khác, mỗi đối tượng có khung giới hạn riêng.

Các ứng dụng phân loại ảnh YOLO11

Độ chính xác và hiệu suất của mô hình Ultralytics YOLO11 cho phân loại ảnh làm cho nó hữu ích trong nhiều ngành công nghiệp. Hãy khám phá một số ứng dụng chính của YOLO11 trong phân loại ảnh.

Phân loại ảnh YOLO11 trong nông nghiệp

Phân loại ảnh có thể giúp hợp lý hóa nhiều chức năng trong ngành nông nghiệp và trồng trọt. Đặc biệt, bằng cách sử dụng các mô hình phân loại ảnh như YOLO11, nông dân có thể liên tục theo dõi sức khỏe của cây trồng, phát hiện các bệnh nghiêm trọng và xác định bất kỳ sự phá hoại của sâu bệnh nào với độ chính xác cao. 

Đây là cách nó hoạt động:

  • Chụp ảnh: Các thiết bị Internet of Things (IoT) như máy ảnh và máy bay không người lái có thể được triển khai để chụp ảnh cây trồng theo thời gian thực từ nhiều góc độ và vị trí khác nhau trên các cánh đồng.
  • Xử lý: Tùy thuộc vào tài nguyên và khả năng kết nối có sẵn, hình ảnh có thể được xử lý tại chỗ thông qua điện toán biên hoặc tải lên đám mây để phân tích chuyên sâu hơn.
  • Phân loại ảnh với YOLO11: Mô hình YOLO11 có thể phân tích những hình ảnh này để phân loại các tình trạng cây trồng khác nhau. Các lớp phổ biến có thể bao gồm khỏe mạnh, bệnh tật, bị sâu bệnh hoặc thiếu chất dinh dưỡng, giúp xác định các vấn đề cụ thể ảnh hưởng đến các khu vực khác nhau của cánh đồng.
  • Tạo thông tin chi tiết: Dựa trên các phân loại, YOLO11 cung cấp thông tin chi tiết về các chỉ số sức khỏe cây trồng, giúp nông dân phát hiện sớm các dấu hiệu bệnh tật, xác định các điểm nóng sâu bệnh hoặc phát hiện sự thiếu hụt chất dinh dưỡng.
  • Ra quyết định sáng suốt: Với những thông tin chi tiết này, nông dân có thể đưa ra các quyết định có mục tiêu về tưới tiêu, bón phân và kiểm soát sâu bệnh, chỉ áp dụng các nguồn lực ở những nơi cần thiết nhất.
__wf_reserved_inherit
Hình 3. Một ví dụ về các lớp lá khác nhau từ khỏe mạnh đến bị nhiễm bệnh.

Phân loại ảnh YOLO11 trong bán lẻ

Phân loại ảnh có thể cải thiện đáng kể trải nghiệm mua sắm bán lẻ, làm cho nó trở nên cá nhân hóa và thân thiện hơn với người dùng. Các nhà bán lẻ có thể sử dụng các mô hình thị giác máy tính được đào tạo tùy chỉnh để nhận dạng các sản phẩm trong kho của họ và tích hợp khả năng này vào các ứng dụng di động hoặc trang web của họ. Sau đó, khách hàng có thể tìm kiếm sản phẩm chỉ bằng cách tải lên ảnh, giúp việc mua sắm nhanh hơn và thuận tiện hơn.

Khi khách hàng tải lên một hình ảnh lên hệ thống tìm kiếm trực quan, một số điều sẽ xảy ra phía sau trước khi kết quả tìm kiếm hiển thị. 

Đầu tiên, phát hiện đối tượng có thể được sử dụng để chọn ra các mục chính trong hình ảnh, như xác định một món quần áo hoặc một món đồ nội thất và tách nó ra khỏi nền. Tiếp theo, phân loại ảnh có thể được sử dụng để phân loại thêm từng mục, nhận ra đó là áo khoác, áo sơ mi, ghế sofa hoặc bàn. 

Với thông tin này, hệ thống có thể hiển thị các sản phẩm tương tự có sẵn để mua, điều này đặc biệt hữu ích để tìm các mặt hàng độc đáo hoặc hợp thời trang mà khó mô tả bằng lời. Công nghệ tương tự cũng có thể giúp hợp lý hóa các tác vụ bán lẻ khác, như quản lý hàng tồn kho, bằng cách tự động nhận dạng và phân loại các mặt hàng.

__wf_reserved_inherit
Hình 4. Nền tảng tìm kiếm trực quan dựa trên phân loại ảnh đang hoạt động.

Giám sát động vật hoang dã bằng phân loại ảnh YOLO11

Theo truyền thống, việc giám sát động vật trong tự nhiên là một nhiệm vụ tẻ nhạt liên quan đến nhiều người phải tự phân loại và phân tích hàng ngàn bức ảnh. Với các chế độ thị giác máy tính như YOLO11, các nhà nghiên cứu có thể tự động giám sát động vật với tốc độ nhanh hơn. Máy ảnh có thể được đặt trong môi trường sống tự nhiên để chụp ảnh. Sau đó, mô hình AI thị giác có thể được sử dụng để phân tích những bức ảnh này và phân loại các động vật trong đó (nếu có). Một hệ thống như vậy có thể giúp các nhà nghiên cứu nghiên cứu và theo dõi quần thể động vật, các kiểu di cư của chúng, v.v.

Một ứng dụng khác của AI và các mô hình thị giác máy tính như YOLO11 trong lĩnh vực này là đơn giản hóa quy trình phân loại các loài có nguy cơ tuyệt chủng. Bằng cách xác định các loài tiềm năng hoặc các nhóm giống mà một con vật có thể thuộc về, các mô hình này có thể cung cấp dữ liệu thiết yếu cho các nhà nghiên cứu. Ví dụ: Đại học Tasmania (UTAS) đã phát triển một hệ thống dựa trên phân loại hình ảnh để theo dõi các loài động vật hoang dã ở Tasmania khác nhau. Các dự đoán từ các mô hình sau đó có thể giúp các nhà khoa học và nhà nghiên cứu theo dõi hoạt động và hành vi của động vật, những dấu hiệu có thể báo hiệu các mối đe dọa như săn trộm hoặc mất môi trường sống

__wf_reserved_inherit
Hình 5. YOLO11 dự đoán các giống chó có thể có của một con chó.

Thử nghiệm phân loại hình ảnh với mô hình YOLO11

Bây giờ chúng ta đã thảo luận về phân loại hình ảnh là gì và khám phá một số ứng dụng của nó. Hãy xem cách bạn có thể thử phân loại hình ảnh với mô hình YOLO11 mới. Có hai cách dễ dàng để bắt đầu: sử dụng gói Ultralytics Python hoặc thông qua Ultralytics HUB. Chúng ta sẽ xem xét cả hai tùy chọn.

Chạy suy luận bằng YOLO11

Để bắt đầu với gói Ultralytics Python, chỉ cần cài đặt nó bằng pip, conda hoặc Docker. Nếu bạn gặp bất kỳ sự cố nào, hãy xem Hướng dẫn về các sự cố thường gặp của chúng tôi để biết các mẹo khắc phục sự cố hữu ích.

Sau khi cài đặt gói, bạn có thể sử dụng đoạn mã sau để tải một biến thể của mô hình phân loại hình ảnh YOLO11 và chạy suy luận trên một hình ảnh. Chạy suy luận có nghĩa là sử dụng một mô hình đã được huấn luyện để đưa ra dự đoán trên dữ liệu mới, chưa từng thấy. Bạn có thể thử với một hình ảnh bạn chọn!

__wf_reserved_inherit
Hình 6. Chạy suy luận bằng Mô hình YOLO11.

Huấn luyện mô hình phân loại YOLO11 tùy chỉnh

Bạn cũng có thể sử dụng cùng một gói Python để huấn luyện một mô hình phân loại YOLO11 tùy chỉnh. Huấn luyện tùy chỉnh cho phép bạn tinh chỉnh một mô hình YOLO11 cho các nhu cầu cụ thể của bạn. Ví dụ: nếu bạn đang phát triển một ứng dụng để phân loại các giống mèo khác nhau, bạn có thể huấn luyện tùy chỉnh một mô hình YOLO11 chỉ cho mục đích đó.

Đoạn mã dưới đây cho thấy cách tải và huấn luyện một mô hình phân loại hình ảnh YOLO11. Nó cho phép bạn chuyển giao các trọng số đã được huấn luyện trước, sử dụng kiến thức từ một mô hình hiện có để tăng hiệu suất cho mô hình của riêng bạn. Bạn có thể chỉ định một tập dữ liệu, như tập dữ liệu "fashion-mnist", là một tập hợp nổi tiếng gồm các hình ảnh thang độ xám về các mặt hàng quần áo (áo sơ mi, quần, giày, v.v.). Huấn luyện mô hình trên tập dữ liệu này dạy nó nhận biết các loại quần áo khác nhau. Bạn có thể thay thế "fashion-mnist" bằng bất kỳ tập dữ liệu nào phù hợp với dự án của bạn, chẳng hạn như các giống mèo hoặc các loại cây.

__wf_reserved_inherit
Hình 7. Huấn luyện tùy chỉnh một mô hình YOLO11 để phân loại hình ảnh.

Dùng thử YOLO11 trên Ultralytics HUB

Mặc dù việc sử dụng gói Ultralytics rất đơn giản, nhưng nó đòi hỏi một số kiến thức về Python. Nếu bạn đang tìm kiếm một tùy chọn thân thiện với người mới bắt đầu hơn, bạn có thể sử dụng Ultralytics HUB, một nền tảng được thiết kế để giúp việc huấn luyện và triển khai các mô hình YOLO khác nhau trở nên đơn giản và dễ tiếp cận. Để bắt đầu, bạn cần tạo một tài khoản.

Sau khi đăng nhập, hãy điều hướng đến phần 'Models' và chọn mô hình YOLO11 để phân loại hình ảnh. Bạn sẽ thấy một loạt các kích thước mô hình có sẵn: nano, small, medium, large và extra-large. Sau khi chọn một mô hình, bạn có thể tải lên một hình ảnh trong phần 'Preview', nơi các dự đoán sẽ xuất hiện ở phía bên trái của trang sau khi hình ảnh được xử lý.

__wf_reserved_inherit
Hình 8. Sử dụng Ultralytics HUB để chạy suy luận.

Những điều cần nhớ

YOLO11 cung cấp các khả năng phân loại hình ảnh mạnh mẽ, mở ra những khả năng mới trong nhiều ngành công nghiệp khác nhau. Từ việc cải thiện giám sát cây trồng trong nông nghiệp và nâng cao tìm kiếm sản phẩm trong bán lẻ đến hỗ trợ bảo tồn động vật hoang dã, tốc độ và độ chính xác của YOLO11 làm cho nó trở nên lý tưởng cho các ứng dụng đa dạng. Với các tùy chọn để huấn luyện tùy chỉnh thông qua gói Ultralytics Python hoặc thiết lập không cần mã, thân thiện với người dùng trên Ultralytics HUB, người dùng có thể dễ dàng kết hợp YOLO11 vào quy trình làm việc của họ. Khi ngày càng có nhiều ngành công nghiệp chấp nhận các giải pháp AI, YOLO11 cung cấp một công cụ linh hoạt, hiệu suất cao, hỗ trợ sự đổi mới và tiến bộ thực tế.

Để khám phá thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tương tác với cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong xe tự láichăm sóc sức khỏe trên các trang giải pháp của chúng tôi. 🚀

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard