Khám phá phân loại hình ảnh với Ultralytics YOLO : đào tạo các mô hình tùy chỉnh cho chăm sóc sức khỏe, nông nghiệp, bán lẻ, v.v. bằng các công cụ tiên tiến.
Phân loại hình ảnh là một nhiệm vụ cơ bản trong thị giác máy tính (CV) , bao gồm việc gán một nhãn hoặc danh mục duy nhất cho toàn bộ hình ảnh kỹ thuật số dựa trên nội dung trực quan của nó. Quá trình này cho phép máy móc "nhìn thấy" và diễn giải thế giới bằng cách nhận dạng các mẫu, vật thể hoặc cảnh trong dữ liệu trực quan. Là một thành phần cốt lõi của trí tuệ nhân tạo (AI) , nó đóng vai trò là nền tảng cho các hệ thống nhận dạng hình ảnh phức tạp hơn, cho phép các hệ thống tự động phân loại hiệu quả một lượng lớn thông tin hình ảnh.
Về mặt kỹ thuật, phân loại hình ảnh dựa trên các thuật toán học máy (ML) , đặc biệt là các mô hình học sâu (DL) được gọi là Mạng Nơ-ron Tích chập (CNN) . Các mạng này được thiết kế để xử lý dữ liệu pixel và tự động trích xuất đặc điểm , xác định các thuộc tính cấp thấp như cạnh và kết cấu ở các lớp đầu và các hình dạng phức tạp ở các lớp sâu hơn.
Quá trình này thường tuân theo phương pháp học có giám sát :
Các nền tảng phổ biến như PyTorch và TensorFlow cung cấp các công cụ cần thiết để xây dựng và đào tạo các kiến trúc phức tạp này.
Mặc dù phân loại hình ảnh trả lời câu hỏi "Hình ảnh này có gì?", nhưng nó thường bị nhầm lẫn với các tác vụ thị giác máy tính khác. Việc hiểu rõ sự khác biệt này rất quan trọng để lựa chọn công cụ phù hợp cho một dự án:
Phân loại hình ảnh có mặt ở khắp các ngành công nghiệp, thúc đẩy tự động hóa và cải thiện quy trình ra quyết định.
Trong lĩnh vực phân tích hình ảnh y tế , các mô hình phân loại hỗ trợ các bác sĩ X quang bằng cách sàng lọc trước các lần quét. Ví dụ, các thuật toán có thể classify Chụp X-quang ngực hoặc MRI là "bình thường" hoặc "bất thường", đánh dấu các vấn đề tiềm ẩn như viêm phổi hoặc khối u để ưu tiên xem xét. Nghiên cứu của Viện Y tế Quốc gia (NIH) chứng minh AI giúp chẩn đoán bệnh sớm, cải thiện đáng kể kết quả điều trị cho bệnh nhân. Bạn có thể đọc thêm về công trình của chúng tôi trong việc phát hiện khối u bằng YOLO11 .
Nông nghiệp chính xác sử dụng phân loại hình ảnh để theo dõi sức khỏe cây trồng. Máy bay không người lái được trang bị camera sẽ chụp ảnh các cánh đồng, sau đó phân tích để classify Cây trồng được phân loại là khỏe mạnh, thiếu dinh dưỡng hay bị bệnh. Điều này cho phép can thiệp có mục tiêu, giảm sử dụng hóa chất và tăng năng suất. Bộ Nông nghiệp Hoa Kỳ (USDA) nhấn mạnh cách các công nghệ này thúc đẩy các phương pháp canh tác bền vững. Tìm hiểu cách Ultralytics hỗ trợ AI trong nông nghiệp để cách mạng hóa nền nông nghiệp hiện đại.
Mặc dù nổi tiếng về khả năng phát hiện, kiến trúc YOLO11 Ultralytics cũng rất hiệu quả cho các tác vụ phân loại hình ảnh . Nó mang lại sự cân bằng giữa tốc độ và độ chính xác, phù hợp cho các ứng dụng thời gian thực.
Đây là một ví dụ ngắn gọn về cách sử dụng một YOLO11 mô hình để classify một hình ảnh sử dụng
ultralytics Python bưu kiện:
from ultralytics import YOLO
# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Run inference on an external image URL
results = model("https://ultralytics.com/images/bus.jpg")
# Print the top predicted class name
print(f"Predicted class: {results[0].names[results[0].probs.top1]}")
Đối với người dùng muốn tự tạo giải pháp, bạn có thể huấn luyện các mô hình tùy chỉnh trên các tập dữ liệu cụ thể bằng cùng một API đơn giản. Cho dù bạn đang triển khai trên các thiết bị biên bằng các công cụ như OpenCV hay mở rộng quy mô với cơ sở hạ tầng đám mây, các mô hình phân loại hiện đại đều cung cấp tính linh hoạt cần thiết cho các kịch bản triển khai đa dạng.