Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Phân loại ảnh

Khám phá phân loại hình ảnh với Ultralytics YOLO : đào tạo các mô hình tùy chỉnh cho chăm sóc sức khỏe, nông nghiệp, bán lẻ, v.v. bằng các công cụ tiên tiến.

Phân loại hình ảnh là một nhiệm vụ cơ bản trong thị giác máy tính (CV) , bao gồm việc gán một nhãn hoặc danh mục duy nhất cho toàn bộ hình ảnh kỹ thuật số dựa trên nội dung trực quan của nó. Quá trình này cho phép máy móc "nhìn thấy" và diễn giải thế giới bằng cách nhận dạng các mẫu, vật thể hoặc cảnh trong dữ liệu trực quan. Là một thành phần cốt lõi của trí tuệ nhân tạo (AI) , nó đóng vai trò là nền tảng cho các hệ thống nhận dạng hình ảnh phức tạp hơn, cho phép các hệ thống tự động phân loại hiệu quả một lượng lớn thông tin hình ảnh.

Cách thức hoạt động của phân loại ảnh

Về mặt kỹ thuật, phân loại hình ảnh dựa trên các thuật toán học máy (ML) , đặc biệt là các mô hình học sâu (DL) được gọi là Mạng Nơ-ron Tích chập (CNN) . Các mạng này được thiết kế để xử lý dữ liệu pixel và tự động trích xuất đặc điểm , xác định các thuộc tính cấp thấp như cạnh và kết cấu ở các lớp đầu và các hình dạng phức tạp ở các lớp sâu hơn.

Quá trình này thường tuân theo phương pháp học có giám sát :

  1. Đào tạo : Mô hình được cung cấp một tập dữ liệu có nhãn, chẳng hạn như ImageNet , chứa hàng nghìn hoặc hàng triệu hình ảnh với các danh mục đã biết.
  2. Học tập : Thông qua truyền ngược , mạng điều chỉnh trọng số mô hình nội bộ của nó để giảm thiểu lỗi dự đoán.
  3. Suy luận : Sau khi được huấn luyện, mô hình có thể phân tích các hình ảnh mới, chưa từng thấy và đưa ra điểm xác suất cho từng lớp bằng hàm softmax . Danh mục có xác suất cao nhất sẽ được gán làm nhãn cuối cùng.

Các nền tảng phổ biến như PyTorchTensorFlow cung cấp các công cụ cần thiết để xây dựng và đào tạo các kiến trúc phức tạp này.

Phân biệt phân loại từ các nhiệm vụ liên quan

Mặc dù phân loại hình ảnh trả lời câu hỏi "Hình ảnh này có gì?", nhưng nó thường bị nhầm lẫn với các tác vụ thị giác máy tính khác. Việc hiểu rõ sự khác biệt này rất quan trọng để lựa chọn công cụ phù hợp cho một dự án:

Các Ứng dụng Thực tế

Phân loại hình ảnh có mặt ở khắp các ngành công nghiệp, thúc đẩy tự động hóa và cải thiện quy trình ra quyết định.

1. Chẩn đoán hình ảnh và chăm sóc sức khỏe

Trong lĩnh vực phân tích hình ảnh y tế , các mô hình phân loại hỗ trợ các bác sĩ X quang bằng cách sàng lọc trước các lần quét. Ví dụ, các thuật toán có thể classify Chụp X-quang ngực hoặc MRI là "bình thường" hoặc "bất thường", đánh dấu các vấn đề tiềm ẩn như viêm phổi hoặc khối u để ưu tiên xem xét. Nghiên cứu của Viện Y tế Quốc gia (NIH) chứng minh AI giúp chẩn đoán bệnh sớm, cải thiện đáng kể kết quả điều trị cho bệnh nhân. Bạn có thể đọc thêm về công trình của chúng tôi trong việc phát hiện khối u bằng YOLO11 .

2. Nông nghiệp thông minh

Nông nghiệp chính xác sử dụng phân loại hình ảnh để theo dõi sức khỏe cây trồng. Máy bay không người lái được trang bị camera sẽ chụp ảnh các cánh đồng, sau đó phân tích để classify Cây trồng được phân loại là khỏe mạnh, thiếu dinh dưỡng hay bị bệnh. Điều này cho phép can thiệp có mục tiêu, giảm sử dụng hóa chất và tăng năng suất. Bộ Nông nghiệp Hoa Kỳ (USDA) nhấn mạnh cách các công nghệ này thúc đẩy các phương pháp canh tác bền vững. Tìm hiểu cách Ultralytics hỗ trợ AI trong nông nghiệp để cách mạng hóa nền nông nghiệp hiện đại.

Thực hiện phân loại với YOLO11

Mặc dù nổi tiếng về khả năng phát hiện, kiến trúc YOLO11 Ultralytics cũng rất hiệu quả cho các tác vụ phân loại hình ảnh . Nó mang lại sự cân bằng giữa tốc độ và độ chính xác, phù hợp cho các ứng dụng thời gian thực.

Đây là một ví dụ ngắn gọn về cách sử dụng một YOLO11 mô hình để classify một hình ảnh sử dụng ultralytics Python bưu kiện:

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Run inference on an external image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Predicted class: {results[0].names[results[0].probs.top1]}")

Đối với người dùng muốn tự tạo giải pháp, bạn có thể huấn luyện các mô hình tùy chỉnh trên các tập dữ liệu cụ thể bằng cùng một API đơn giản. Cho dù bạn đang triển khai trên các thiết bị biên bằng các công cụ như OpenCV hay mở rộng quy mô với cơ sở hạ tầng đám mây, các mô hình phân loại hiện đại đều cung cấp tính linh hoạt cần thiết cho các kịch bản triển khai đa dạng.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay