Image Classification
Khám phá các nguyên tắc cơ bản về phân loại hình ảnh, từ CNN đến các ứng dụng AI trong thế giới thực. Tìm hiểu cách huấn luyện và triển khai các bộ phân loại hiện đại với Ultralytics YOLO26.
Phân loại hình ảnh là một tác vụ nền tảng trong computer vision (CV), nơi một model machine learning phân tích toàn bộ hình ảnh và gán cho nó một nhãn duy nhất từ một tập hợp các danh mục được xác định trước. Về cơ bản, nó trả lời câu hỏi: "Đối tượng chính của bức ảnh này là gì?" Là một thành phần cốt lõi của artificial intelligence (AI), quy trình này cho phép các hệ thống tự động tổ chức, phân loại và diễn giải dữ liệu hình ảnh trên quy mô lớn. Mặc dù có vẻ đơn giản đối với mắt người, nhưng việc cho phép máy tính nhận diện các mẫu đòi hỏi các thuật toán machine learning (ML) phức tạp để thu hẹp khoảng cách giữa các pixel thô và các khái niệm có ý nghĩa.
Link to this sectionCơ chế đằng sau việc phân loại#
Phân loại hình ảnh hiện đại dựa nhiều vào các kiến trúc deep learning (DL) được gọi là Convolutional Neural Networks (CNNs). Các mạng này được thiết kế để bắt chước cách vỏ não thị giác sinh học xử lý thông tin. Thông qua một quy trình gọi là feature extraction, model học cách nhận diện các thuộc tính cấp thấp như cạnh và kết cấu ở các lớp đầu, cuối cùng kết hợp chúng để nhận diện các hình dạng và đối tượng phức tạp hơn ở các lớp sâu hơn.
Để xây dựng một trình phân loại, các nhà phát triển sử dụng supervised learning, cung cấp cho model một lượng lớn training data chứa các ví dụ đã được dán nhãn. Các tập dữ liệu công khai lớn như ImageNet đã góp phần quan trọng trong việc nâng cao độ chính xác của các hệ thống này. Trong giai đoạn suy luận, model xuất ra một điểm xác suất cho mỗi danh mục, thường sử dụng softmax function để xác định lớp có khả năng xảy ra cao nhất.
Link to this sectionPhân loại so với các tác vụ thị giác khác#
Việc phân biệt phân loại hình ảnh với các khả năng computer vision liên quan là rất quan trọng, vì việc lựa chọn kỹ thuật phụ thuộc vào vấn đề cụ thể:
- Phân loại so với Object Detection: Phân loại gán một nhãn cho toàn bộ hình ảnh. Ngược lại, object detection xác định vị trí của nhiều đối tượng trong một khung cảnh bằng cách vẽ một bounding box xung quanh mỗi đối tượng.
- Phân loại so với Image Segmentation: Trong khi phân loại xem xét bối cảnh toàn cầu, segmentation cung cấp độ chính xác ở cấp độ pixel. Semantic segmentation phân loại từng pixel riêng lẻ, cho phép phân định ranh giới chính xác giữa các đối tượng và nền.
Link to this sectionCác ứng dụng trong thực tế#
Phân loại hình ảnh hỗ trợ rất nhiều real-world AI applications trên nhiều ngành công nghiệp đa dạng:
Link to this sectionChẩn đoán y tế#
Trong lĩnh vực y tế, các model phân loại hỗ trợ các bác sĩ chẩn đoán hình ảnh bằng cách phân tích các kết quả quét chẩn đoán. Các công cụ Medical image analysis có thể nhanh chóng phân loại X-quang hoặc MRI là "bình thường" hoặc "bất thường", hoặc xác định các tình trạng cụ thể như tumor detection, cho phép phân loại bệnh nhân và chẩn đoán nhanh hơn.
Link to this sectionKiểm soát chất lượng trong sản xuất#
Các nhà máy sử dụng hệ thống kiểm tra thị giác tự động để duy trì tiêu chuẩn sản phẩm. Camera trên dây chuyền lắp ráp ghi lại hình ảnh của các linh kiện, và các model phân loại ngay lập tức dán nhãn chúng là "đạt" (pass) hoặc "không đạt" (fail) dựa trên các lỗi có thể nhìn thấy. quality control tự động này đảm bảo rằng chỉ những sản phẩm không lỗi mới đến được giai đoạn đóng gói.
Link to this sectionNông nghiệp thông minh#
Người nông dân tận dụng AI in agriculture để giám sát sức khỏe cây trồng. Bằng cách phân loại hình ảnh được chụp bởi máy bay không người lái hoặc điện thoại thông minh, hệ thống có thể nhận diện các dấu hiệu bệnh tật, thiếu hụt chất dinh dưỡng hoặc sự xâm nhập của sâu bệnh, cho phép các can thiệp precision agriculture có mục tiêu.
Link to this sectionTriển khai phân loại với YOLO26#
Framework Ultralytics YOLO26, mặc dù nổi tiếng với tính năng detection, nhưng cung cấp hiệu suất hiện đại cho image classification tasks. Kiến trúc của nó được tối ưu hóa cho tốc độ và độ chính xác, giúp nó phù hợp cho các ứng dụng thời gian thực.
Dưới đây là một ví dụ ngắn gọn về cách tải một model đã được huấn luyện trước và phân loại hình ảnh bằng cách sử dụng gói Python ultralytics:
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")
# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")Đối với các nhóm muốn tối ưu hóa quy trình làm việc, Ultralytics Platform đơn giản hóa toàn bộ pipeline. Nó cho phép người dùng quản lý classification datasets, thực hiện huấn luyện dựa trên cloud và triển khai model sang nhiều định dạng khác nhau như ONNX hoặc TensorRT mà không cần hạ tầng mã hóa phức tạp.






