Image Classification

探索图像分类的基础知识，从 CNN 到现实世界的 AI 用例。学习使用 Ultralytics YOLO26 训练和部署最先进的分类器。

图像分类是计算机视觉 (CV) 中的一项基础任务，机器学习模型会分析整张图像，并从预定义的类别集合中为其分配一个单一标签。简单来说，它回答了“这张图片的主要主体是什么？”这一问题。作为人工智能 (AI) 的核心组成部分，这一过程使自动化系统能够大规模地组织、分类和解读视觉数据。虽然对人眼来说似乎很简单，但要让计算机识别模式，需要复杂的机器学习 (ML) 算法来跨越原始像素与有意义概念之间的鸿沟。

Link to this section分类背后的机制#

Modern image classification relies heavily on deep learning (DL) architectures known as Convolutional Neural Networks (CNNs). These networks are designed to mimic the way the biological visual cortex processes information. Through a process called feature extraction, the model learns to identify low-level attributes like edges and textures in early layers, eventually combining them to recognize complex shapes and objects in deeper layers.

为了构建分类器，开发者使用监督学习，向模型输入包含标注样本的大量训练数据。像ImageNet这样的大型公开数据集在提升这些系统的准确性方面发挥了重要作用。在推理阶段，模型会为每个类别输出一个概率得分，通常使用softmax函数来确定最可能的类别。

Link to this section分类与其他视觉任务的区别#

将图像分类与相关的计算机视觉功能区分开来非常重要，因为技术的选择取决于具体问题：

分类与目标检测的区别： 分类为整张图像分配一个标签。相比之下，目标检测通过在场景中的多个物体周围绘制边界框 (bbox) 来识别它们的位置。
分类与图像分割的区别： 分类着眼于全局上下文，而分割提供像素级的精度。语义分割对每个单独的像素进行分类，从而实现物体与背景之间精确的边界划分。

Link to this section实际应用#

图像分类为各行各业中广泛的现实世界AI应用提供了动力：

Link to this section医疗诊断#

在医疗领域，分类模型通过分析诊断扫描结果来辅助放射科医生。医学图像分析工具可以快速将X光片或MRI扫描结果分类为“正常”或“异常”，或识别诸如肿瘤检测等特定病症，从而实现更快的患者分诊和诊断。

Link to this section制造业中的质量控制#

工厂利用自动视觉检测来维持产品标准。流水线上的摄像头捕捉组件图像，分类模型根据可见缺陷立即将它们标记为“通过”或“不通过”。这种自动化的质量控制确保只有无缺陷的物品才能进入包装阶段。

Link to this section智慧农业#

农民利用农业AI来监测作物健康状况。通过对无人机或智能手机拍摄的图像进行分类，系统可以识别病害、营养缺乏或虫害的迹象，从而实现有针对性的精准农业干预。

Link to this section使用 YOLO26 实现分类#

Ultralytics YOLO26 框架虽然以检测闻名，但也为图像分类任务提供了最先进的性能。其架构针对速度和准确性进行了优化，使其适用于实时应用。

以下是一个简洁的示例，展示了如何使用 ultralytics Python 软件包加载预训练模型并对图像进行分类：

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")

对于希望简化工作流程的团队，Ultralytics Platform 简化了整个流程。它允许用户管理分类数据集、执行基于云的训练，并将模型部署为 ONNX 或 TensorRT 等各种格式，而无需庞大的编码基础设施。