敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

图像分类

通过 Ultralytics YOLO 探索图像分类:使用前沿工具训练用于医疗保健、农业、零售等领域的自定义模型。

图像分类是计算机视觉 (CV)中的一项基本任务,它涉及从预定义的类别集中为整个图像分配一个特定的标签。主要目标是识别图像的主要主题并对其进行相应分类。例如,分类模型会分析图像并输出诸如“猫”、“狗”或“汽车”之类的标签。此任务构成了许多更复杂的 CV 应用的基础,并且是机器学习 (ML)的核心组成部分。该过程依赖于算法,最著名的是卷积神经网络 (CNN),以从大型标记数据集中学习区分特征。

图像分类的工作原理

图像分类模型使用监督学习进行训练,该方法会向模型输入大量已手动标记正确类别的图像。在训练过程中,神经网络学习识别与每个类别相关的模式、纹理、形状和颜色组合。这种学习是通过一种称为反向传播的过程实现的,该过程调整模型的内部参数或权重,以最大限度地减少其预测与实际标签之间的差异。

现代分类模型通常使用具有多层的深度学习架构。 早期层可能学习识别简单的特征,如边缘和角,而更深层将这些特征组合起来以识别更复杂的结构,如眼睛、车轮或面部。 网络的最后一层通常使用Softmax函数来为每个可能的类别生成概率分数。 选择具有最高概率的类别作为最终预测。 此过程的关键是特征提取,模型在其中自动学习用于分类任务的最具信息量的特征。

图像分类的应用

图像分类被广泛应用于各个行业,以自动化和扩展视觉识别任务。两个突出的例子包括:

  1. 医学影像分析: 在医疗保健领域,分类模型分析医学扫描图像,如 X 射线、MRI 和 CT 扫描,以帮助放射科医生检测疾病。例如,可以训练一个模型在数千张乳房 X 光照片上进行训练,以将图像分类为“良性”或“恶性”,从而协助早期检测乳腺癌。这可以加快诊断速度并减少人为错误。有关此方面的更多信息,请参阅 美国癌症协会关于 AI 在癌症检测中的概述
  2. 农业技术: 农民使用图像分类来监测无人机或卫星拍摄的图像中的作物健康状况。模型可以将植物叶子的图像分类为“健康”、“患病”或“虫害”等类别。这允许有针对性地施用杀虫剂或肥料,从而提高作物产量并促进可持续农业。了解有关 Ultralytics 如何支持农业人工智能的更多信息。

图像分类与相关任务

虽然与其它计算机视觉任务密切相关,但图像分类具有独特的目的。重要的是要将其与以下内容区分开来:

  • 目标检测: 此任务比分类更进一步。 目标检测不是为整个图像分配一个标签,而是识别图像中的多个对象,并在每个对象周围绘制一个边界框,同时还为每个框分配一个类别标签。 例如,它不仅会将图像标记为“街景”,还会定位和分类单个的“汽车”、“行人”和“交通灯”。
  • 图像分割: 此任务通过对每个像素进行分类来提供对图像的最详细理解。有不同的类型,包括 语义分割,它为每个像素分配一个类(例如,属于汽车的所有像素都是一种颜色),以及 实例分割,它区分同一对象的不同实例(例如,每辆汽车都是不同的颜色)。这种级别的细节对于诸如 自动驾驶汽车之类的应用至关重要。

总而言之,分类告诉你图像中是什么,检测告诉你是什么在哪里,而分割提供了场景中所有内容的详细像素级地图。

使用 Ultralytics 进行图像分类

Ultralytics YOLO 模型虽然以目标检测而闻名,但在图像分类任务方面也很出色。可以使用直观的 Ultralytics Python 包 或无需代码的 Ultralytics HUB 平台,在自定义数据集上轻松训练或微调 YOLO11 等最先进的模型。

我们的文档提供了丰富的资源,包括模型训练技巧和关于如何使用 YOLO11 进行图像分类的详细指南。开发人员可以利用 ImageNetCIFAR-100Caltech-101 等基准数据集上的预训练模型,或者从头开始训练新模型。对于那些对最新进展感兴趣的人,像 Papers With Code 这样的资源提供了对表现最佳模型的全面概述。您还可以比较 YOLO 模型在标准基准上的性能PyTorchTensorFlow 等框架为构建和训练这些模型奠定了基础。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板