深圳Yolo 视觉
深圳
立即加入
词汇表

图像分类

探索图像分类基础知识,从卷积神经网络到现实世界的人工智能应用。学习如何Ultralytics 训练并部署最先进的分类器。

图像分类是计算机视觉(CV)领域的基础任务,其中机器学习模型会分析整张图像,并从预定义的类别集合中为其分配单一标签。本质上,它回答的是"这张图片的主要主题是什么?"这个问题。 作为人工智能(AI)的核心组件,该过程使自动化系统能够大规模组织、分类和解读视觉数据。尽管对人眼而言看似简单,但要使计算机识别模式,需要复杂的机器学习(ML)算法来弥合原始像素与有意义概念之间的鸿沟。

分类背后的机制

现代图像分类技术高度依赖于 称为卷积神经网络(CNN) 的深度学习(DL)架构。 这些网络旨在模拟生物视觉皮层处理信息的方式。 通过称为特征提取的过程,模型在早期层中学习识别 边缘和纹理等低级属性,最终在更深层中将它们组合起来 以识别复杂的形状和物体。

要构建分类器,开发者会采用 监督学习方法,向模型输入海量 标注训练数据集。 大型公共数据集如 ImageNet 对提升系统准确性起到了关键作用。在推理阶段,模型会为每个类别输出概率分数,通常 通过软最大化函数确定最可能的 类别。

分类与其他视觉任务

区分图像分类与相关计算机视觉能力至关重要,因为技术选择取决于具体问题:

  • 分类与目标检测 分类为整张图像分配一个标签。相比之下,目标检测通过为每个目标绘制边界框, 识别场景中多个目标的位置。
  • 分类与图像分割 分类关注整体上下文,而分割提供像素级精度 语义分割对每个独立像素进行分类, 从而实现物体与背景之间的精确边界划分。

实际应用

图像分类技术驱动着 众多真实世界的AI应用 横跨多个行业领域:

医疗诊断

在医学领域,分类模型通过分析诊断扫描图像为放射科医生提供辅助。 医学影像分析工具能够快速将X光片或MRI影像归类为"正常"或"异常",或识别特定病症(如肿瘤检测),从而加快患者分诊与诊断流程。

制造过程中的质量控制

工厂采用自动化视觉检测技术来维持产品标准。装配线上的摄像头捕捉零部件图像,分类模型根据可见缺陷即时标注为"合格"或"不合格"。这种自动化质量控制确保仅无缺陷产品进入包装阶段。

智能农业

农民利用人工智能技术监测作物健康状况。通过对无人机或智能手机拍摄的图像进行分类,系统能够识别病害、营养缺乏或虫害侵袭的迹象,从而实现精准农业干预。

使用YOLO26实现分类

Ultralytics 框架虽以目标检测闻名,但在图像分类任务中同样展现出顶尖性能。其架构经过速度与精度的双重优化,特别适用于实时应用场景。

以下是一个简洁示例,演示如何加载预训练模型并使用该模型classify : ultralytics Python 软件包:

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")

对于希望简化工作流的团队Ultralytics 可简化整个数据处理流程。它支持用户管理分类数据集、执行基于云的训练,并将模型部署为多种格式,例如 ONNXTensorRT 等多种格式,无需复杂的编码基础设施。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入