使用Ultralytics YOLO 探索图像分类:使用尖端工具为医疗保健、农业、零售等行业训练定制模型。
图像分类是计算机视觉(CV)领域的基础任务,其中机器学习模型会分析整张图像,并从预定义的类别集合中为其分配单一标签。本质上,它回答的是"这张图片的主要主题是什么?"这个问题。 作为人工智能(AI)的核心组件,该过程使自动化系统能够大规模组织、分类和解读视觉数据。尽管对人眼而言看似简单,但要使计算机识别模式,需要复杂的机器学习(ML)算法来弥合原始像素与有意义概念之间的鸿沟。
现代图像分类技术高度依赖于 称为卷积神经网络(CNN) 的深度学习(DL)架构。 这些网络旨在模拟生物视觉皮层处理信息的方式。 通过称为特征提取的过程,模型在早期层中学习识别 边缘和纹理等低级属性,最终在更深层中将它们组合起来 以识别复杂的形状和物体。
要构建分类器,开发者会采用 监督学习方法,向模型输入海量 标注训练数据集。 大型公共数据集如 ImageNet 对提升系统准确性起到了关键作用。在推理阶段,模型会为每个类别输出概率分数,通常 通过软最大化函数确定最可能的 类别。
区分图像分类与相关计算机视觉能力至关重要,因为技术选择取决于具体问题:
图像分类技术驱动着 众多真实世界的AI应用 横跨多个行业领域:
在医学领域,分类模型通过分析诊断扫描图像为放射科医生提供辅助。 医学影像分析工具能够快速将X光片或MRI影像归类为"正常"或"异常",或识别特定病症(如肿瘤检测),从而加快患者分诊与诊断流程。
Factories utilize automated visual inspection to maintain product standards. Cameras on assembly lines capture images of components, and classification models instantly label them as "pass" or "fail" based on visible defects. This automated quality control ensures only non-defective items reach the packaging stage.
农民利用人工智能技术监测作物健康状况。通过对无人机或智能手机拍摄的图像进行分类,系统能够识别病害、营养缺乏或虫害侵袭的迹象,从而实现精准农业干预。
Ultralytics 框架虽以目标检测闻名,但在图像分类任务中同样展现出顶尖性能。其架构经过速度与精度的双重优化,特别适用于实时应用场景。
以下是一个简洁示例,演示如何加载预训练模型并使用该模型classify :
ultralytics Python 软件包:
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")
# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")
对于希望简化工作流的团队Ultralytics 可简化整个数据处理流程。它支持用户管理分类数据集、执行基于云的训练,并将模型部署为多种格式,例如 ONNX 或 TensorRT 等多种格式,无需复杂的编码基础设施。