敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

图像识别

了解图像识别如何使 AI 能够分类和理解视觉效果,从而推动医疗保健、零售、安全等领域的创新。

图像识别是计算机视觉的一个广泛领域,它使机器能够识别和解释数字图像或视频中的物体、人物、地点和动作。它是一项基础技术,为无数应用提供支持,从用面部解锁手机到使自动驾驶汽车能够在复杂的环境中导航。图像识别的核心是使用机器学习 (ML)深度学习 (DL)算法来分析像素并提取有意义的模式,从而模仿人类理解视觉信息的能力。

图像识别与相关任务

图像识别虽然经常被用作通用术语,但它涵盖了几个更具体的任务。重要的是要将其与其子领域区分开来:

  • 图像分类: 这是最简单的图像识别形式。它涉及从预定义的类别集中为整个图像分配一个标签。例如,模型可能会将图像分类为包含“猫”、“狗”或“汽车”。输出是整个图像的一个标签。
  • 目标检测: 一项更高级的任务,目标检测不仅对图像中的对象进行分类,还定位它们,通常通过在每个对象周围绘制一个边界框。例如,自动驾驶汽车使用目标检测来识别和定位行人、其他车辆和交通标志。
  • 图像分割: 此任务更进一步,通过识别图像中属于每个对象的精确像素。它为每个对象创建一个详细的掩码,这对于需要深入了解对象的形状和边界的应用至关重要,例如在 医学图像分析中。

图像识别的工作原理

现代图像识别主要由卷积神经网络 (CNN)驱动,这是一种神经网络,尤其擅长处理网格状数据,如图像。 该过程通常包括:

  1. 数据收集:收集大量带标签的图像数据集。 著名的例子包括ImageNetCOCO
  2. 模型训练: 在此数据集上训练CNN。 在训练期间,网络通过称为特征提取的过程学习识别模式——从简单的边缘和纹理到复杂的对象部分。 调整模型的权重以最小化其预测与真实标签之间的差异。
  3. 推理: 经过训练后,模型可以对新的、未见过的图像进行预测。 应用训练模型的这个过程称为推理

实际应用

图像识别已成为许多行业不可或缺的一部分:

  • 医疗保健:医疗保健AI中,图像识别可帮助放射科医生检测X射线、MRI和CT扫描中的肿瘤、骨折和其他异常情况。例如,可以在医学图像数据集上训练模型,以高精度识别脑肿瘤,从而协助医生做出更快的诊断。
  • 零售:零售商使用图像识别进行库存管理,通过摄像头监控货架,以检测产品何时不足。电子商务网站上的视觉搜索功能(允许客户上传照片以查找类似产品)是另一种流行的应用。您可以在我们的零售业 AI页面上了解更多信息。

工具与训练

开发图像识别应用程序通常涉及使用专门的库和框架。 主要技术包括:

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板