词汇表

图像识别

了解图像识别如何运用人工智能和深度学习来识别视觉数据。探索实际应用场景，Ultralytics 以获得最先进的识别效果。

图像识别是计算机视觉（CV）领域中一项基础技术，它使软件系统能够识别数字图像中的物体、人物、地点和文本。通过分析图像或视频帧的像素内容，该技术试图模拟人眼和大脑的视觉感知能力。依托人工智能（AI）技术，图像识别将非结构化视觉数据转化为结构化、可操作的信息，成为从医疗保健到自动驾驶等行业实现自动化进程的基石。

核心机制与技术

现代图像识别系统已超越传统的基于规则的编程，转而高度依赖深度学习（DL）算法。其中应用最广泛的架构是卷积神经网络（CNN）。CNN将图像处理为数值网格——通常代表红、绿、蓝（RGB）三色通道——并通过多层数学运算进行处理。

在此过程中，网络执行特征提取。初始层detect 几何模式，如边缘或角点，而更深层则聚合这些模式以识别复杂结构，如眼睛、车轮或叶片。为实现高精度，这些模型需要海量的标注训练数据。大型公共数据集，例如 ImageNet，能帮助模型学习特定视觉组合对应"猫""自行车""停车标志"等概念的统计概率。

区分识别与相关概念

尽管"图像识别"一词常被用作统称，但它与其他特定的计算机视觉任务存在本质区别。理解这些细微差别对于为项目选择合适的模型至关重要：

识别与图像分类： 分类是为整张图像分配单一标签的任务（例如将图片标记为"海滩"）。识别则是更广泛的能力，使系统能够理解内容。
识别与目标检测： 识别旨在确定图像中的物体，而检测则定位其具体位置。检测算法会为每个目标实例绘制边界框，将其与背景分离。
识别与实例分割： 该技术在识别基础上更进一步，能够精确识别物体的像素轮廓，而非仅标注边界框。这对需要精确测量的应用至关重要，例如生物医学图像分析。

实际应用

图像识别的实用性几乎涵盖所有产生视觉数据的领域。

医学诊断：在医疗领域，识别算法通过分析X光和MRI等医学影像辅助放射科医师工作。诸如放射学人工智能等工具能够比单纯的人工观察更快、有时更准确地识别肿瘤或骨折等异常情况。
零售与库存： 智能超市通过识别技术track 被从货架取走的过程，实现自动结账系统。同样，仓库机器人也利用该技术识别和分拣包裹。
安全与访问控制： 人脸识别系统通过与存储的人脸特征数据库进行身份验证，实现对智能手机和建筑物的安全访问。

使用YOLO26实现图像识别

对于开发者和研究人员而言，借助诸如[最新模型]等尖端技术，图像识别技术的实现已变得显著便捷。 YOLO26该框架原生支持分类、检测和分割功能。以下示例演示了如何使用该框架对图像执行识别（具体为目标检测）。 ultralytics Python 软件包。

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (n for nano, fastest speed)
model = YOLO("yolo26n.pt")

# Run inference on an image to recognize and locate objects
# The source can be a file path, URL, or webcam (source=0)
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results with bounding boxes and labels
results[0].show()

对于希望在云端标注自有数据集并训练定制模型的团队Ultralytics 提供了一个高效的环境，可管理图像识别项目的完整生命周期——从数据采集到部署落地。

未来趋势

随着计算能力的提升，图像识别正逐步演进为视频理解，系统能够分析跨帧的时序关联。此外，生成式人工智能的融合使系统不仅能识别图像，还能生成详细的文本描述，从而弥合了自然语言处理（NLP）与视觉技术之间的鸿沟。

图像识别

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

核心机制与技术

区分识别与相关概念

实际应用

使用YOLO26实现图像识别

未来趋势

阅读更多此类别的内容

12个基于计算机视觉的航拍影像应用场景

什么是单目深度估计？概述

Ultralytics YOLO 进行人工智能威胁检测

加入Ultralytics 社区