深圳Yolo 视觉
深圳
立即加入
词汇表

卷积神经网络 (CNN)

了解卷积神经网络 (CNN) 如何革新计算机视觉,为医疗保健、自动驾驶汽车等领域的 AI 提供强大支持。

卷积神经网络(CNN)是一类专门的 深度学习(DL)架构,旨在 处理具有网格状拓扑结构的数据,如数字图像。受动物视觉皮层生物结构的启发 受动物视觉皮层生物结构的启发,CNN 独有的能力是 自动学习空间层次特征。传统的神经网络将输入数据视为一个 不同的是,CNN 保留了像素之间的空间关系,这使其成为了 是大多数现代 计算机视觉 (CV)应用背后的基础技术。通过 通过有效过滤输入以提取有意义的模式,这些网络推动了从智能手机的面部识别到医疗诊断的各种进步。 智能手机上的面部识别到医疗图像分析中的诊断工具。 医疗图像分析中的诊断工具。

卷积神经网络的工作原理

CNN 的有效性在于它能将图像缩小到更易于处理的形式,同时不丢失对获得良好预测至关重要的 对获得良好预测至关重要的特征。这是通过一系列专门的层来实现的:

  1. 卷积层:这是核心构件。它采用一组可学习的滤波器,通常称为 通常称为内核,在输入图像上滑动。这一数学过程称为 卷积 特征图,突出特定的模式,如 如边缘、曲线或纹理。您可以通过 交互式 CNN 解释,了解滤镜如何提取可视数据。 视觉数据。
  2. 激活函数:卷积后,一个非线性函数被应用于特征图。最常见的 最常见的选择是 ReLU(整流线性单元),它可以 将负像素值替换为零。这就引入了非线性,使网络能够学习复杂的 关系,而不仅仅是线性组合。
  3. 池化层:该层也称为下采样,可降低特征图的维度。 图。最大池化等技术可以选择一个区域中最突出的 特征,从而减少计算负荷,并通过防止过度拟合来帮助模型泛化。 过度拟合
  4. 全连接层:在最后阶段,高级特征被扁平化,并输入到标准神经网络(NN 标准神经网络 (NN)。这一层 根据前几层提取的特征执行最终的分类或回归任务。

重要性和实际应用

CNN 消除了人工特征提取的需要,从而彻底改变了人工智能领域。 它们能直接从训练数据中学习与众不同的特征 其直接从训练数据中学习独特特征的能力已被各行各业广泛采用。 各行各业。

  • 自主系统的物体检测:在汽车行业,CNN 对于实现 自动驾驶汽车感知其 环境的关键。像 YOLO11等模型利用基于 CNN 的 骨干网来高精度地实时detect 行人、交通标志和其他车辆。 车辆。
  • 医疗诊断:CNN 可帮助放射科医生识别医疗扫描中的异常情况。例如 例如,深度学习模型可以分析 X 射线或核磁共振成像扫描,比人类单独detect 更快地detect 肿瘤或骨折。 更快地检测出肿瘤或骨折。美国 美国国立卫生研究院(NIH) 证明了这些自动化工具如何显著提高诊断的一致性。
  • 零售和库存管理:自动结账系统和 智能库存管理 依靠 CNN 来识别货架上的产品、track 库存水平和防止损耗,从而简化主要零售商的运营。 大型零售商的运营。

将 CNN 与相关概念区分开来

While often used interchangeably with general AI terms, CNNs have distinct characteristics compared to other architectures:

  • CNN 与标准神经网络的对比:传统的全连接神经网络将每个输入 神经元连接到每个输出神经元。当应用于图像时,这会导致大量参数和空间结构的损失。 空间结构。相比之下,CNN 使用参数共享(在整个图像中使用相同的滤波器),这使其具有极高的效率。 在整个图像中使用相同的滤波器),这使得它们在处理视觉数据时非常高效。
  • CNN 与视觉转换器 (ViT):CNN 专注于通过卷积处理局部特征、 视觉变换器(ViT)将图像 处理图像 自我注意机制来捕捉全局 背景。ViT 通常需要较大的数据集才能进行有效的训练,而 CNN 具有很强的 "归纳偏差 偏差",使其即使在较小的数据集上也能表现出色。混合模型通常将两者结合起来,如 架构,如 RT-DETR.

实施实例

现代程序库可直接利用 CNN 的强大功能。网络 ultralytics 软件包提供了 该软件包提供了对YOLO11 等先进模型的访问权限,这些模型具有优化的 CNN 主干网,可实现快速推理。

下面的示例演示了如何加载预先训练好的基于 CNN 的模型并运行预测:

from ultralytics import YOLO

# Load a YOLO11 model, which uses a highly optimized CNN architecture
model = YOLO("yolo11n.pt")

# Run object detection on an image to identify features and objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the prediction results
results[0].show()

开发工具和框架

开发 CNN 需要强大的开源工具生态系统的支持。研究人员和工程师通常使用 框架,如 PyTorchTensorFlow等框架来从头开始构建自定义架构。这些库 提供卷积和反向传播所需的底层tensor 运算。

对于那些希望简化计算机视觉项目生命周期(从数据管理到部署)的人来说,即将推出的 Ultralytics 平台提供了全面的解决方案。 即将推出的Ultralytics 平台提供了全面的解决方案。它简化了 它简化了模型训练所涉及的复杂工作流程,使团队能够专注于 应用 CNN 解决业务问题,而不是管理基础设施。此外,将这些模型部署到 此外,通过 ONNXTensorRT等格式,确保在生产 环境。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入