探索卷积神经网络 (CNN) 如何驱动现代计算机视觉。了解其层、应用以及如何运行Ultralytics YOLO26实现实时AI。
卷积神经网络(CNN)是一种专为处理具有网格状拓扑结构的数据(尤其是数字图像)而设计的深度学习架构。受视觉皮层生物结构的启发,CNN具备独特能力,能够在输入数据中保留空间关系。 与传统神经网络将图像扁平化为长数列不同,卷积神经网络通过分析图像中微小重叠区域,自动学习从简单边缘纹理到复杂形状物体的分层特征。这种能力使其成为现代计算机视觉(CV)系统的基础技术。
CNN 的强大之处在于它能够将复杂的图像简化为更易于处理的形式,同时不丢失对获得良好预测至关重要的特征。这是通过一系列独特的层(layers)实现的,这些层将输入体(input volume)转换为输出类别或值:
卷积神经网络通过以超乎人类的精度自动化视觉任务,彻底改变了多个行业。
虽然卷积神经网络(CNN)长期以来一直是视觉任务的标准方案,但一种名为 Transformer ViT)的新型架构已然崛起。
现代库使得使用基于卷积神经网络(CNN)的模型变得非常简单。 ultralytics 该软件包提供对YOLO26等尖端模型的访问权限,这些模型采用高度优化的卷积神经网络(CNN)架构,可实现快速推理。
以下示例演示了如何加载预训练的卷积神经网络(CNN)模型并执行预测:
from ultralytics import YOLO
# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")
# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the prediction results
results[0].show()
CNN的开发得到了强大的开源工具生态系统的支持。工程师通常使用PyTorch或TensorFlow等框架来构建自定义架构。这些库提供了卷积和反向传播所需的底层tensor操作。
对于希望简化计算机视觉项目生命周期(从数据收集到部署)的团队,Ultralytics平台提供了一个全面的解决方案。它简化了复杂的工作流程,使开发人员能够专注于应用CNN解决业务问题,而不是管理基础设施。此外,模型可以导出为ONNX或TensorRT等格式,以便在边缘设备上进行高性能部署。
开启您的机器学习未来之旅