了解卷积神经网络 (CNN) 如何革新计算机视觉,为医疗保健、自动驾驶汽车等领域的 AI 提供强大支持。
卷积神经网络(CNN)是一类专门的 深度学习(DL)架构,旨在 处理具有网格状拓扑结构的数据,如数字图像。受动物视觉皮层生物结构的启发 受动物视觉皮层生物结构的启发,CNN 独有的能力是 自动学习空间层次特征。传统的神经网络将输入数据视为一个 不同的是,CNN 保留了像素之间的空间关系,这使其成为了 是大多数现代 计算机视觉 (CV)应用背后的基础技术。通过 通过有效过滤输入以提取有意义的模式,这些网络推动了从智能手机的面部识别到医疗诊断的各种进步。 智能手机上的面部识别到医疗图像分析中的诊断工具。 医疗图像分析中的诊断工具。
CNN 的有效性在于它能将图像缩小到更易于处理的形式,同时不丢失对获得良好预测至关重要的 对获得良好预测至关重要的特征。这是通过一系列专门的层来实现的:
CNN 消除了人工特征提取的需要,从而彻底改变了人工智能领域。 它们能直接从训练数据中学习与众不同的特征 其直接从训练数据中学习独特特征的能力已被各行各业广泛采用。 各行各业。
While often used interchangeably with general AI terms, CNNs have distinct characteristics compared to other architectures:
现代程序库可直接利用 CNN 的强大功能。网络 ultralytics 软件包提供了
该软件包提供了对YOLO11 等先进模型的访问权限,这些模型具有优化的 CNN 主干网,可实现快速推理。
下面的示例演示了如何加载预先训练好的基于 CNN 的模型并运行预测:
from ultralytics import YOLO
# Load a YOLO11 model, which uses a highly optimized CNN architecture
model = YOLO("yolo11n.pt")
# Run object detection on an image to identify features and objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the prediction results
results[0].show()
开发 CNN 需要强大的开源工具生态系统的支持。研究人员和工程师通常使用 框架,如 PyTorch或 TensorFlow等框架来从头开始构建自定义架构。这些库 提供卷积和反向传播所需的底层tensor 运算。
对于那些希望简化计算机视觉项目生命周期(从数据管理到部署)的人来说,即将推出的 Ultralytics 平台提供了全面的解决方案。 即将推出的Ultralytics 平台提供了全面的解决方案。它简化了 它简化了模型训练所涉及的复杂工作流程,使团队能够专注于 应用 CNN 解决业务问题,而不是管理基础设施。此外,将这些模型部署到 此外,通过 ONNX和 TensorRT等格式,确保在生产 环境。