Узнайте, как сверточные нейронные сети (CNN) обеспечивают работу современного компьютерного зрения. Узнайте о слоях, приложениях и о том, как запустить Ultralytics для искусственного интеллекта в реальном времени.
Сверточная нейронная сеть (CNN) — это специализированная архитектура глубокого обучения, предназначенная для обработки данных с сеточной топологией, в первую очередь цифровых изображений. Вдохновленные биологической структурой зрительной коры головного мозга, CNN обладают уникальной способностью сохранять пространственные отношения внутри входных данных. В отличие от традиционных нейронных сетей, которые преобразуют изображение в длинный список чисел, CNN анализируют небольшие перекрывающиеся области изображения, чтобы автоматически изучать иерархию характеристик — от простых краев и текстур до сложных форм и объектов. Эта способность делает их основополагающей технологией, лежащей в основе современных систем компьютерного зрения (CV).
Сила CNN заключается в ее способности преобразовывать сложное изображение в форму, которая легче обрабатывается, без потери характеристик, важных для получения точного прогноза. Это достигается с помощью последовательности отдельных слоев, которые преобразуют входной объем в выходной класс или значение:
CNN преобразовали отрасли промышленности, автоматизировав визуальные задачи с сверхчеловеческой точностью.
Хотя CNN долгое время были стандартом для задач зрительного восприятия, появилась новая архитектура под названием Vision Transformer (ViT).
Современные библиотеки упрощают использование моделей на основе CNN. ultralytics Пакет предоставляет доступ
к современным моделям, таким как YOLO26, которые отличаются высокооптимизированными архитектурами CNN для быстрого вывода.
Следующий пример демонстрирует, как загрузить предварительно обученную модель CNN и выполнить прогнозирование:
from ultralytics import YOLO
# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")
# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the prediction results
results[0].show()
Разработка CNN поддерживается надежной экосистемой инструментов с открытым исходным кодом. Инженеры обычно используют такие фреймворки, как PyTorch или TensorFlow для создания пользовательских архитектур. Эти библиотеки предоставляют низкоуровневые tensor , необходимые для свертки и обратного распространения.
Для команд, стремящихся оптимизировать жизненный цикл проектов в области компьютерного зрения — от сбора данных до внедрения — Ultralytics предлагает комплексное решение. Она упрощает сложные рабочие процессы, позволяя разработчикам сосредоточиться на применении CNN для решения бизнес-задач, а не на управлении инфраструктурой. Кроме того, модели можно экспортировать в такие форматы, как ONNX или TensorRT для высокопроизводительного развертывания на периферийных устройствах.