Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Сверточная нейронная сеть (CNN)

Узнайте, как сверточные нейронные сети (CNN) совершают революцию в компьютерном зрении, поддерживая ИИ в здравоохранении, самоуправляемых автомобилях и многом другом.

Конволюционная нейронная сеть (CNN) - это специализированный класс архитектуры глубокого обучения (DL), предназначенной для обработки данных с топологией, напоминающей сетку, таких как цифровые изображения. Вдохновленные биологической структурой биологической структурой зрительной коры животных, CNN обладают уникальной способностью автоматического обучения пространственным иерархиям признаков. В отличие от традиционных нейронных сетей, которые рассматривают входные данные как плоский список чисел, CNN сохраняют пространственные отношения между пикселями, что делает их основой технологии в основе большинства современных компьютерного зрения (КЗ). Благодаря Эффективно фильтруя входные данные для извлечения значимых паттернов, эти сети обеспечивают широкий спектр достижений - от распознавания лиц на смартфонах до диагностических инструментов в системах компьютерного зрения. от распознавания лиц на смартфонах до диагностических инструментов в анализа медицинских изображений.

Как работают конволюционные нейронные сети

Эффективность CNN заключается в ее способности сокращать изображения до более удобной для обработки формы, не теряя при этом характеристик, которые важны для получения хорошего прогноза. Это достигается с помощью серии специализированных слоев:

  1. Конволюционный слой: Это основной строительный блок. В нем используется набор обучаемых фильтров, часто называемых ядрами, которые скользят по входному изображению. Этот математический процесс, известный как свертка, создает карты признаков, которые выделяют определенные детали, такие как края, кривые или текстуры. Вы можете визуализировать этот процесс с помощью интерактивные объяснения CNN, чтобы увидеть, как фильтры извлекают визуальные данные.
  2. Функция активации: После свертки к картам признаков применяется нелинейная функция. На сайте наиболее распространенным вариантом является ReLU (Rectified Linear Unit), которая заменяет отрицательные значения пикселей нулем. Это вносит нелинейность, позволяя сети изучать сложные а не просто линейные комбинации.
  3. Слой пулинга: Этот слой, также известный как понижающая дискретизация, уменьшает размерность карты признаков карты. Такие техники, как максимальное объединение, выбирают наиболее заметные в регионе, что снижает вычислительную нагрузку и помогает модели обобщаться, предотвращая чрезмерной подгонки.
  4. Слой с полным подключением: На последних этапах высокоуровневые признаки уплощаются и поступают в стандартную нейронную сеть (НС). Этот слой выполняет окончательную задачу классификации или регрессии на основе признаков, извлеченных предыдущими слоями.

Значение и применение в реальном мире

CNN произвели революцию в области искусственного интеллекта, устранив необходимость в ручном извлечении признаков. Их способность узнавать отличительные признаки непосредственно из обучающих данных, что привело к их широкому распространению в различных отраслях.

  • Обнаружение объектов для автономных систем: В автомобильной промышленности CNN играют важнейшую роль в обеспечении возможности самодвижущимся автомобилям воспринимать окружающую окружающую среду. Такие модели, как YOLO11 используют основанный на CNN для detect пешеходов, дорожных знаков и других транспортных средств в режиме реального времени с высокой точностью. транспортных средств в режиме реального времени с высокой точностью.
  • Диагностика в здравоохранении: CNN помогают радиологам выявлять аномалии на медицинских снимках. На сайте Например, модели глубокого обучения могут анализировать рентгеновские снимки или снимки МРТ, чтобы detect опухоли или переломы быстрее, чем человек. чем при осмотре человеком. Исследования, проведенные Национальных институтов здоровья (NIH) демонстрирует, как эти автоматизированные инструменты значительно улучшают диагностическую последовательность.
  • Розничная торговля и управление запасами: Автоматизированные кассовые системы и интеллектуальное управление запасами используют CNN для распознавания товаров на полках, track уровня запасов и предотвращения потерь, оптимизируя работу крупных розничных сетей. крупных розничных компаний.

Отличие CNN от смежных концепций

Несмотря на то, что CNN часто используют как взаимозаменяемые термины общего ИИ, они имеют отличительные особенности по сравнению с другими архитектурами:

  • CNN по сравнению с обычными нейронными сетями: Традиционная полностью подключенная нейронная сеть соединяет каждый входной нейрон с каждым выходным нейроном. При применении к изображениям это приводит к огромному количеству параметров и потере пространственной структуры. В отличие от этого, CNN используют совместное использование параметров (применение одного и того же фильтра для всего что делает их очень эффективными для визуальных данных.
  • CNN против трансформаторов зрения (ViT): В то время как CNN фокусируются на локальных признаках посредством свертки, Трансформаторы зрения (ViT) обрабатывают изображения как последовательности пятен, используя механизм самовнимания для улавливания глобального контекст. Для эффективного обучения ViT часто требуются большие наборы данных, в то время как CNN обладают сильной "индуктивной индуктивный подход", благодаря которому они хорошо работают даже на небольших наборах данных. Гибридные модели часто сочетают в себе оба подхода, как, например, в такие архитектуры, как RT-DETR.

Пример реализации

Современные библиотеки позволяют легко использовать возможности CNN. Сайт ultralytics пакет предоставляет Доступ к самым современным моделям, таким как YOLO11, которые имеют оптимизированную основу CNN для быстрого вывода.

В следующем примере показано, как загрузить предварительно обученную модель на основе CNN и выполнить предсказание:

from ultralytics import YOLO

# Load a YOLO11 model, which uses a highly optimized CNN architecture
model = YOLO("yolo11n.pt")

# Run object detection on an image to identify features and objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the prediction results
results[0].show()

Инструменты и рамки для развития

Разработка CNN поддерживается развитой экосистемой инструментов с открытым исходным кодом. Исследователи и инженеры обычно используют фреймворки, такие как PyTorch или TensorFlow для создания собственных архитектур с нуля. Эти библиотеки обеспечивают низкоуровневые tensor операции, необходимые для свертки и обратного распространения.

Для тех, кто хочет упростить жизненный цикл проектов по компьютерному зрению - от управления данными до их развертывания - новая платформа Ultralytics Platform предлагает комплексное решение. готовящаяся платформаUltralytics Platform предлагает комплексное решение. Она упрощает сложные рабочие процессы связанных с обучением моделей, и позволяет командам сосредоточиться на применении CNN для решения бизнес-задач, а не на управлении инфраструктурой. Кроме того, развертывание этих моделей на развертывание этих моделей на пограничных устройствах облегчается благодаря таким форматам, как ONNX и TensorRTобеспечивая высокую производительность в производственных среды.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас