Глоссарий

Конволюционная нейронная сеть (CNN)

Узнайте, как конволюционные нейронные сети (CNN) революционизируют компьютерное зрение, обеспечивая возможности искусственного интеллекта в здравоохранении, самодвижущихся автомобилях и многом другом.

Конволюционная нейронная сеть (КНС) - это специализированный тип нейронной сети (НС), особенно эффективный для обработки данных, похожих на сетку, таких как изображения и видео. В отличие от традиционных нейронных сетей, которые рассматривают входные данные как плоские векторы, CNN разработаны для автоматического и адаптивного обучения пространственным иерархиям признаков непосредственно из входных данных. Это достигается в основном за счет применения операции свертки, что делает их краеугольным камнем современного компьютерного зрения (КВ) и способствует значительному прогрессу в области искусственного интеллекта (ИИ). Их способность улавливать локальные зависимости и пространственные отношения делает их очень подходящими для задач, в которых расположение пикселей имеет значение.

Основные компоненты и функциональные возможности

Как правило, CNN состоят из нескольких ключевых слоев, которые обрабатывают и преобразуют визуальную информацию:

  • Конволюционные слои: Это основополагающие слои CNN. Они применяют набор обучаемых фильтров (ядер) к входному изображению. Каждый фильтр обнаруживает определенные особенности, такие как края, углы или текстуры. По мере того как фильтр скользит (свертывается) по входному изображению, он создает карты признаков, которые выделяют местоположение и силу обнаруженных признаков. Сеть обучается этим фильтрам автоматически в процессе обучения модели.
  • Активационные слои: Вслед за конволюционными слоями функции активации, такие как ReLU (Rectified Linear Unit) или Leaky ReLU, вводят нелинейность. Это позволяет сети обучаться более сложным схемам, выходящим за рамки простых линейных комбинаций.
  • Слои пулинга: Эти слои уменьшают пространственные размеры (ширину и высоту) карт признаков, снижая вычислительную нагрузку и контролируя чрезмерную подгонку. К распространенным методам относится Max Pooling, который берет максимальное значение в локальной области, помогая сети стать более устойчивой к изменениям в расположении признаков. Обзор методов объединения может дать более подробную информацию.
  • Полностью подключенные слои: Эти слои обычно находятся в конце сети и соединяют каждый нейрон предыдущего слоя с каждым нейроном текущего слоя, подобно традиционной нейронной сети с прямолинейным движением. Они используют высокоуровневые признаки, извлеченные конволюционными и объединяющими слоями, для выполнения задач классификации или регрессии, например, для присвоения окончательной метки изображению.

Основные отличия от других нейронных сетей

CNN обладают уникальными характеристиками, которые отличают их от других типов сетей:

  • Пространственная иерархия: В отличие от базовых ИНС, CNN явно моделируют пространственные отношения. Ранние слои обнаруживают простые признаки (края), а более глубокие слои объединяют их для распознавания более сложных паттернов (фигур, объектов). Эта иерархическая структура имитирует аспекты визуальной обработки информации человеком.
  • Совместное использование параметров: Один фильтр применяется к разным частям входного изображения, что значительно сокращает общее количество параметров по сравнению с полностью связанной сетью, обрабатывающей то же изображение. Это делает CNN более эффективными и менее склонными к перестройке, особенно при работе с большими изображениями. Область, которую фильтр охватывает в любой точке, называется его рецептивным полем.
  • Инвариантность перевода: Благодаря объединению и совместному использованию параметров, CNN могут распознавать объект, даже если его положение немного смещается в пределах изображения.
  • В сравнении с рекуррентными нейронными сетями (РНС): В то время как CNN отлично справляются с обработкой пространственных данных, таких как изображения, рекуррентные нейронные сети (RNN) предназначены для работы с последовательными данными, что делает их подходящими для таких задач, как обработка естественного языка (NLP) и анализ временных рядов.

Применение в реальном мире

CNN являются движущей силой многочисленных открытий в различных областях:

  1. Анализ медицинских изображений: В области искусственного интеллекта в здравоохранении CNN анализируют медицинские снимки, такие как рентгеновские, компьютерные и магнитно-резонансные томографы. Они помогают рентгенологам обнаруживать тонкие аномалии, такие как опухоли, переломы или диабетическая ретинопатия. Исследования, опубликованные в таких журналах, как Radiology: Artificial Intelligence ", показывают, как CNN выявляют паттерны, указывающие на заболевания, и часто достигают высокой точности. Например, такие модели, как Ultralytics YOLO, могут быть адаптированы для решения таких задач, как обнаружение опухолей в медицинской визуализации, что демонстрирует практическое применение архитектур на основе CNN для анализа медицинских изображений.
  2. Автономные транспортные средства: CNN играют важнейшую роль в ИИ для самоуправляемых автомобилей. Они обеспечивают работу систем восприятия, которые в режиме реального времени определяют пешеходов, транспортные средства, дорожные знаки и разметку полосы движения, используя данные с камер и LiDAR. Это позволяет автомобилю понимать окружающую обстановку и принимать решения о безопасном вождении. Такие компании, как Waymo, в значительной степени полагаются на CNN в своих автономных системах. CNN также способствуют сегментации изображений, позволяя автомобилям отличать зоны, пригодные для движения, от препятствий.

Инструменты и фреймворки

Разработка и внедрение CNN поддерживается мощными инструментами и фреймворками глубокого обучения (DL):

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена