Глоссарий

Свёрточная операция

Узнайте, как свертка (convolution) обеспечивает возможности ИИ в компьютерном зрении, позволяя выполнять такие задачи, как обнаружение объектов, распознавание изображений и медицинская визуализация с высокой точностью.

Свертка - это специализированная математическая операция, которая служит фундаментальным строительным блоком современных систем компьютерного зрения (КВ). В контексте искусственного интеллекта (ИИ), свертка позволяет моделям обрабатывать данные в виде сетки, такие как изображения, путем систематической фильтрации входных данных для извлечения значимых паттернов. В отличие от традиционных алгоритмов, требующих ручной установки правил, свертка позволяет нейронной сети нейронной сети автоматически обучаться пространственным иерархии признаков - от простых краев и текстур до сложных форм объектов, - имитируя биологические процессы, наблюдаемые в зрительной коре головного мозга.

Механика конволюции

Операция выполняется путем сдвига небольшой матрицы чисел, известной как ядром или фильтром, по входному изображению. В каждой позиции ядро выполняет поэлементное умножение с перекрывающимися значениями пикселей и суммирует результаты, чтобы чтобы получить один выходной пиксель. В результате формируется карту признаков, на которой выделяются области, где обнаружены определенные обнаружены определенные закономерности.

Ключевые параметры, определяющие поведение свертки, включают в себя:

Размер ядра: Размеры фильтра (например, 3x3 или 5x5), которые определяют площадь входного сигнала. рассматриваемой одновременно, часто называемой рецептивным полем.
Stride: Размер шага, с которым фильтр перемещается по изображению. Больший размер шага приводит к уменьшению выходных размеры, эффективно понижая дискретизацию данных.
Добавление: Добавление пограничных пикселей (обычно нулей) к входному сигналу для управления пространственным размером выходного сигнала. для управления пространственным размером выходных данных, концепция, подробно описанная в документации поPyTorch .

Актуальность в глубоком обучении

Конволюция - основной двигатель Конволюционные нейронные сети (CNN). Ее важность заключается в двух основных свойствах: совместном использовании параметров и пространственная локальность. Благодаря использованию одних и тех же весов модели (ядра) для всего изображения, сеть остается вычислительно эффективной и пространственно локальной. сеть остается вычислительно эффективной и способной инвариантность к переводу, Это означает, что она может распознать объект независимо от того, где он находится в кадре. Такая эффективность позволяет использовать сложные архитектуры, такие как YOLO11 выполнять выводы в режиме реального времени на различных аппаратных средствах, от мощных графических процессоров до устройств Edge AI с ограниченными ресурсами. устройств Edge AI.

Применение в реальном мире

Применение свертки распространяется практически на все отрасли, использующие визуальные данные:

Анализ медицинских изображений: В ИИ в здравоохранении, свертка позволяет алгоритмам сканировать МРТ и КТ для выявлять мельчайшие аномалии. Например, специальные ядра могут быть обучены выделять неравномерные текстуры. связанные с опухолями на ранних стадиях, что помогает радиологам ставить точные диагнозы.
Автономная навигация: Самоуправляемые автомобили в значительной степени полагаются на свертку для обнаружение объектов и сегментации изображений. Система обрабатывает видео Система обрабатывает видеопоток, чтобы различать дорожные полосы, пешеходов и дорожные знаки, что позволяет автомобильному ИИ автомобильному искусственному интеллекту принимать безопасные решения в доли секунды решения о безопасном вождении.

Конверсия против полностью связанных слоев

Важно отличать сверточные слои от полносвязных (плотных). В полностью связанном слое каждый входной нейрон соединяется с каждым выходным нейроном, что требует больших вычислительных затрат и игнорирует пространственную структуру изображений. Напротив, свертка сохраняет пространственные связи и значительно сокращает количество параметров, что позволяет избежать перебора при работе с высокоразмерными данных. В то время как плотные слои часто используются для окончательной классификации, сверточные слои выполняют тяжелую работу по извлечению признаков. извлечения признаков.

Реализация свертки с помощью Ultralytics

Вы можете визуализировать конволюционную архитектуру современных детекторов объектов с помощью ultralytics пакет. Следующий код загружает пакет YOLO11 модель и распечатывает ее структуру, выявляя Conv2d слои, используемые для обработки.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Print the model architecture to observe Conv2d layers
# These layers perform the convolution operations to extract features
print(model.model)

Свёрточная операция

Обучение моделям Ultralytics YOLO для оптимизации рабочих процессов в разных отраслях

Гибкое корпоративное лицензирование для развития ваших инноваций

Обучайте модели искусственного интеллекта за считанные секунды с помощью Ultralytics YOLO

Механика конволюции

Актуальность в глубоком обучении

Применение в реальном мире

Конверсия против полностью связанных слоев

Реализация свертки с помощью Ultralytics

Читать больше в этой категории

Понимание важности аннотации с участием человека

Что такое дистилляция наборов данных? Краткий обзор

Очки Oakley Meta AI переосмысливают концепцию очков с помощью Vision AI

Присоединяйтесь к сообществу Ultralytics