Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Convolution

Исследуй основы свертки в компьютерном зрении и глубоком обучении. Узнай, как ядра и карты признаков питают Ultralytics YOLO26 для задач реального времени.

Свертка — это фундаментальная математическая операция, служащая основным строительным блоком современных систем компьютерного зрения (CV) и глубокого обучения (DL). В контексте обработки изображений свертка включает перемещение небольшого фильтра, часто называемого ядром, по входному изображению для создания карты значимых признаков. Этот процесс позволяет моделям искусственного интеллекта (AI) автоматически обучаться и идентифицировать закономерности, такие как края, текстуры и формы, без вмешательства человека. В отличие от традиционного машинного обучения (ML), которое часто требует ручного извлечения признаков, свертка позволяет нейросетям выстраивать иерархическое понимание визуальных данных, начиная с простых линий и переходя к сложным объектам, таким как лица или транспортные средства.

Link to this sectionКак работает свертка#

Операция работает за счет прохода фильтра по входным данным, выполнения поэлементного умножения и суммирования результатов для получения одного значения для каждой позиции. Этот выходной результат известен как карта признаков.

  • Ядро: Это небольшая матрица чисел (весов), которая обнаруживает определенные признаки. Например, оператор Собеля — это особый тип ядра, используемый для обнаружения вертикальных или горизонтальных границ.
  • Скользящее окно: Ядро перемещается по изображению с использованием заданного размера шага, называемого «страйдом» (stride). Этот процесс пространственной фильтрации сохраняет взаимосвязь между пикселями, что критически важно для понимания изображений.
  • Иерархия слоев: В глубоких архитектурах, таких как сверточные нейронные сети (CNN), начальные слои захватывают низкоуровневые детали, в то время как более глубокие слои объединяют их в высокоуровневые концепции.

Link to this sectionСвертка vs. связанные концепции#

Чтобы полностью понять свертку, полезно отличать её от схожих терминов, часто встречающихся в литературе по нейронным сетям (NN):

  • Взаимная корреляция vs. Свертка: Математически истинная свертка предполагает переворот ядра перед его применением. Однако большинство фреймворков глубокого обучения, включая библиотеку PyTorch, реализуют взаимную корреляцию (скольжение без переворота), но называют её «сверткой», так как веса изучаются во время обучения, что делает различие в перевороте неактуальным для производительности.
  • Свертка vs. Внимание: В то время как свертка обрабатывает информацию локально (соседние пиксели), механизм внимания позволяет модели соотносить удаленные части изображения одновременно. Современные архитектуры, такие как YOLO26, часто используют высокооптимизированные сверточные слои для поддержания скорости инференса в реальном времени, поскольку слои внимания могут быть вычислительно более затратными.

Link to this sectionРеальные приложения#

Эффективность свертки позволила ИИ совершить революцию в различных отраслях за счет создания мощных систем восприятия:

  1. Медицинская диагностика: В области ИИ в здравоохранении свертка помогает анализировать МРТ-снимки высокого разрешения. Используя специальные ядра, разработанные для выделения аномалий, модели могут обнаруживать ранние признаки опухолей или переломов с точностью, сопоставимой с экспертами-людьми.

  2. Автономная навигация: Беспилотные автомобили полагаются на свертку для обнаружения объектов в реальном времени. По мере движения автомобиля сверточные слои обрабатывают видеопотоки, чтобы мгновенно идентифицировать пешеходов, дорожную разметку и дорожные знаки — важнейший компонент безопасности ИИ в автомобильной индустрии.

Link to this sectionПример на Python с Ultralytics#

Ты можешь изучить сверточные слои в современных моделях с помощью Python. В следующем примере загружается модель YOLO26 и проверяется, использует ли её начальный слой стандартную сверточную операцию, реализованную через torch.nn.

import torch.nn as nn
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Access the first layer of the model's backbone
first_layer = model.model.model[0]

# Verify it is a Convolutional layer
if isinstance(first_layer.conv, nn.Conv2d):
    print("Success: The first layer is a standard convolution.")
    print(f"Kernel size: {first_layer.conv.kernel_size}")

Link to this sectionПочему свертка важна для Edge AI#

Сверточные операции легко оптимизируются, что делает их идеальными для развертывания Edge AI, где вычислительные ресурсы ограничены. Поскольку одно и то же ядро используется для всего изображения (совместное использование параметров), модель требует значительно меньше памяти, чем старые полносвязные архитектуры. Эта эффективность позволяет продвинутым моделям работать на смартфонах и IoT-устройствах.

Для команд, желающих использовать эти операции для своих датасетов, платформа Ultralytics предоставляет удобную среду для разметки изображений и обучения сверточных моделей без необходимости управлять сложной инфраструктурой. Используя трансферное обучение, ты можешь дообучить предобученные сверточные веса для распознавания новых объектов с минимальным количеством обучающих данных.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения