Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Neural Style Transfer

Узнай, как нейронный перенос стиля (NST) смешивает содержимое изображения с художественными стилями с использованием CNN. Исследуй его применение в аугментации данных и креативном ИИ в Ultralytics.

Neural Style Transfer (NST) — это сложный метод оптимизации в области computer vision, который позволяет искусственному интеллекту объединять визуальный контент одного изображения с художественным стилем другого. Используя глубокие нейронные сети, в частности Convolutional Neural Networks (CNNs), этот алгоритм синтезирует новое выходное изображение, которое сохраняет структурные детали «контентного» фото (например, городского пейзажа), одновременно применяя текстуры, цвета и мазки кисти «стилевого» образца (например, знаменитой картины). Этот процесс эффективно устраняет разрыв между извлечением низкоуровневых статистических признаков и высокоуровневым творчеством, позволяя создавать уникальные стилизованные визуальные эффекты.

Link to this sectionКак работает Neural Style Transfer#

Механизм NST основан на способности глубокой сети отделять контент от стиля. Когда изображение проходит через предварительно обученную сеть — обычно это архитектура VGG, обученная на масштабном ImageNet dataset — разные слои извлекают разные типы информации. Ранние слои фиксируют низкоуровневые детали, такие как края и текстуры, в то время как более глубокие слои представляют высокоуровневый семантический контент и формы.

Процесс NST, впервые подробно описанный в исследовании Gatys et al., включает в себя optimization algorithm, который итеративно изменяет изображение случайного шума для одновременной минимизации двух различных значений ошибки:

  • Content Loss: Эта метрика вычисляет разницу в высокоуровневых feature maps между сгенерированным изображением и оригинальной контентной фотографией. Она гарантирует, что объекты и планировка сцены остаются узнаваемыми.
  • Style Loss: Эта метрика измеряет разницу в корреляциях текстур между сгенерированным изображением и стилевым образцом. Обычно она использует Gram matrix для фиксации статистического распределения признаков, эффективно представляя «стиль» независимо от пространственного расположения.

В отличие от стандартного model training, где обновляются веса сети, NST замораживает веса сети и обновляет значения пикселей самого входного изображения до тех пор, пока функции потерь не будут минимизированы.

Link to this sectionРеальные приложения#

Хотя изначально NST стала популярной благодаря созданию художественных фильтров, она имеет практическую пользу за пределами эстетики в более широком контексте artificial intelligence.

  • Data Augmentation: Разработчики могут использовать NST для создания synthetic data для обучения надежных моделей. Например, применение различных погодных стилей (дождь, туман, ночь) к видеозаписям дневного вождения может помочь обучить системы автономных транспортных средств справляться с разнообразными условиями окружающей среды без необходимости сбора миллионов реальных примеров.
  • Творческие инструменты и дизайн: NST лежит в основе функций современного программного обеспечения для редактирования фотографий и мобильных приложений, позволяя пользователям мгновенно применять художественные фильтры. В профессиональном дизайне она помогает в переносе текстур для 3D-моделирования и виртуальных сред.

Link to this sectionСвязь с другими генеративными концепциями#

Важно отличать Neural Style Transfer от других методов генерации изображений, представленных в Ultralytics Glossary:

  • NST против Generative Adversarial Networks (GANs): NST обычно оптимизирует одно изображение на основе конкретной пары входных данных (один контент, один стиль) и часто работает медленнее в расчете на одно изображение. Напротив, GAN изучают отображение между целыми доменами (например, превращая всех лошадей в зебр) и могут генерировать изображения почти мгновенно после обучения.
  • NST против Transfer Learning: Хотя оба метода используют предварительно обученные сети, transfer learning предполагает тонкую настройку весов модели для выполнения новой задачи (например, использование классификатора для обнаружения автомобилей). NST использует предварительно обученную модель исключительно как экстрактор признаков, чтобы направлять изменение значений пикселей.

Link to this sectionРеализация извлечения признаков#

Суть NST заключается в загрузке предварительно обученной модели для доступа к её внутренним слоям признаков. В то время как современные детекторы объектов, такие как YOLO26, оптимизированы для скорости и точности обнаружения, архитектуры типа VGG-19 остаются стандартом для переноса стиля из-за их специфической иерархии признаков.

Следующий пример на PyTorch демонстрирует, как загрузить бэкбон модели, обычно используемый для фазы извлечения признаков в NST:

import torchvision.models as models

# Load VGG19, a standard backbone for Neural Style Transfer
# We use the 'features' module to access the convolutional layers
vgg = models.vgg19(weights=models.VGG19_Weights.DEFAULT).features

# Freeze parameters: NST updates the image pixels, not the model weights
for param in vgg.parameters():
    param.requires_grad = False

print("VGG19 loaded. Ready to extract content and style features.")

Для пользователей, стремящихся управлять наборами данных, дополненными с помощью переноса стиля, или обучать последующие модели обнаружения, Ultralytics Platform предоставляет централизованную среду для аннотирования данных, версионирования и развертывания моделей.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения