Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Vanishing Gradient

Узнай, как проблема затухающего градиента влияет на глубокое обучение, и изучи эффективные решения, такие как ReLU и остаточные связи, используемые в Ultralytics YOLO26.

Проблема исчезающего градиента — это серьезная трудность, с которой ты столкнешься при обучении глубоких искусственных нейронных сетей. Она возникает, когда градиенты — значения, определяющие, насколько должны измениться параметры сети, — становятся невероятно малыми при распространении от выходного слоя к входным. Поскольку эти градиенты необходимы для обновления весов модели, их исчезновение означает, что ранние слои сети перестают обучаться. Этот феномен фактически мешает модели улавливать сложные закономерности в данных, ограничивая глубину и производительность архитектур глубинного обучения.

Link to this sectionМеханика исчезающих сигналов#

Чтобы понять, почему это происходит, полезно взглянуть на процесс обратного распространения ошибки. Во время обучения сеть вычисляет ошибку между своим прогнозом и реальной целью с помощью функции потерь. Затем эта ошибка передается назад через слои для корректировки весов. Эта корректировка опирается на цепное правило исчисления, которое включает умножение производных функций активации слой за слоем.

Если сеть использует функции активации, такие как сигмоида или гиперболический тангенс (tanh), производные часто меньше 1. Когда множество таких малых чисел перемножается в глубокой сети с десятками или сотнями слоев, результат стремится к нулю. Ты можешь представить это как игру в «испорченный телефон», где сообщение шепотом передается по длинной цепочке людей; к тому времени, как оно доходит до начала очереди, сообщение становится неразборчивым, и первый человек уже не знает, что сказать.

Link to this sectionРешения и современные архитектуры#

В области ИИ разработано несколько надежных стратегий для смягчения проблемы исчезающих градиентов, что позволило создавать такие мощные модели, как Ultralytics YOLO26.

  • ReLU и варианты: Rectified Linear Unit (ReLU) и его преемники, такие как Leaky ReLU и SiLU, не насыщаются при положительных значениях. Их производные равны либо 1, либо небольшой константе, что сохраняет величину градиента в глубоких слоях.
  • Остаточные связи: Представленные в Residual Networks (ResNets), это «пропускающие связи», которые позволяют градиенту обходить один или несколько слоев. Это создает «магистраль» для беспрепятственного прохождения градиента к более ранним слоям — концепцию, необходимую для современного обнаружения объектов.
  • Пакетная нормализация: Нормализуя входные данные каждого слоя, пакетная нормализация гарантирует, что сеть работает в стабильном режиме, где производные не слишком малы, что снижает зависимость от тщательной инициализации.
  • Вентильные архитектуры: Для последовательных данных сети Long Short-Term Memory (LSTM) и GRU используют специализированные вентили (гейты), чтобы решать, какую информацию сохранить, а какую забыть, эффективно защищая градиент от исчезновения на длинных последовательностях.

Link to this sectionИсчезающие против взрывающихся градиентов#

Хотя они проистекают из одного и того же базового механизма (многократного умножения), исчезающие градиенты отличаются от взрывающихся градиентов.

  • Исчезающий градиент: Градиенты стремятся к нулю, из-за чего обучение останавливается. Это часто встречается в глубоких сетях с сигмоидальной активацией.
  • Взрывающийся градиент: Градиенты накапливаются и становятся чрезмерно большими, из-за чего веса модели начинают резко колебаться или принимать значение NaN (Not a Number). Это часто исправляется с помощью отсечения градиента.

Link to this sectionРеальные приложения#

Преодоление проблемы исчезающих градиентов стало обязательным условием успеха современных ИИ-приложений.

  1. Глубинное обнаружение объектов: Модели, используемые для автономных транспортных средств, такие как серия YOLO, требуют сотен слоев для различения пешеходов, знаков и автомобилей. Без таких решений, как остаточные блоки и пакетная нормализация, обучение этих глубоких сетей на огромных наборах данных, таких как COCO, было бы невозможным. Инструменты вроде Ultralytics Platform помогают оптимизировать этот процесс обучения, гарантируя правильную сходимость этих сложных архитектур.

  2. Машинный перевод: В обработке естественного языка (NLP) перевод длинного предложения требует понимания взаимосвязи между первым и последним словами. Решение проблемы исчезающего градиента в RNN (через LSTM), а затем и в Трансформерах, позволило моделям сохранять контекст в длинных абзацах, произведя революцию в сервисах машинного перевода, таких как Google Translate.

Link to this sectionПример на Python#

Современные фреймворки и модели абстрагируют многие из этих сложностей. Когда ты обучаешь модель, такую как YOLO26, архитектура автоматически включает компоненты, такие как активация SiLU и пакетная нормализация, чтобы предотвратить исчезновение градиентов.

from ultralytics import YOLO

# Load the YOLO26 model (latest generation, Jan 2026)
# This architecture includes residual connections and modern activations
# that inherently prevent vanishing gradients.
model = YOLO("yolo26n.pt")

# Train the model on a dataset
# The optimization process remains stable due to the robust architecture
results = model.train(data="coco8.yaml", epochs=10)

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения