Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Веса модели

Узнайте о важности весов модели в машинном обучении, их роли в прогнозировании и о том, как Ultralytics YOLO упрощает их использование для задач искусственного интеллекта.

Веса модели — это числовые параметры внутри нейронной сети, которые корректируются в процессе обучения. Эти значения, по сути, представляют собой изученные знания модели. Представьте их как коэффициенты в очень сложном уравнении; настраивая эти коэффициенты, модель учится сопоставлять входные данные, такие как изображение, с желаемым выходом, таким как ограничивающий прямоугольник вокруг объекта. Качество весов модели напрямую определяет ее производительность в данной задаче, такой как классификация изображений или обнаружение объектов.

Как определяются веса

Веса модели не устанавливаются вручную, а «изучаются» на основе данных. Процесс начинается с инициализации весов небольшими случайными числами. Во время обучения модель делает прогнозы на тренировочных данных, и функция потерь вычисляет, насколько неверны эти прогнозы. Этот сигнал ошибки затем используется в процессе, называемом обратным распространением, для вычисления градиента потерь по отношению к каждому весу. Затем алгоритм оптимизации, такой как стохастический градиентный спуск (SGD), корректирует веса в направлении, противоположном градиенту, чтобы минимизировать ошибку. Этот цикл повторяется много эпох, пока производительность модели на отдельном наборе проверочных данных не перестанет улучшаться, что является признаком того, что она изучила закономерности в данных.

Важность предварительно обученных весов

Обучение современной модели с нуля требует огромных вычислительных ресурсов и больших наборов данных. Чтобы преодолеть это, сообщество компьютерного зрения широко использует предварительно обученные веса. Это включает в себя использование модели, такой как модель Ultralytics YOLO, которая уже была обучена на большом наборе данных общего назначения, таком как COCO. Эти веса служат отличной отправной точкой для новой, конкретной задачи посредством процесса, называемого переносом обучения. Начиная с предварительно обученных весов, вы можете достичь более высокой точности с меньшим количеством данных и более коротким временем обучения посредством процесса, известного как тонкая настройка.

Применение в реальном мире

  • Анализ медицинских изображений: Разработчик может взять модель YOLOv8 с ее предварительно обученными весами и дообучить ее на пользовательском наборе данных сканов опухолей головного мозга. Полученная модель имеет веса, специально оптимизированные для выявления тонких признаков опухолей, помогая радиологам в диагностике. Это ключевое применение ИИ в здравоохранении.
  • Управление запасами в розничной торговле: Розничная компания может использовать модель для мониторинга полок и подсчета продуктов. Модель обнаружения объектов дообучается на изображениях продукции магазина. Окончательные веса позволяют модели точно обнаруживать и подсчитывать конкретные товары для автоматизированного отслеживания запасов.

Веса в сравнении со смежными понятиями

Важно отличать веса модели от других связанных терминов в машинном обучении:

  • Гиперпараметры: В отличие от весов, которые изучаются, гиперпараметры настраиваются до начала обучения. Примеры включают скорость обучения, размер пакета и выбор оптимизатора. Процесс поиска наилучшей конфигурации гиперпараметров известен как настройка гиперпараметров.
  • Смещения: Веса и смещения являются изученными параметрами. Однако веса масштабируют выходные данные нейрона, а член смещения сдвигает их. Вместе они дают нейронной сети гибкость для соответствия данным.
  • Model Architecture (архитектура модели): Архитектура (например, backbone (основная сеть) или detection head (детектирующая головка)) — это чертеж модели — она определяет слои и то, как они связаны. Веса — это значения внутри этой структуры. Одна и та же архитектура может иметь бесчисленное множество различных наборов весов в зависимости от того, как она была обучена. Вы можете изучить различные сравнения моделей, чтобы увидеть, как различаются архитектуры.

Управление весами и их отслеживание

По мере усложнения моделей управление их весами и экспериментами, в результате которых они создаются, становится критически важным для воспроизводимости и совместной работы. Такие инструменты, как Weights & Biases (W&B), предоставляют платформу специально для MLOps, позволяя командам отслеживать гиперпараметры, метрики, версии кода и результирующие веса моделей для каждого эксперимента. Важно отметить, что платформа «Weights & Biases» отличается от понятий «веса» и «смещения» как параметров внутри нейронной сети; платформа помогает управлять процессом поиска оптимальных весов и смещений. Вы можете узнать больше об интеграции Ultralytics с W&B в документации. Эффективное управление является ключевым для задач, начиная от подбора гиперпараметров и заканчивая развертыванием моделей с использованием таких фреймворков, как PyTorch или TensorFlow. Платформы, такие как Ultralytics HUB, также предоставляют интегрированные решения для управления всем жизненным циклом модели.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена