Глоссарий

Вес модели

Узнайте о важности весов моделей в машинном обучении, их роли в прогнозировании и о том, как Ultralytics YOLO упрощает их использование для задач ИИ.

Веса модели - это числовые параметры нейронной сети, которые настраиваются в процессе обучения. Эти значения, по сути, представляют собой знания, полученные моделью. Считайте их коэффициентами в очень сложном уравнении; настраивая эти коэффициенты, модель учится сопоставлять входные данные, например изображение, с желаемым результатом, например ограничительной рамкой вокруг объекта. Качество весовых коэффициентов модели напрямую определяет ее производительность в конкретной задаче, такой как классификация изображений или обнаружение объектов.

Как определяется вес

Веса модели не задаются вручную, а "обучаются" на основе данных. Процесс начинается с инициализации весов небольшими случайными числами. В процессе обучения модель делает предсказания на обучающих данных, а функция потерь вычисляет, насколько ошибочны эти предсказания. Этот сигнал ошибки затем используется в процессе, называемом обратным распространением, для вычисления градиента потерь относительно каждого веса. Алгоритм оптимизации, такой как стохастический градиентный спуск (SGD), затем корректирует веса в направлении, противоположном градиенту, чтобы минимизировать ошибку. Этот цикл повторяется в течение многих эпох, пока производительность модели на отдельном наборе данных для проверки не перестанет улучшаться, что является признаком того, что она изучила закономерности в данных.

Важность предварительно обученных весов

Обучение современной модели с нуля требует огромных вычислительных ресурсов и массивных наборов данных. Чтобы решить эту проблему, сообщество специалистов по компьютерному зрению широко использует предварительно обученные веса. Для этого берется модель, например модель Ultralytics YOLO, которая уже была обучена на большом наборе данных общего назначения, таком как COCO. Эти веса служат отличной отправной точкой для решения новой, специфической задачи с помощью процесса, называемого обучением с переносом. Начав с предварительно обученных весов, вы сможете добиться более высокой точности при меньшем количестве данных и меньшем времени обучения благодаря процессу, известному как тонкая настройка.

Применение в реальном мире

  • Анализ медицинских изображений: Разработчик может взять модель YOLOv8 с предварительно обученными весами и точно настроить ее на пользовательском наборе данных снимков опухолей мозга. Полученная модель имеет веса, специально оптимизированные для выявления тонких особенностей опухолей, что помогает радиологам в диагностике. Это одно из ключевых применений ИИ в здравоохранении.
  • Управление запасами в розничной торговле: Компания розничной торговли может использовать модель для мониторинга полок и подсчета товаров. Модель обнаружения объектов настраивается на изображениях товаров магазина. Итоговые веса позволяют модели точно обнаруживать и подсчитывать конкретные товары для автоматизированного отслеживания запасов.

Вес в сравнении со смежными понятиями

Важно отличать веса моделей от других связанных с ними терминов в машинном обучении:

  • Гиперпараметры: В отличие от весов, которые обучаются, гиперпараметры настраиваются до начала обучения. В качестве примера можно привести скорость обучения, размер партии и выбор оптимизатора. Процесс поиска наилучшей конфигурации гиперпараметров называется настройкой гиперпараметров.
  • Смещение: Веса и смещения - оба обучаемые параметры. Однако веса масштабируют выход нейрона, а член смещения смещает его. Вместе они обеспечивают нейронной сети гибкость в подборе данных.
  • Архитектура модели: Архитектура (например, магистраль или головка обнаружения) - это план модели, определяющий слои и способы их соединения. Веса - это значения в этой структуре. Одна и та же архитектура может иметь бесчисленное множество различных наборов весов в зависимости от того, как она была обучена. Вы можете изучить различные сравнения моделей, чтобы увидеть, как различаются архитектуры.

Управление и отслеживание веса

По мере усложнения моделей управление их весами и экспериментами, в результате которых они получаются, приобретает решающее значение для воспроизводимости и сотрудничества. Такие инструменты, как Weights & Biases (W&B), предоставляют платформу специально для MLOps, позволяя командам отслеживать гиперпараметры, метрики, версии кода и результирующие веса моделей для каждого эксперимента. Важно отметить, что платформа "Weights & Biases" отличается от понятий "веса" и "смещения" как параметров нейронной сети; платформа помогает управлять процессом поиска оптимальных весов и смещений. Подробнее об интеграции Ultralytics с W&B вы можете узнать из документации. Эффективное управление является ключевым для задач, начиная от настройки гиперпараметров и заканчивая развертыванием моделей с помощью таких фреймворков, как PyTorch или TensorFlow. Платформы, подобные Ultralytics HUB, также предоставляют интегрированные решения для управления всем жизненным циклом модели.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена