Глоссарий

Тонкая настройка

Тонкая настройка моделей машинного обучения, таких как Ultralytics YOLO, для решения конкретных задач. Узнайте о методах, приложениях и лучших практиках здесь!

Тонкая настройка - один из основных методов машинного обучения (ML), который предполагает использование модели, предварительно обученной на большом общем наборе данных, и ее дальнейшее обучение на меньшем специализированном наборе данных. Этот процесс, представляющий собой форму трансферного обучения, позволяет адаптировать полученные моделью знания для успешного выполнения конкретной задачи без необходимости обучать модель с нуля. Начав с мощной базовой модели, разработчики могут добиться высокой производительности при значительно меньшем объеме данных и вычислительных ресурсов. Эта концепция изучается такими учреждениями, как Стэнфордская лаборатория искусственного интеллекта.

Как работает точная настройка

Процесс начинается с создания модели, веса которой уже оптимизированы на широком наборе данных, например ImageNet для зрительных систем или массивном текстовом корпусе для больших языковых моделей (LLM). Эта предварительно обученная модель уже понимает общие характеристики - например, края и текстуры на изображениях или грамматику и семантику в тексте. Затем процесс обучения продолжается, как правило, с использованием более низкой скорости обучения, на специальном наборе данных, адаптированном к целевому приложению. Таким образом, параметры модели подстраиваются под специфические нюансы новой задачи. Такие фреймворки, как PyTorch и TensorFlow, предоставляют обширные инструменты для реализации рабочих процессов тонкой настройки.

Применение в реальном мире

Тонкая настройка широко используется в компьютерном зрении (CV) и обработке естественного языка (NLP).

  • Анализ медицинских изображений: Такая модель, как Ultralytics YOLO11, предварительно обученная для общего обнаружения объектов на наборе данных COCO, может быть точно настроена на специализированной коллекции снимков МРТ для точного обнаружения опухолей. Такая настройка очень важна для создания надежных решений ИИ в здравоохранении.
  • Пользовательские чат-боты: Компания может точно настроить мощную LLM, такую как BERT, на своей внутренней документации и журналах поддержки клиентов. Полученная модель становится экспертом по продуктам компании, что позволяет создать высокоэффективный чат-бот с учетом контекста для ее веб-сайта. Многие подобные модели доступны на платформах вроде Hugging Face.

Тонкая настройка по сравнению со смежными понятиями

Важно отличать тонкую настройку от других методов адаптации модели:

  • Обучение с нуля: Это инициализация нейронной сети со случайными весами и ее обучение на наборе данных. Это требует огромных объемов данных и вычислительных мощностей (например, GPU) и, как правило, менее эффективно, чем тонкая настройка предварительно обученной модели.
  • Параметрически эффективная тонкая настройка (PEFT): PEFT - это набор методов, которые представляют собой более эффективную с точки зрения ресурсов эволюцию точной настройки. Вместо того чтобы обновлять все веса модели, методы PEFT, такие как LoRA, замораживают исходную модель и обучают лишь небольшое количество новых параметров. Это значительно снижает требования к памяти и хранилищу данных, что упрощает адаптацию очень больших моделей от таких организаций, как Meta AI или Google.
  • Оперативная настройка: Особый метод PEFT, при котором все исходные веса модели замораживаются. Вместо того чтобы настраивать саму модель, она обучается специальным "мягким подсказкам" (обучаемым вкраплениям), которые добавляются к входным данным, чтобы направлять вывод модели для решения конкретной задачи.
  • Retrieval-Augmented Generation (RAG): Эта техника улучшает результаты модели, предоставляя внешние знания во время вывода, а не изменяя весовые коэффициенты модели в процессе обучения. RAG извлекает релевантную информацию из базы данных и добавляет ее в подсказку для получения более точных и актуальных ответов.

Тонкая настройка с помощью ультралайтинга

Ultralytics упрощает процесс тонкой настройки своих современных моделей YOLO для пользовательских приложений. Пользователи могут легко загрузить предварительно обученные веса и начать обучение на собственных наборах данных для таких задач, как классификация, обнаружение или сегментация изображений. Платформа Ultralytics HUB еще больше упрощает этот рабочий процесс, предоставляя интегрированное решение для управления наборами данных, обучения моделей и их последующего развертывания. Для достижения наилучшей производительности тонкая настройка часто сочетается с тщательной настройкой гиперпараметров.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена