Fine-tuning

Узнай, как дообучение (fine-tuning) адаптирует предварительно обученные модели, такие как Ultralytics YOLO26, к специализированным задачам. Научись использовать трансферное обучение для более быстрого и точного ИИ.

Дообучение — это фундаментальный процесс в машинном обучении (ML), который предполагает адаптацию предварительно обученной модели под конкретную задачу или набор данных. Вместо обучения с нуля — что требует огромного количества данных, времени и вычислительных мощностей, — разработчики начинают с «базовой модели», которая уже изучила общие признаки на огромном массиве данных, таком как ImageNet. Этот подход является практической реализацией обучения с переносом знаний, позволяя ИИ-системам достигать высокой производительности в узкоспециализированных задачах с использованием значительно меньших ресурсов.

Link to this sectionМеханика адаптации#

Основная идея дообучения заключается в использовании «знаний», которые модель уже приобрела. Базовая модель обычно обладает надежным пониманием фундаментальных визуальных элементов, таких как границы, текстуры и формы. В процессе дообучения параметры (веса) модели слегка корректируются, чтобы учесть нюансы новых, специализированных данных.

Эта корректировка обычно достигается посредством градиентного спуска с использованием более низкого коэффициента обучения. Консервативный коэффициент обучения гарантирует, что ценные признаки, полученные во время начального предварительного обучения, будут уточнены, а не разрушены. Во многих рабочих процессах компьютерного зрения (CV) инженеры могут заморозить начальные слои backbone (которые обнаруживают универсальные признаки) и обновлять только более глубокие слои и detection head, отвечающую за финальное прогнозирование классов.

Link to this sectionРеальные приложения#

Дообучение сокращает разрыв между общими возможностями ИИ и конкретными отраслевыми требованиями. Оно позволяет универсальным моделям становиться узкоспециализированными экспертами.

ИИ в здравоохранении: Стандартная модель компьютерного зрения может отличить кошек от собак, но ей не хватает медицинского контекста. Дообучая такую модель на наборах данных медицинского анализа изображений, содержащих аннотированные рентгеновские снимки, исследователи могут создавать диагностические инструменты для обнаружения пневмонии или переломов с высокой точностью. Это помогает рентгенологам в условиях интенсивной работы, позволяя расставлять приоритеты для критических случаев.
ИИ в производстве: В промышленных условиях готовые модели могут не распознать проприетарные компоненты. Производители используют дообучение для адаптации передовых архитектур, таких как YOLO26, к своим конкретным сборочным линиям. Это позволяет автоматизированным системам контроля качества обнаруживать мельчайшие дефекты, такие как микротрещины или дефекты окраски, улучшая надежность продукции и сокращая количество отходов.

Link to this sectionДообучение против обучения с нуля#

Полезно различать дообучение и полноценное обучение, чтобы понимать, когда следует использовать каждый из подходов.

Обучение с нуля: Этот процесс включает инициализацию модели случайными весами и ее обучение на наборе данных до сходимости. Для этого требуется очень большой размеченный набор данных и значительные ресурсы GPU. Обычно это применяется для создания новых архитектур или когда предметная область совершенно уникальна (например, анализ туманностей в глубоком космосе против повседневных объектов).
Дообучение: Начинается с оптимизированных весов. Требует гораздо меньше данных (часто всего несколько тысяч изображений) и обучается значительно быстрее. Для большинства бизнес-задач, таких как управление складскими запасами в ритейле или мониторинг безопасности, дообучение является наиболее эффективным путем к внедрению.

Link to this sectionРеализация дообучения с Ultralytics#

Современные фреймворки делают этот процесс доступным. Например, платформа Ultralytics упрощает рабочий процесс, автоматически обрабатывая управление наборами данных и облачное обучение. Тем не менее, разработчики также могут дообучать модели локально, используя Python.

Следующий пример демонстрирует, как дообучить предварительно обученную модель YOLO26 на собственном наборе данных. Обрати внимание, что мы загружаем yolo26n.pt (предварительно обученные веса), а не упрощенный конфигурационный файл, что дает библиотеке сигнал начать обучение с переносом знаний.

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (n=nano size)
# This automatically loads weights trained on COCO
model = YOLO("yolo26n.pt")

# Fine-tune the model on a custom dataset (e.g., 'coco8.yaml')
# The 'epochs' argument determines how many passes over the data occur
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# The model is now fine-tuned and ready for specific inference tasks

Link to this sectionКлючевые факторы успеха#

Для достижения наилучших результатов качество нового набора данных имеет первостепенное значение. Использование инструментов для аугментации данных может искусственно расширить небольшой набор данных за счет поворота, отражения или настройки яркости изображений, предотвращая переобучение. Кроме того, отслеживание метрик, таких как валидационные потери и средняя точность (mAP), гарантирует, что модель будет хорошо обобщать данные, с которыми она ранее не сталкивалась.

Для тех, кто управляет сложными рабочими процессами, использование стратегий MLOps и таких инструментов, как отслеживание экспериментов, поможет поддерживать контроль версий различных итераций дообучения. Будь то обнаружение объектов или сегментация экземпляров, дообучение остается отраслевым стандартом для внедрения эффективных ИИ-решений.