Автоматизированное машинное обучение (AutoML)
Ускорьте проекты машинного обучения с помощью AutoML! Автоматизируйте подготовку данных, выбор и настройку моделей, чтобы сэкономить время и сделать ИИ доступным для всех.
Автоматизированное машинное обучение (AutoML) представляет собой процесс автоматизации сквозного процесса применения машинного обучения (ML) для решения реальных задач. Основная цель AutoML - упростить и ускорить разработку ML-моделей, сделав передовые методы доступными даже для тех, кто не обладает глубокими знаниями в области науки о данных или ML. Автоматизируя повторяющиеся и трудоемкие задачи, AutoML позволяет разработчикам и исследователям создавать высокопроизводительные модели более эффективно, сокращая необходимость в обширной ручной настройке и экспериментах. Автоматизация охватывает различные этапы, от подготовки исходных данных до развертывания оптимизированных моделей.
Основные автоматизированные задачи в AutoML
Системы AutoML автоматизируют несколько основных компонентов типичного рабочего процесса ML:
- Предварительная обработка данных: Автоматическое выполнение таких задач, как очистка данных, обработка пропущенных значений, преобразование типов данных и применение таких методов, как нормализация или стандартизация, для подготовки обучающих данных к моделированию.
- Инженерная характеристика: Автоматизация создания, выбора и преобразования входных признаков для повышения эффективности модели. Для этого могут использоваться методы, рассмотренные в концепциях инженерии признаков.
- Выбор модели: Автоматический выбор наилучшего типа модели (например, дерева решений, нейронной сети, SVM) для данной задачи и набора данных из множества возможных, включая архитектуры обнаружения объектов, такие как Ultralytics YOLO.
- Настройка гиперпараметров: Оптимизация гиперпараметров модели (например, скорости обучения, размера партии) с помощью таких методов, как поиск по сетке, случайный поиск или более сложные методы, такие как байесовская оптимизация, для достижения максимальной производительности.
Преимущества AutoML
Использование AutoML дает значительные преимущества:
- Эффективность: Значительное сокращение времени и вычислительных ресурсов, необходимых для разработки и точной настройки ML-моделей.
- Доступность: Снижает барьер для входа в систему ML, позволяя экспертам и разработчикам, не имеющим достаточного опыта в области ML, использовать мощные возможности прогнозирования. Ultralytics HUB призван еще больше упростить этот процесс.
- Производительность: Часто определяет модели и конфигурации, которые достигают высокой точности и устойчивости, иногда превосходя модели, разработанные вручную, путем исследования обширного пространства поиска.
- Снижение предвзятости: автоматизируя выбор и настройку моделей, AutoML может помочь снизить предвзятость ИИ, которая может возникнуть при ручном выборе, хотя тщательный надзор за предвзятостью набора данных по-прежнему крайне важен.
Применение в реальном мире
AutoML находит применение в самых разных отраслях:
AutoML в сравнении со смежными концепциями
Полезно отличать AutoML от смежных областей:
- AutoML vs. MLOps: Если AutoML нацелен на автоматизацию построения моделей (выбор, обучение, настройка), то Machine Learning Operations (MLOps) охватывает весь жизненный цикл ML. MLOps включает в себя развертывание, мониторинг, управление и контроль, обеспечивая надежную работу моделей в производстве. AutoML часто является компонентом более крупной системы MLOps, упрощая начальный этап разработки до развертывания и мониторинга моделей.
- AutoML vs. NAS: Поиск нейронной архитектуры (NAS) - это подполе AutoML, ориентированное на автоматическое проектирование архитектуры нейронных сетей (НС). В то время как NAS автоматизирует проектирование сетей, более широкие инструменты AutoML могут также автоматизировать разработку функций и настройку гиперпараметров для различных типов моделей, а не только NN.