Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Отслеживание экспериментов

Отслеживайте эксперименты ML: записывайте гиперпараметры, наборы данных, метрики и артефакты для воспроизводимого обучения моделей. Научитесь организовывать запуски с помощью Ultralytics YOLO11.

Отслеживание экспериментов — это систематический процесс регистрации, организации и анализа переменных, метрик и артефактов, генерируемых во время обучения модели машинного обучения. Подобно лабораторному журналу ученого, эта практика создает исчерпывающий цифровой отчет о каждой проверенной гипотезе, обеспечивая строгость, прозрачность и воспроизводимость этапа исследований и разработок . Записывая такие входные данные, как гиперпараметры и версии наборов данных, наряду с выходными данными, такими как графики производительности и обученные веса, отслеживание экспериментов преобразует часто итеративный и хаотичный характер обучения модели в структурированный, основанный на данных рабочий процесс. Такая организация имеет решающее значение для команд, стремящихся эффективно создавать надежные системы искусственного интеллекта (ИИ), позволяя им точно определять, какие конфигурации дают наилучшие результаты.

Основные компоненты отслеживания экспериментов

Для эффективного управления жизненным циклом проекта компьютерного зрения надежная система отслеживания обычно регистрирует три отдельных категории информации. Организация этих компонентов позволяет разработчикам сравнивать различные итерации и определять оптимальную конфигурацию для конкретного случая использования.

  • Параметры и конфигурация: это переменные, задаваемые до начала обучения. К ним относятся скорость обучения, выбор оптимизатора (например, Adam ), размер партии и конкретная архитектура модели, такая как последняя версия YOLO26. Отслеживание этих параметров гарантирует, что любой успешный запуск может быть точно воспроизведен.
  • Показатели эффективности: это количественные показатели, регистрируемые во время обучения для оценки успешности. К общим показателям относятся функции потерь для измерения ошибки, точность для задач классификации и средняя средняя точность (mAP) для обнаружения объектов.
  • Артефакты и результаты: Артефакты — это материальные файлы, созданные в ходе выполнения, такие как веса обученной модели, графики визуализации, например матрицы путаницы, и журналы среды.

Актуальность в реальных приложениях

Строгое применение отслеживания экспериментов имеет важное значение в отраслях, где точность и безопасность имеют первостепенное значение. Это позволяет инженерным командам просматривать исторические данные, чтобы понять, почему модель ведет себя определенным образом.

Медицинская визуализация и диагностика

В области здравоохранения исследователи используют анализ медицинских изображений, чтобы помочь врачам в диагностике заболеваний. Например, при обучении модели для обнаружения опухолей головного мозга инженеры могут провести сотни экспериментов, варьируя методы увеличения объема данных. Отслеживание экспериментов позволяет им выделить конкретную комбинацию этапов предварительной обработки, которая дала наибольшую чувствительность, гарантируя, что развернутый ИИ-агент минимизирует ложные отрицательные результаты в критических диагностических сценариях.

Безопасность автономных транспортных средств

Разработка автономных транспортных средств требует обработки огромных объемов данных с датчиков для detect , дорожных знаков и препятствий. Команды, работающие над обнаружением объектов для самоуправляемых автомобилей, должны оптимизировать как точность, так и задержку вывода. Отслеживая эксперименты, они могут анализировать компромисс между размером модели и скоростью, обеспечивая, чтобы конечная система реагировала в режиме реального времени без ущерба для стандартов безопасности, установленных такими организациями, как Национальная администрация безопасности дорожного движения (NHTSA).

Дифференциация смежных понятий

Хотя отслеживание экспериментов является фундаментальной частью MLOps (операции машинного обучения), его часто путают с другими похожими терминами. Понимание различий важно для реализации правильного рабочего процесса.

  • Отслеживание экспериментов и мониторинг моделей: отслеживание экспериментов происходит на этапе разработки и обучения («офлайн»). В отличие от этого, мониторинг моделей осуществляется после того, как модель развернута в производственной среде («онлайн»). Мониторинг направлен на выявление таких проблем, как смещение данных или снижение производительности на реальных данных, тогда как отслеживание направлено на оптимизацию модели до того, как она дойдет до пользователей.
  • Отслеживание экспериментов и контроль версий: такие инструменты, как Git, обеспечивают контроль версий исходного кода, отслеживая изменения в текстовых файлах с течением времени. Отслеживание экспериментов идет еще дальше, связывая конкретную версию этого кода с конкретными данными, параметрами и результатами учебного прогона. В то время как контроль версий отвечает на вопрос «Как изменился код?», отслеживание экспериментов отвечает на вопрос «Какие параметры позволили создать лучшую модель?».

Реализация с помощью Ultralytics YOLO

Современные AI-фреймворки упрощают отслеживание экспериментов, позволяя разработчикам легко регистрировать запуски в локальных каталогах или на удаленных серверах. При использовании Ultralytics отслеживание может быть эффективно организовано путем определения имен проектов и запусков . Эта структура создает иерархию каталогов, которая разделяет различные экспериментальные гипотезы.

В следующем примере показано, как обучить модель YOLO26— новейший стандарт скорости и точности — с явным указанием названия проекта и запуска эксперимента. Это гарантирует, что метрики, журналы и веса будут сохранены в упорядоченном виде для будущего сравнения.

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model, specifying 'project' and 'name' for organized tracking
# Results will be saved to 'runs/detect/experiment_tracking_demo'
results = model.train(data="coco8.yaml", epochs=5, project="runs/detect", name="experiment_tracking_demo")

Популярные инструменты и интеграции

Для визуализации и управления зарегистрированными данными разработчики полагаются на специализированное программное обеспечение. Эти инструменты часто оснащены панелями управления , которые позволяют проводить параллельное сравнение кривых обучения и таблиц метрик.

  • MLflow: платформа с открытым исходным кодом, которая управляет жизненным циклом машинного обучения, включая экспериментирование, воспроизводимость и развертывание. ИнтеграцияUltralytics позволяет беспрепятственно регистрировать метрики во время YOLO .
  • TensorBoard: первоначально разработан для TensorFlow, этот набор инструментов визуализации широко используется в различных фреймворках, включая PyTorch, для проверки кривых потерь и визуальных элементов. Вы можете легко визуализировать метрики обучения с помощью интеграции TensorBoard.
  • DVC (Data Version Control): DVC расширяет концепцию отслеживания на наборы данных и модели, обрабатывая большие файлы, с которыми Git не может справиться. Использование интеграции DVC помогает поддерживать строгое управление версиями данных, используемых в каждом эксперименте.
  • Weights & Biases: платформа для MLOps, ориентированная на разработчиков, которая помогает командам track , версии моделей и визуализировать результаты. Weights & Biases предоставляет богатые интерактивные диаграммы для анализа сложных тренировочных прогонов

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас