Отслеживайте эксперименты ML: записывайте гиперпараметры, наборы данных, метрики и артефакты для воспроизводимого обучения моделей. Научитесь организовывать запуски с помощью Ultralytics YOLO11.
Отслеживание экспериментов — это систематический процесс регистрации, организации и анализа переменных, метрик и артефактов, генерируемых во время обучения модели машинного обучения. Подобно лабораторному журналу ученого, эта практика создает исчерпывающий цифровой отчет о каждой проверенной гипотезе, обеспечивая строгость, прозрачность и воспроизводимость этапа исследований и разработок . Записывая такие входные данные, как гиперпараметры и версии наборов данных, наряду с выходными данными, такими как графики производительности и обученные веса, отслеживание экспериментов преобразует часто итеративный и хаотичный характер обучения модели в структурированный, основанный на данных рабочий процесс. Такая организация имеет решающее значение для команд, стремящихся эффективно создавать надежные системы искусственного интеллекта (ИИ), позволяя им точно определять, какие конфигурации дают наилучшие результаты.
Для эффективного управления жизненным циклом проекта компьютерного зрения надежная система отслеживания обычно регистрирует три отдельных категории информации. Организация этих компонентов позволяет разработчикам сравнивать различные итерации и определять оптимальную конфигурацию для конкретного случая использования.
Строгое применение отслеживания экспериментов имеет важное значение в отраслях, где точность и безопасность имеют первостепенное значение. Это позволяет инженерным командам просматривать исторические данные, чтобы понять, почему модель ведет себя определенным образом.
В области здравоохранения исследователи используют анализ медицинских изображений, чтобы помочь врачам в диагностике заболеваний. Например, при обучении модели для обнаружения опухолей головного мозга инженеры могут провести сотни экспериментов, варьируя методы увеличения объема данных. Отслеживание экспериментов позволяет им выделить конкретную комбинацию этапов предварительной обработки, которая дала наибольшую чувствительность, гарантируя, что развернутый ИИ-агент минимизирует ложные отрицательные результаты в критических диагностических сценариях.
Разработка автономных транспортных средств требует обработки огромных объемов данных с датчиков для detect , дорожных знаков и препятствий. Команды, работающие над обнаружением объектов для самоуправляемых автомобилей, должны оптимизировать как точность, так и задержку вывода. Отслеживая эксперименты, они могут анализировать компромисс между размером модели и скоростью, обеспечивая, чтобы конечная система реагировала в режиме реального времени без ущерба для стандартов безопасности, установленных такими организациями, как Национальная администрация безопасности дорожного движения (NHTSA).
Хотя отслеживание экспериментов является фундаментальной частью MLOps (операции машинного обучения), его часто путают с другими похожими терминами. Понимание различий важно для реализации правильного рабочего процесса.
Современные AI-фреймворки упрощают отслеживание экспериментов, позволяя разработчикам легко регистрировать запуски в локальных каталогах или на удаленных серверах. При использовании Ultralytics отслеживание может быть эффективно организовано путем определения имен проектов и запусков . Эта структура создает иерархию каталогов, которая разделяет различные экспериментальные гипотезы.
В следующем примере показано, как обучить модель YOLO26— новейший стандарт скорости и точности — с явным указанием названия проекта и запуска эксперимента. Это гарантирует, что метрики, журналы и веса будут сохранены в упорядоченном виде для будущего сравнения.
from ultralytics import YOLO
# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model, specifying 'project' and 'name' for organized tracking
# Results will be saved to 'runs/detect/experiment_tracking_demo'
results = model.train(data="coco8.yaml", epochs=5, project="runs/detect", name="experiment_tracking_demo")
Для визуализации и управления зарегистрированными данными разработчики полагаются на специализированное программное обеспечение. Эти инструменты часто оснащены панелями управления , которые позволяют проводить параллельное сравнение кривых обучения и таблиц метрик.