Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Эталонный набор данных

Узнайте, как эталонные наборы данных стимулируют инновации в области ИИ, обеспечивая справедливую оценку моделей, воспроизводимость и прогресс в машинном обучении.

Эталонный набор данных - это стандартизированная, высококачественная коллекция данных, используемая для оценки производительности моделей машинного обучения (ML) справедливым и воспроизводимым образом. В отличие от частных данных, используемых для внутреннего тестирования, эталонные наборы данных служат публичным "измерительной палкой" для всего исследовательского сообщества. Тестируя различные алгоритмы на одних и тех же входных данных и используя идентичные метрики оценки, разработчики могут объективно определить, какие модели обеспечивают более высокую точность, скорость или эффективность. Такие наборы данных являются основополагающими для отслеживания прогресса в таких областях, как компьютерное зрение (КВ) и обработка естественного языка обработка.

Важность стандартизации

В условиях стремительно развивающегося ландшафта искусственного интеллекта (ИИ), утверждение о том, что Заявления о том, что новая модель "быстрее" или "точнее", бессмысленны без общей точки отсчета. ориентира. Такую точку опоры обеспечивают эталонные наборы данных. Как правило, они подбираются для решения конкретных задач, например, обнаружение мелких объектов или работа в условиях плохого освещения. Популярные задачи, такие как ImageNet Large Scale Visual Recognition Challenge (ILSVRC), опираются на эти наборы данных для стимулирования здоровой конкуренции. Такая стандартизация гарантирует, что усовершенствования в архитектуры моделей являются подлинным прогрессом а не результат тестирования на более простых, нестандартных данных.

Отличие эталона от других наборов данных

Очень важно отличать эталонные наборы данных от наборов данных, используемых в стандартном жизненном цикле разработки:

  • Учебные данные: Это материал, используемый для обучения модели. На основе этих данных алгоритм настраивает свои внутренние параметры.
  • Валидационные данные: Подмножество, используемое во время обучения для настройки гиперпараметров и предотвращения перегрузки. Оно действует как предварительная проверка, но не не представляет собой окончательный результат.
  • Тестовые данные: Внутренний набор данных, используемый для проверки производительности перед выпуском.
  • Эталонный набор данных: Общепризнанный внешний тестовый набор. Эталон выступает в качестве тестовых данных, его главное отличие - роль общественного стандарта для сравнения моделей.

Применение в реальном мире

Эталонные наборы данных определяют успех в различных отраслях промышленности, устанавливая строгие стандарты безопасности и надежности.

Обнаружение объектов в системе технического зрения общего назначения

Наиболее ярким примером в области обнаружения объектов является набор данных COCO (Common Objects in Context). Когда Ultralytics выпускает новую архитектуру, например YOLO11ее производительность строго сравнивается с COCO , чтобы убедиться в улучшении средней точности (mAP). Этот позволяет исследователям увидеть, как именно YOLO11 сравнивается с предыдущими итерациями или другими современными моделями в области обнаружении повседневных объектов, таких как люди, велосипеды и животные.

Безопасность автономного вождения

В автомобильной промышленности безопасность имеет первостепенное значение. Разработчики автономных транспортных средств используют специализированные бенчмарки, такие как KITTI Vision Benchmark Suite или Waymo Open Dataset. Эти наборы данных содержат сложные аннотированные записи городской дорожной обстановки, включая пешеходов, велосипедистов и дорожные знаки. Оценивая системы восприятия по этим эталонам, инженеры могут количественно оценить устойчивость системы в реальных дорожных условиях, гарантируя, что ИИ правильно реагирует на динамические опасности.

Бенчмаркинг с помощью Ultralytics

Ultralytics предоставляет встроенные инструменты для легкого сравнения моделей в различных форматах экспорта, таких как ONNX или TensorRT. Это помогает пользователям определить наилучший компромисс между задержкой вывода и точностью для конкретного оборудования.

Следующий пример демонстрирует, как провести бенчмаркинг модели YOLO11 с помощью API Python . Этот процесс оценивает скорость и точность модели на стандартном наборе данных.

from ultralytics import YOLO

# Load the official YOLO11 nano model
model = YOLO("yolo11n.pt")

# Run benchmarks to evaluate performance across different formats
# This checks speed and accuracy on the COCO8 dataset
results = model.benchmark(data="coco8.yaml", imgsz=640, half=False)

Проблемы бенчмаркинга

Хотя эталоны очень важны, они не безупречны. Явление, известное как "предвзятость набора данных", может возникнуть, если эталон неточно отражает разнообразие реального мира. Например. эталон распознавания лиц, не имеющий разнообразного Например, эталон распознавания лиц, в котором не представлены различные демографические группы, может привести к тому, что модели будут плохо работать с определенными группами. Кроме того, исследователи должны избегать "обучения под тест", когда они оптимизируют модель специально для получения высоких результатов на эталоне за счет в ущерб обобщению на новые, неизвестные данные. Постоянное обновление наборов данных, как, например, в проекте Проект Objects365, помогает смягчить эти проблемы за счет увеличения разнообразия и масштаба.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас