Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Аннотация данных

Что такое аннотация данных? Узнайте, как маркировка данных с помощью ограничивающих рамок или полигонов необходима для обучения точных моделей ИИ и компьютерного зрения.

Аннотирование данных - это процесс маркировки, пометки или расшифровки исходных данных для обеспечения контекста, который может быть понят моделью машинного обучения (ML). Модель машинного обучения (ML) может его понять. Этот шаг является основополагающим для контролируемого обучения, где алгоритмы опираются на помеченные примеры для изучения закономерностей и составления прогнозов. Аннотированные данные служат в качестве базовой истиной, представляющей "правильный" ответ. который модель стремится воспроизвести в процессе обучения. Без точного аннотирования даже такие сложные архитектуры, как такие как Ultralytics YOLO11 не могут работать эффективно, поскольку производительность модели неразрывно связана с качеством ее обучающих данных.

Роль аннотаций в компьютерном зрении

В области компьютерного зрения (КЗ) аннотация данных аннотация включает в себя маркировку определенных особенностей в изображениях или видеокадрах. Разные задачи требуют различных стили аннотирования, каждый из которых обеспечивает уникальный уровень детализации системы.

  • Обнаружение объектов: Аннотаторы Рисуйте двумерные ограничительные рамки вокруг объектов, представляющих интерес, таких как автомобили или пешеходы. Это учит модель тому , что представляет собой объект и где он находится.
  • Сегментация объектов: Эта техника требует отслеживания точных многоугольников вокруг объектов. В отличие от ограничительных рамок, сегментация отображает точную точную форму и контур объекта, что очень важно для таких приложений, как роботизированного захвата.
  • Оценка позы: Аннотаторы отмечают определенные "ключевые точки" на объекте, например, суставы человеческого тела (локти, колени, плечи). Это позволяет модели track движения и позу.
  • Ориентированные ограничивающие рамки (Oriented Bounding Boxes, OBB): Используются для объектов, не совмещенных с осью изображения, например кораблей на спутниковых снимках или упаковок на конвейерной ленте. Эти рамки могут поворачиваться в соответствии с ориентацией объекта.
  • Классификация изображений: Сайт Простейшая форма аннотирования, при которой единственная метка (например, "солнечный", "дождливый") присваивается всему изображению. всему изображению.

Аннотации обычно сохраняются в структурированных форматах, таких как JSON, XML или простые текстовые файлы (например, формат YOLO ), которые затем разбираются обучающим программным обеспечением. программное обеспечение для обучения.

Применение в реальном мире

Аннотирование данных позволяет использовать бесчисленное множество современных технологий, преодолевая разрыв между необработанными датчиками и интеллектуальными решениями. принятием решений.

  1. Автономные транспортные средства: Самоуправляемые автомобили зависят от огромных массивов данных, в которых аннотированы каждая разметка, дорожный знак и препятствие. Данные с камер и датчиков LiDAR маркируются, чтобы обучить систему восприятия автомобиля для обучения системы восприятия безопасной навигации. Такой уровень детализации крайне важен для разработки надежных ИИ в автомобильных решениях.
  2. Медицинская диагностика: В ИИ в здравоохранении, радиологи аннотируют снимки МРТ или рентгеновские снимки, чтобы выделить опухоли и переломы. Эти аннотированные медицинские изображения позволяют моделям помогать врачам, отмечая потенциальные аномалии с высокой чувствительностью.
  3. Умная розничная торговля: Автоматизированные кассовые системы используют аннотации для распознавания товаров. Благодаря маркировке тысячи наименований продуктов, системы могут обеспечить беспрепятственный процесс покупки. См. подробнее ИИ в розничной торговле.

Сравнение со смежными понятиями

Полезно отличать аннотирование данных от других терминов, часто используемых в процессе подготовки данных.

  • Аннотация и маркировка данных: Эти термины часто используются как взаимозаменяемые. Однако "маркировка" часто ассоциируется с простыми классификационными задачами (присвоение категории), в то время как "аннотация" часто подразумевает более сложные метаданные например, рисование геометрии (полигоны, коробки) или маркировка временных меток в видео.
  • Аннотация по сравнению с дополнением данных: Аннотация создает первоначальные метки для набора данных. Дополнение данных - это отдельный процесс, который искусственно расширяет этот набор данных, изменяя существующие аннотированные изображения (например, переворачивая, вращая или изменяя яркость). для повышения надежности модели.
  • Аннотация против активного обучения: Активное обучение - это стратегия, при которой модель определяет, какие точки данных вызывают у нее наибольшее недоумение, и запрашивает у человека аннотацию только для этих конкретных примеров. аннотацию только для этих конкретных примеров, оптимизируя бюджет на аннотацию.

Инструменты и рабочий процесс

Для создания высококачественных аннотаций часто требуются специализированные инструменты. Варианты с открытым исходным кодом, такие как CVAT (Computer Vision Annotation Tool) и Label Studio обеспечивают интерфейсы для рисования квадратов и многоугольников. Для крупномасштабных операций, команды могут перейти на интегрированные среды, такие как готовящаяся платформа Ultralytics Platform, которая упрощает жизненный цикл от поиска данных до развертывания модели.

После того как данные аннотированы, их можно использовать для обучения модели. В следующем примере показано, как обучить модель YOLO11 используя набор данных, заданный в файле YAML, который указывает на аннотированные изображения и метки.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")

# Train on the COCO8 dataset, which contains pre-annotated images
# The 'data' argument references a YAML file defining dataset paths and classes
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас