Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Аннотация данных

Что такое аннотация данных? Узнайте, как маркировка данных с помощью ограничивающих рамок или полигонов необходима для обучения точных моделей ИИ и компьютерного зрения.

Аннотирование данных — это важный процесс маркировки, тегирования или транскрибирования необработанных данных с целью предоставления необходимого контекста, который требуется модели машинного обучения (ML) для обучения. Этот шаг является основой обучения с учителем, метода, при котором алгоритмы обучаются на парах вход-выход для распознавания паттернов и составления прогнозов. Маркированная информация выступает в качестве базовой истины, представляя идеальный результат, который модель стремится воспроизвести. Без точной и последовательной аннотации даже такие передовые архитектуры, как Ultralytics , не могут функционировать эффективно, поскольку точность системы напрямую зависит от качества ее обучающих данных.

Распространенные типы аннотаций в компьютерном зрении

В области компьютерного зрения (CV) аннотирование данных включает в себя маркировку определенных объектов на изображениях или в кадрах видео. Используемый метод в значительной степени зависит от конкретной задачи, для выполнения которой создается модель.

  • Обнаружение объектов: аннотаторы рисуют 2D-ограничительные рамки вокруг интересующих объектов, таких как транспортные средства или пешеходы. Это учит модель тому, что такое объект и где он находится в сцене.
  • Сегментация экземпляров: Эта техника включает в себя отслеживание точных многоугольников по краям объекта. В отличие от простых коробок, сегментация отображает точную форму и контур, что жизненно важно для задач, требующих высокой точности, таких как роботизированный захват.
  • Оценка позы: аннотаторы отмечают определенные ключевые точки на объекте, такие как суставы человеческого тела (локти, колени, плечи). Это позволяет моделям track , позу и даже анализировать спортивные результаты.
  • Классификация изображений: это самая простая форма, при которой всему изображению присваивается один категорийный ярлык (например, «здоровый лист» или «больной лист») .

Применение в реальном мире

Аннотация данных устраняет разрыв между необработанными данными датчиков и интеллектуальным принятием решений в различных отраслях промышленности.

  1. Умное сельское хозяйство: в искусственном интеллекте в сельском хозяйстве огромные наборы данных с изображениями сельскохозяйственных культур аннотируются для выявления сорняков, вредителей или дефицита питательных веществ. Обучая модели на этих данных, фермеры могут автоматизировать мониторинг урожая и применять обработку только там, где это необходимо, сокращая отходы и повышая урожайность.
  2. Автономное вождение: самоуправляемые автомобили полагаются на огромные библиотеки аннотированных данных, в которых каждый разделитель полос движения, дорожный знак и препятствие имеют метку. Данные с камер и датчиков LiDAR обрабатываются для обучения системы восприятия автомобиля , что позволяет ему безопасно перемещаться в сложных дорожных условиях.

Различение смежных понятий

Полезно отличать аннотирование данных от других терминов, часто используемых в процессе подготовки наборов данных.

  • Аннотация и маркировка данных: Хотя эти термины часто используются как синонимы, «маркировка» обычно относится к более простым задачам классификации (присвоение тега), тогда как «аннотация» подразумевает создание более богатых метаданных, таких как рисование сложной геометрии или маркировка временных меток в видео.
  • Аннотация и дополнение данных: Аннотация создает исходную базу данных. Дополнение — это последующий процесс, который искусственно расширяет набор данных путем применения преобразований (таких как поворот или смещение цвета) к существующим аннотированным изображениям для повышения надежности модели .
  • Аннотация против активного обучения: Активное обучение — это стратегия, при которой модель определяет, какие конкретные точки данных она считает наиболее запутанными, и запрашивает аннотацию человека только для этих примеров, оптимизируя время и стоимость процесса аннотации.

Инструменты и рабочий процесс

Для создания высококачественных аннотаций обычно требуется специализированное программное обеспечение, которое экспортирует данные в стандартных форматах, таких как JSON или XML. Современные рабочие процессы все чаще переходят к интегрированным средам, таким как Ultralytics , которая оптимизирует поиск данных, автоматическую аннотацию и обучение моделей в одном интерфейсе.

После аннотирования данных они указываются в конфигурационном файле (часто YAML) для обучения. В следующем примере показано, как обучить модель YOLO26 с использованием стандартного COCO8 , который поставляется с уже существующими аннотациями.

from ultralytics import YOLO

# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")

# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас