Аннотация данных
Что такое аннотация данных? Узнайте, как маркировка данных с помощью ограничивающих рамок или полигонов необходима для обучения точных моделей ИИ и компьютерного зрения.
Аннотирование данных — это важный процесс маркировки, тегирования или транскрибирования необработанных данных с целью предоставления необходимого
контекста, который требуется модели машинного обучения (ML)
для обучения. Этот шаг является основой
обучения с учителем, метода, при котором алгоритмы
обучаются на парах вход-выход для распознавания паттернов и составления прогнозов. Маркированная информация выступает в качестве
базовой истины, представляя идеальный результат, который модель
стремится воспроизвести. Без точной и последовательной аннотации даже такие передовые архитектуры, как
Ultralytics , не могут функционировать эффективно, поскольку
точность системы напрямую зависит от качества ее
обучающих данных.
Распространенные типы аннотаций в компьютерном зрении
В области компьютерного зрения (CV) аннотирование данных
включает в себя маркировку определенных объектов на изображениях или в кадрах видео. Используемый метод в значительной степени зависит от
конкретной задачи, для выполнения которой создается модель.
-
Обнаружение объектов: аннотаторы
рисуют 2D-ограничительные рамки вокруг интересующих объектов,
таких как транспортные средства или пешеходы. Это учит модель тому, что такое объект и где он находится в сцене.
-
Сегментация экземпляров:
Эта техника включает в себя отслеживание точных многоугольников по краям объекта. В отличие от простых коробок, сегментация
отображает точную форму и контур, что жизненно важно для задач, требующих высокой точности, таких как
роботизированный захват.
-
Оценка позы: аннотаторы отмечают
определенные ключевые точки на объекте, такие как суставы
человеческого тела (локти, колени, плечи). Это позволяет моделям track , позу и даже анализировать спортивные
результаты.
-
Классификация изображений: это
самая простая форма, при которой всему изображению присваивается один категорийный ярлык (например, «здоровый лист» или «больной лист»)
.
Применение в реальном мире
Аннотация данных устраняет разрыв между необработанными данными датчиков и интеллектуальным принятием решений в различных отраслях промышленности.
-
Умное сельское хозяйство: в
искусственном интеллекте в сельском хозяйстве огромные наборы данных с изображениями сельскохозяйственных культур
аннотируются для выявления сорняков, вредителей или дефицита питательных веществ. Обучая модели на этих данных, фермеры
могут автоматизировать мониторинг урожая и применять обработку только там, где это необходимо, сокращая отходы и повышая урожайность.
-
Автономное вождение: самоуправляемые автомобили полагаются на огромные библиотеки аннотированных данных, в которых каждый
разделитель полос движения, дорожный знак и препятствие имеют метку. Данные с камер и
датчиков LiDAR обрабатываются для обучения системы восприятия автомобиля
, что позволяет ему безопасно перемещаться в сложных дорожных условиях.
Различение смежных понятий
Полезно отличать аннотирование данных от других терминов, часто используемых в процессе подготовки наборов данных.
-
Аннотация и маркировка данных:
Хотя эти термины часто используются как синонимы, «маркировка» обычно относится к более простым задачам классификации (присвоение
тега), тогда как «аннотация» подразумевает создание более богатых метаданных, таких как рисование сложной геометрии или маркировка
временных меток в видео.
-
Аннотация и дополнение данных:
Аннотация создает исходную базу данных. Дополнение — это последующий процесс, который искусственно расширяет
набор данных путем применения преобразований (таких как поворот или смещение цвета) к существующим аннотированным изображениям для повышения надежности модели
.
-
Аннотация против активного обучения:
Активное обучение — это стратегия, при которой модель определяет, какие конкретные точки данных она считает наиболее запутанными, и
запрашивает аннотацию человека только для этих примеров, оптимизируя время и стоимость процесса аннотации.
Инструменты и рабочий процесс
Для создания высококачественных аннотаций обычно требуется специализированное программное обеспечение, которое экспортирует данные в стандартных форматах, таких как
JSON или XML. Современные рабочие процессы
все чаще переходят к интегрированным средам, таким как
Ultralytics , которая оптимизирует поиск данных, автоматическую аннотацию и
обучение моделей в одном интерфейсе.
После аннотирования данных они указываются в конфигурационном файле (часто YAML) для обучения. В следующем примере
показано, как обучить модель YOLO26 с использованием стандартного
COCO8 , который поставляется с уже существующими
аннотациями.
from ultralytics import YOLO
# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")
# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)