Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Аннотация данных

Что такое аннотация данных? Узнайте, как маркировка данных с помощью ограничивающих рамок или полигонов необходима для обучения точных моделей ИИ и компьютерного зрения.

Аннотация данных — это процесс маркировки или тегирования необработанных данных, чтобы помочь моделям машинного обучения (МО) понимать их и учиться на них. Этот важный шаг преобразует неструктурированные данные, такие как изображения или видео, в структурированную информацию, которую могут интерпретировать алгоритмы. В контексте обучения с учителем эти аннотации служат «золотым стандартом» — правильными ответами, которые модель использует для самообучения. Качество и точность аннотации данных напрямую влияют на производительность и надежность результирующей модели искусственного интеллекта (ИИ). Без точных аннотаций даже самые передовые модели не смогут эффективно изучать закономерности.

Роль аннотаций в компьютерном зрении

В компьютерном зрении (CV) аннотация данных имеет основополагающее значение для обучения моделей «видеть» и интерпретировать мир. Она включает в себя использование людьми-аннотаторами специализированного программного обеспечения для идентификации и маркировки интересующих объектов в визуальных данных. Существует несколько типов аннотаций, каждый из которых подходит для различных задач CV:

  • Аннотация ограничивающих рамок: Это наиболее распространенная форма, используемая для обнаружения объектов. Аннотаторы рисуют прямоугольные рамки вокруг отдельных объектов и присваивают им метку класса (например, "автомобиль", "человек").
  • Полигональная сегментация: Для задач, требующих большей точности, таких как сегментация экземпляров, аннотаторы обводят точный контур каждого объекта. Это позволяет модели понимать конкретную форму и границы объекта, даже когда объекты перекрываются.
  • Семантическая сегментация: Этот метод включает классификацию каждого пикселя на изображении в определенную категорию (например, «небо», «дорога», «здание»). В отличие от instance segmentation, он не различает разные экземпляры одного и того же класса объектов.
  • Аннотация ключевых точек: Используемый для оценки позы, этот метод включает в себя маркировку определенных интересующих точек (ключевых точек) на объекте, таких как суставы человеческого тела или углы лица.
  • Классификация: Простейшая форма, когда всему изображению присваивается одна метка. Это является основой для задач классификации изображений.

Выбор метода аннотации зависит от конкретных целей проекта CV, которые изложены в руководстве по определению целей проекта.

Применение в реальном мире

  1. Автономные транспортные средства: Самоуправляемые автомобили полагаются на модели, обученные на обширных аннотированных данных. Аннотаторы маркируют все, от пешеходов и велосипедистов до светофоров, дорожной разметки и дорожных знаков, в миллионах изображений и LiDAR облаках точек. Эти подробные данные обучения позволяют системе восприятия транспортного средства понимать окружающую среду и принимать безопасные решения во время вождения. Наборы данных, такие как Argoverse, имеют решающее значение для разработки надежных решений на основе ИИ для автомобильной промышленности.
  2. Анализ медицинских изображений: В ИИ для здравоохранения радиологи и медицинские эксперты аннотируют медицинские снимки, такие как МРТ, КТ и рентгеновские снимки, чтобы выделить опухоли, поражения, переломы или другие аномалии. Эти аннотированные наборы данных, такие как общедоступный набор данных об опухолях головного мозга, используются для обучения моделей, таких как Ultralytics YOLO, которые могут помочь в ранней диагностике и планировании лечения. Радиологическое общество Северной Америки (RSNA) предоставляет несколько таких наборов данных для исследований.

Аннотация данных в сравнении со смежными понятиями

Аннотация данных часто обсуждается вместе с другими методами подготовки данных, но они служат разным целям.

  • Аннотация данных в сравнении с маркировкой данных: Эти два термина часто используются взаимозаменяемо и относятся к одному и тому же основному процессу. «Аннотация» часто предпочтительнее в компьютерном зрении для описания более сложных задач, таких как рисование многоугольников или ключевых точек, в то время как «маркировка» может использоваться для более простых задач, таких как классификация. Однако для всех практических целей они являются синонимами. Для более подробного ознакомления вы можете прочитать нашу статью о маркировке данных для компьютерного зрения.
  • Аннотация данных в сравнении с аугментацией данных: Аннотация — это процесс создания исходных истинных меток. Аугментация данных, с другой стороны, — это метод, используемый после аннотации для искусственного увеличения размера набора данных путем создания измененных версий аннотированных изображений (например, поворот, отражение или изменение яркости).
  • Аннотация данных в сравнении с очисткой данных: Очистка данных включает в себя исправление ошибок, удаление дубликатов и обработку пропущенных значений в наборе данных для обеспечения его общего качества. Очистка может происходить до аннотации (например, удаление размытых изображений) или после (например, исправление неверных меток), но она отличается от действия добавления новых меток. Высокое качество данных необходимо для эффективной аннотации.

Процесс аннотирования можно организовать с использованием различных инструментов, от опций с открытым исходным кодом, таких как CVAT, до коммерческих платформ, таких как Scale AI и Labelbox. Платформы, такие как Ultralytics HUB, предоставляют интегрированные решения для управления наборами данных, обучения моделей и оптимизации всего рабочего процесса от сбора и аннотирования данных до развертывания.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена