Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Оптимизация процесса аннотирования изображений с помощью Ultralytics

Узнайте всё, что нужно знать об аннотировании изображений с помощью Ultralytics , а также о её встроенных инструментах для маркировки наборов данных, управления аннотациями и подготовки данных для моделей.

Масштабируйте свои проекты в области компьютерного зрения с Ultralytics

Начать

Ultralytics представила Ultralytics — среду, созданную для поддержки всего жизненного цикла разработки систем компьютерного зрения. Платформа объединяет инструменты, используемые для управления различными этапами рабочих процессов в области искусственного интеллекта для систем компьютерного зрения, включая подготовку наборов данных, аннотирование изображений и видео, обучение моделей и их развертывание.

Несмотря на растущую популярность в таких отраслях, как автономное вождение и здравоохранение, разработка решений в области компьютерного зрения по-прежнему остается фрагментированным процессом. Одна из главных причин заключается в том, что модели компьютерного зрения в значительной степени зависят от качества данных, на которых они обучаются. Еще до начала обучения необходимо создать, систематизировать, проверить и пометить наборы данных, чтобы модель могла научиться detect распознавать нужные объекты.

При работе с визуальными данными этот процесс называется аннотированием данных или аннотированием изображений. В ходе аннотирования изображений отдельные фрагменты изображения помечаются и снабжаются метками, которые служат ориентиром для модели во время обучения.

Например, если задача состоит в detect на изображениях, аннотаторы могут обводить каждую собаку прямоугольником, чтобы показать, где она находится. При выполнении более сложных задач они могут очерчивать контуры собаки с помощью масок сегментации или отмечать ключевые точки для фиксации её позы. Эти помеченные примеры напрямую влияют на эффективность работы модели после её внедрения.

Управление процессами аннотирования изображений в больших масштабах может представлять собой сложную задачу. Работа с большими наборами данных часто требует соблюдения единых стандартов маркировки, совместной работы нескольких аннотаторов, а также инструментов, облегчающих проверку и доработку аннотаций.

Ultralytics объединяет все это с помощью встроенного редактора аннотаций. Она поддерживает различные типы задач по аннотированию и предоставляет командам более простой способ маркировки данных и подготовки наборов данных для компьютерного зрения в рамках единого рабочего процесса.

Рис. 1. Вид редактора аннотаций в Ultralytics (Источник)

В этой статье мы рассмотрим, как редактор аннотаций Ultralytics помогает командам эффективно аннотировать наборы данных и оптимизировать процесс подготовки данных. Приступим!

Аннотирование данных в области компьютерного зрения

Прежде чем приступить к изучению инструментов аннотирования изображений, доступных на Ultralytics , давайте сначала разберемся, что такое аннотирование данных и почему оно важно для создания систем компьютерного зрения.

Модели компьютерного зрения обучаются путем анализа обширных наборов изображений или видеороликов, называемых наборами данных. Однако одни только необработанные изображения не содержат достаточной информации, чтобы модель могла понять, что именно ей следует detect распознавать. Чтобы данные стали пригодными для обучения, изображения необходимо маркировать с помощью процесса маркировки данных, чтобы модель могла научиться выявлять нужные объекты, формы или паттерны.

В процессе аннотирования изображений отдельные элементы на изображении помечаются и снабжаются метками, описывающими то, чему должна научиться модель. Эти помеченные примеры служат ориентиром для моделей и алгоритмов глубокого обучения во время обучения и помогают им распознавать похожие паттерны при обработке новых изображений.

Различные задачи компьютерного зрения требуют разных типов аннотирования изображений в зависимости от области применения и конкретного сценария использования. Например, аннотаторы могут обводить объекты ограничительными прямоугольниками для их обнаружения, выделять области на изображении для семантической сегментации, определять ключевые точки для оценки позы или присваивать метки всему изображению для классификации.

Управление данными и их подготовка

Подготовка данных для проектов в области компьютерного зрения часто предполагает работу с различными форматами файлов и систематизацию наборов данных. Она также включает в себя обеспечение готовности всех данных к аннотированию и обучению алгоритмов машинного обучения. Во многих рабочих процессах этот процесс распределен между несколькими инструментами: данные загружаются, очищаются и перемещаются между системами, прежде чем их можно будет использовать.

Ultralytics упрощает этот процесс, обеспечивая подготовку данных, обучение моделей и развертывание в рамках единой среды. Команды могут загружать изображения, видео или архивы наборов данных и использовать полностью настраиваемый подход к подготовке данных с помощью ручных или автоматизированных с помощью ИИ аннотаций. Ultralytics поддерживает как необработанные данные, так и стандартные форматы, такие как YOLO COCO, что упрощает запуск новых проектов. Она также предоставляет доступ к существующим на платформе наборам данных, включая аннотированные наборы, которые команды могут использовать для быстрого запуска новых проектов или экспериментов.

Рис. 2. Загрузка и управление наборами данных в единой среде на Ultralytics . (Источник)

Как только данные станут доступны, ими можно будет управлять непосредственно на платформе. Разработчики могут просматривать изображения, отслеживать ход работы по аннотированию и использовать встроенные средства визуализации, чтобы понять распределение набора данных и выявить возможные пробелы.

Платформа также поддерживает управление версиями наборов данных, что позволяет командам создавать моментальные снимки данных по мере их изменения. Это упрощает track , сравнение экспериментов и обеспечение согласованности в процессе обучения.

После подготовки данных команды могут приступить к аннотированию изображений, в ходе которого на них наносятся метки, чтобы помочь моделям научиться detect нужные объекты.

Добавление аннотаций к наборам данных на Ultralytics

После загрузки данных следующим этапом является аннотирование. На этом этапе изображения маркируются, что закладывает основу для последующего обучения моделей компьютерного зрения. Ultralytics включает в себя встроенные сервисы аннотирования изображений, реализованные через редактор аннотаций, который позволяет командам маркировать наборы данных и управлять ими непосредственно в одной и той же среде.

Редактор аннотаций открывается в удобном рабочем пространстве, где пользователи могут просматривать изображения, добавлять метки и обновлять аннотации по мере необходимости. Всё организовано в одном месте, что упрощает обеспечение согласованности наборов данных и их подготовку к обучению.

Команды могут загружать наборы данных и приступать к маркировке изображений прямо в браузере, определяя классы аннотаций и управляя ими, чтобы обеспечить единообразие меток во всем наборе данных. По мере создания аннотаций пользователи могут просматривать их в редакторе, что упрощает проверку точности перед переходом к обучению модели.

Инструменты для добавления аннотаций к изображениям в Ultralytics

Ultralytics также включает в себя ряд функций, обеспечивающих эффективные рабочие процессы маркировки наборов данных и упрощающих процесс аннотирования с помощью передовых алгоритмов.

Вот некоторые из основных функций, доступных на Ultralytics :

  • Ручная аннотация: этот подход обеспечивает пользователям полный контроль и гибкость при создании аннотаций к изображениям, таких как ограничительные рамки, области сегментации или ключевые точки, непосредственно на изображениях.
  • Маркировка с помощью ИИ: эта функция автоматически генерирует предложения по аннотациям, сокращая необходимость в ручной маркировке. Она использует SAM Segment Anything Model) для detect или областей всего одним щелчком мыши, что упрощает процесс аннотирования и позволяет пользователям просматривать и подтверждать предложения перед добавлением их в набор данных.
  • Редактирование аннотаций: в любой момент пользователи могут изменять или уточнять аннотации к изображениям после их создания. Это позволяет исправлять ошибки в маркировке и обеспечивать единообразие меток в наборе данных на протяжении всего процесса аннотирования.
  • Управление классами: команды и отдельные разработчики могут определять и систематизировать классы аннотаций, используемые при маркировке наборов данных. Это помогает обеспечить единообразие меток на всех изображениях, что важно для обучения моделей, способных точно распознавать и различать классы.

Благодаря сочетанию ручных инструментов, искусственного интеллекта и автоматизации Ultralytics помогает пользователям более эффективно аннотировать изображения. Кроме того, она позволяет подготавливать высококачественные обучающие данные для масштабируемых моделей компьютерного зрения.

Поддерживаемые типы задач аннотирования

Различные сценарии использования, такие как контроль качества продукции, потребуют разных типов аннотаций в зависимости от того, что необходимо обнаружить на изображениях или в видео. Как уже упоминалось выше, Ultralytics поддерживает пять задач обнаружения объектов, каждая из которых имеет свой собственный тип аннотации.

Давайте подробнее рассмотрим задачи аннотирования, поддерживаемые на платформе, и то, как их можно использовать для маркировки наборов данных.

Детекция объектов

Распознавание объектов позволяет идентифицировать и локализовать объекты на изображении. Аннотаторы помечают каждый интересующий объект с помощью ограничительных рамок, указывая, где именно на изображении находятся эти объекты.

В редакторе аннотаций это делается с помощью инструмента «Ограничительная рамка». Пользователи могут перейти в «режим редактирования», щелкнуть и перетащить курсор, чтобы нарисовать прямоугольник вокруг объекта, а затем выбрать метку класса из раскрывающегося меню.

Ограничительные прямоугольники можно настраивать после их создания. Аннотаторы могут изменять их размер, перетаскивая ручки углов или краев, перемещать их, перетаскивая центр прямоугольника, или удалять с помощью сочетаний клавиш. Эти аннотации помогают моделям машинного зрения научиться detect в различных сценах и условиях.

Рис. 3. Аннотирование объектов с помощью ограничительных рамок на Ultralytics . (Источник)

Сегментация экземпляров

Сегментация объектов позволяет создавать более детализированные аннотации за счёт определения точной формы объектов на изображении. Вместо того чтобы рисовать простую прямоугольную рамку, аннотаторы обводят границы объекта с помощью многоугольных аннотаций, создавая точные маски для задач сегментации изображений.

Редактор аннотаций содержит инструмент «Многоугольник», предназначенный для этой задачи. Аннотаторы размещают несколько вершин по краям объекта, чтобы очертить его форму. После размещения вершин многоугольник можно замкнуть, чтобы создать маску сегментации.

Вершины можно корректировать после создания многоугольника. Отдельные точки можно перемещать для уточнения границ объекта, а при необходимости вершины можно удалять. Эти пометки на уровне пикселей помогают моделям изучать детализированные визуальные структуры и различать объекты, расположенные близко друг к другу.

Оценка позы

Аннотации для оценки позы фиксируют положения суставов тела и взаимосвязи между ними. Это помогает моделям понимать структуру и движения людей или животных на изображении.

С помощью инструмента «Ключевые точки» аннотаторы размещают ключевые точки, обозначающие суставы тела, такие как плечи, локти, запястья, бедра, колени и лодыжки. Платформа поддерживает несколько встроенных шаблонов скелетов, в том числе 17-точечный формат COCO поз, а также шаблоны для рук, лиц, собак и углов коробок.

Шаблоны позволяют одним щелчком мыши разместить полный скелетный макет, после чего отдельные ключевые точки можно настроить в соответствии с позой на изображении. Каждая ключевая точка также может иметь флаг видимости, указывающий, видна она или скрыта.

Рис. 4. Аннотация оценки позы с использованием ключевых точек и шаблонов скелета. (Источник)

Ориентированные ограничительные прямоугольники (OBB)

Ориентированные ограничительные прямоугольники представляют собой усовершенствованную версию традиционных ограничительных прямоугольников, поскольку поддерживают поворот. Этот тип аннотации полезен в тех случаях, когда объекты расположены под углом, а не выровнены по кадру изображения.

В редакторе аннотаций аннотаторы могут использовать инструмент «Ориентированная ограничительная рамка» для рисования повернутых прямоугольников вокруг объектов. После начертания исходной рамки можно использовать ручку поворота для настройки угла, а угловые ручки позволяют изменять размер рамки.

Поворотные аннотации часто используются в аэрофотоснимках, наборах данных промышленных инспекций и других ситуациях, когда объекты изображаются под углом или с разных точек обзора.

Рис. 5. Аннотация ориентированных ограничительных прямоугольников (OBB) для повернутых объектов на аэрофотоснимках. (Источник)

Классификация изображений

При классификации изображений метка присваивается всему изображению целиком, а не отдельным объектам на нём.

Для наборов данных классификации в редакторе аннотаций предусмотрена панель выбора классов. Аннотаторы могут присваивать метки изображениям, выбирая класс на боковой панели или используя сочетания клавиш для ускорения процесса маркировки.

Эти метки на уровне изображений помогают моделям обучаться высокоуровневым визуальным паттернам, которые представляют различные категории.

Аннотирование с помощью искусственного интеллекта на основе SAM

Маркировка изображений для таких задач, как сегментация, часто требует тщательной и кропотливой работы, особенно когда необходимо точно очертить контуры объектов. Ultralytics включает инструменты для аннотирования с поддержкой искусственного интеллекта, которые ускоряют этот процесс, обеспечивая при этом точность аннотаций и удобство их проверки.

Например, аннотаторы могут взаимодействовать с изображением, щелкая по частям объекта, которые они хотят включить в аннотацию. Они также могут отмечать области, которые следует исключить, чтобы уточнить результат. На основе этих данных модель в режиме реального времени генерирует маску сегментации, которую затем можно просмотреть и скорректировать перед сохранением.

Такой подход упрощает обработку сложных изображений, избавляя от необходимости вручную обводить каждую деталь. При этом аннотаторы сохраняют контроль над конечным результатом, обеспечивая единообразие аннотаций во всем наборе данных.

Рис. 6. Сегментация с помощью искусственного интеллекта с использованием инструмента «Smart annotation» на Ultralytics . (Источник)

Эти функции работают на базе моделей Segment Anything Models (SAM). Эти модели являются частью более широкой экосистемы инструментов компьютерного зрения с открытым исходным кодом, предназначенных для генерации высококачественной сегментации на основе минимального объема входных данных. Платформа поддерживает несколько SAM , включая SAM .1 и SAM . Это дает командам возможность выбирать между более высокой скоростью работы и более детальными результатами в зависимости от своих потребностей.

Эти инструменты с поддержкой искусственного интеллекта могут применяться для решения таких задач, как распознавание объектов, сегментация экземпляров и обнаружение ориентированных ограничительных рамок. Это означает, что команды могут более эффективно обрабатывать большие наборы данных, сохраняя при этом качество, необходимое для надёжной подготовки моделей.

Оптимизация рабочих процессов аннотирования с помощью встроенных инструментов

По мере продвижения работы по аннотированию часто возникает необходимость вернуться назад, чтобы скорректировать метки, исправить ошибки или более внимательно изучить изображения. Редактор Ultralytics оснащен встроенными инструментами, которые упрощают выполнение этих повседневных задач и сокращают время, затрачиваемое на них.

Среди функций рабочего процесса, доступных в редакторе, можно выделить следующие:

  • Горячие клавиши: в редакторе предусмотрены горячие клавиши, которые ускоряют выполнение типичных действий, таких как сохранение аннотаций, отмена или повтор изменений, удаление меток и выбор классов при создании аннотаций.
  • История отмены и повторного выполнения: специалисты по аннотированию могут легко отменить или восстановить изменения, внесенные в ходе сеанса редактирования. Это позволяет командам экспериментировать с аннотациями и быстро исправлять ошибки без потери проделанной работы, что способствует более эффективному контролю качества при подготовке наборов данных.
  • Гибкое редактирование аннотаций: аннотации можно изменять даже после их создания. Пользователи могут изменять размер фигур, перемещать аннотации, поворачивать ориентированные ограничительные рамки или обновлять метки классов по мере необходимости, особенно при доработке объектов с нестандартной формой.
  • Настройки отображения: в редакторе предусмотрены переключатели, позволяющие пользователям отображать или скрывать аннотации и метки классов, что упрощает просмотр изображений во время маркировки.
  • Инструменты высокой точности: такие функции, как масштабирование и курсор в виде перекрестия с указанием координат в пикселях, помогают специалистам по аннотированию более точно размещать метки при работе с детализированными изображениями.

Управление классами аннотаций на Ultralytics

Четкие и единообразные классы аннотаций играют важную роль в создании надежных наборов данных для компьютерного зрения. По мере расширения проектов управление маркировкой данных в больших наборах может стать сложной задачей, особенно при участии нескольких аннотаторов. Четкая организация классов помогает обеспечить единообразие аннотаций и позволяет моделям обучаться на структурированных данных.

Ultralytics упрощает этот процесс, интегрировав управление классами непосредственно в редактор аннотаций. Вместо того чтобы обрабатывать метки отдельно, команды могут создавать, обновлять и проверять классы прямо во время работы с изображениями, что позволяет легче обеспечить единообразие на протяжении всего рабочего процесса аннотирования.

В редакторе все классы отображаются на боковой панели рядом с рабочей областью для аннотирования. Это позволяет легко выбирать нужную метку во время аннотирования и track как классы используются в наборе данных. Пользователи могут искать существующие классы или создавать новые по мере необходимости, не прерывая рабочий процесс.

Сведения о классах также можно обновлять в любое время. Имена можно редактировать напрямую, а для облегчения идентификации различных классов в аннотациях им можно назначать цвета. Редактор также показывает, сколько аннотаций связано с каждым классом, и позволяет пользователям просматривать их, что помогает командам проверять согласованность и точность данных.

Все классы управляются через централизованную таблицу, в которой их можно сортировать, искать и обновлять. Любые изменения, внесенные здесь, автоматически применяются ко всему набору данных, что помогает командам поддерживать согласованность по мере расширения проектов аннотирования.

Рис. 7. Управление классами в редакторе аннотаций демонстрирует структуру меток и настройку цветов. (Источник)

Как качество аннотаций влияет на реальную производительность

По мере того как системы компьютерного зрения переходят от стадии разработки к практическому применению, качество аннотированных данных играет ключевую роль в эффективности работы моделей. Правильно аннотированные наборы данных помогают моделям генерировать более точные и стабильные прогнозы, особенно в динамичных или непредсказуемых условиях.

На практике даже незначительные несоответствия в аннотациях могут повлиять на поведение модели. Различия в том, как маркируются объекты или как обрабатываются крайние случаи, могут быть незаметны во время обучения, но привести к снижению надежности прогнозов после внедрения систем.

Кроме того, эти несоответствия могут становиться более заметными при практическом применении. Например, в робототехнике и системах здравоохранения модели используют визуальные данные для detect и управления действиями в режиме реального времени. Различия в маркировке могут повлиять на точность интерпретации окружающей обстановки этими системами.

Соблюдая единые стандарты аннотирования и используя такие платформы, как Ultralytics управления наборами данных и их доработки с течением времени, команды могут создавать модели, которые демонстрируют более стабильную работу за пределами контролируемых тестовых сред.

Основные выводы

Качественная аннотация данных имеет решающее значение для обучения точных моделей компьютерного зрения и успешной реализации проектов по аннотированию изображений. Ultralytics упрощает этот процесс благодаря мощному редактору аннотаций, поддерживающему множество задач в области компьютерного зрения. Сочетая инструменты ручной аннотации с маркировкой с помощью искусственного интеллекта SAM встроенными функциями организации рабочего процесса, команды могут более эффективно готовить наборы данных и быстрее переходить от этапа подготовки данных к разработке моделей.

Присоединяйтесь к нашему сообществу и ознакомьтесь с репозиторием GitHub, чтобы узнать больше о моделях компьютерного зрения. На наших страницах, посвящённых решениям, вы найдёте информацию о таких областях применения, как ИИ в автомобилестроении и компьютерное зрение в робототехнике. Ознакомьтесь с нашими вариантами лицензирования и начните создавать свою собственную модель Vision AI.

Давайте вместе создадим будущее искусственного интеллекта!

Начните свой путь в будущее машинного обучения