Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Руководство по добавлению аннотаций к многоугольникам с помощью Ultralytics

Узнайте о полигональных аннотациях, о том, как они позволяют осуществлять точную сегментацию объектов, и о том, как легко создавать аннотации с помощью Ultralytics .

Хотите реализовать проект в области компьютерного зрения?

Узнать о лицензировании

Передовые технологии искусственного интеллекта находят применение в самых разных отраслях — от автономного вождения до точного земледелия. Например, производители молочной продукции используют ИИ и анализ изображений для detect у крупного рогатого скота. Такие проблемы со здоровьем, как хромота, можно отслеживать, наблюдая за изменениями в походке и осанке животного, например за выгибанием спины и асимметричными движениями. 

Рис. 1. Пример мониторинга коров с помощью искусственного интеллекта и анализа изображений.

Компьютерное зрение, являющееся одной из областей искусственного интеллекта, делает возможным создание таких приложений, позволяя машинам интерпретировать и анализировать визуальные данные. В частности, сегментация объектов — это задача компьютерного зрения, которая заключается в идентификации и сегментации каждого объекта на изображении на пиксельном уровне, что позволяет точно detect анализировать отдельных животных.

Аннотирование полигонов играет ключевую роль в этом процессе. Это метод аннотирования данных, при котором точное очертание объекта на изображении тщательно прослеживается путем размещения точек вдоль его краев. В отличие от простых аннотаций в виде ограничительных прямоугольников, этот подход следует за реальным контуром объекта, что помогает создавать более точные обучающие данные и позволяет моделям искусственного интеллекта в области компьютерного зрения лучше распознавать границы объектов.

В настоящее время существует множество инструментов для создания многоугольных аннотаций. Однако эти решения зачастую кажутся разрозненными, особенно когда они обеспечивают несогласованную или ограниченную поддержку различных типов аннотаций, что затрудняет управление разнообразными задачами по маркировке в рамках одного рабочего процесса.

Ultralytics — наша новая комплексная рабочая среда для искусственного интеллекта в области компьютерного зрения, которая объединяет управление наборами данных, аннотирование, обучение, развертывание и мониторинг — решает эту проблему за счет поддержки различных типов аннотаций и рабочих процессов с использованием ИИ в единой интегрированной среде, что упрощает весь процесс аннотирования.

В этой статье мы рассмотрим, что такое аннотации многоугольников и как их создавать с помощью Ultralytics . Приступим! 

Подробнее об аннотировании многоугольников

Прежде чем мы углубимся в Ultralytics и её функции аннотирования полигонов, давайте сначала разберемся, что такое аннотирование полигонов. 

Аннотирование изображений — это процесс добавления меток к визуальным данным, чтобы модели искусственного интеллекта могли понимать, что они видят. Обычно он включает в себя распознавание объектов на изображении и их маркировку таким образом, чтобы модель могла на этом учиться. 

Один из наиболее распространённых методов — обведение объектов прямоугольными рамками, называемыми ограничительными рамками. Однако ограничительные рамки дают лишь приблизительный контур объекта. Аннотирование с помощью многоугольников представляет собой более точный подход.

Этот метод основан на том, что объект обводится (его границы) точка за точкой, а не обводится рамкой. Для этого аннотаторы размещают несколько вершин (точек) вдоль краев объекта, обводя его контур до тех пор, пока не будет охвачена вся фигура.

Эти соединенные точки образуют многоугольник, повторяющий естественные очертания объекта. Поскольку форма точно повторяет контур объекта, аннотация фиксирует детали, которые часто упускаются при использовании традиционных методов маркировки. Это особенно полезно в случае объектов с нерегулярной формой или сложными краями, таких как листья, силуэты людей и перекрывающиеся объекты. 

Такая точность данных помогает моделям машинного обучения более эффективно обучаться в процессе тренировки. Когда аннотации точно отражают реальные границы объекта, модели могут лучше понимать его структуру на пиксельном уровне. Это приводит к повышению эффективности модели, особенно при решении задач сегментации, требующих высокой точности.

Роль аннотаций многоугольников в рабочих процессах компьютерного зрения

Итак, как же на самом деле используются аннотации многоугольников? Они тесно связаны с моделями искусственного интеллекта в области компьютерного зрения, которые поддерживают задачи сегментации изображений, такие как сегментация экземпляров.

Во многих приложениях компьютерного зрения крайне важно знать точную площадь, которую занимает каждый объект на изображении или в кадре видео. Хорошим примером является распознавание деталей автомобилей в производстве. В этом случае модели должны идентифицировать и точно очерчивать такие детали, как двери, окна и фары, даже если они перекрывают друг друга или имеют сложную форму.

Именно здесь на помощь приходит сегментация экземпляров. Она позволяет моделям detect объект и определять его точные границы на пиксельном уровне. Это отличается от базового распознавания объектов, в котором используются ограничительные прямоугольники. 

Рис. 2. Сегментация объектов также может помочь выявить поврежденные части автомобиля. (Источник)

Ограничительные прямоугольники определяют лишь приблизительные прямоугольные области вокруг объектов и зачастую включают лишний фон, что затрудняет выделение нестандартных форм или разделение перекрывающихся элементов.

Аннотирование многоугольников играет ключевую роль в обеспечении такого уровня точности. Трассировка точной формы каждого объекта на изображениях из набора данных позволяет создать высококачественные обучающие данные, отражающие реальные границы объектов. Эти подробные аннотации помогают моделям, таким как Ultralytics , лучше понимать структуру каждого компонента, что приводит к более точным результатам сегментации.

Ограничения традиционных инструментов для аннотирования изображений

Далее давайте рассмотрим ограничения традиционных инструментов для создания аннотаций, чтобы понять необходимость в более эффективных и масштабируемых решениях, таких как Ultralytics .

Вот некоторые типичные проблемы, с которыми сталкиваются аннотаторы при использовании традиционных инструментов для аннотирования полигонов:

  • Ограниченная поддержка типов аннотаций: некоторые инструменты ориентированы на один метод аннотирования, что затрудняет работу с различными типами, такими как многоугольники, ограничительные прямоугольники и ключевые точки, в одном месте.
  • Неэффективная работа со сложными аннотациями: в инструментах могут отсутствовать функции, облегчающие точное аннотирование сложных объектов с мелкими деталями.
  • Отсутствие функций с поддержкой ИИ: многие инструменты полностью полагаются на ручную работу и не имеют встроенной поддержки ИИ для ускорения процесса аннотирования.
  • Управление разрозненными наборами данных: управление наборами данных, версиями и аннотациями может быть затруднительным, особенно если инструменты не предоставляют централизованной рабочей среды.

Ultralytics решает эти проблемы с помощью функций аннотирования на основе искусственного интеллекта, реализованных с использованием YOLO Segment Anything Models (SAM) и YOLO . SAM пользователям создавать высококачественные маски сегментации на основе простых входных данных, таких как щелчки мышью, которые затем можно доработать до точных полигональных аннотаций. 

Аналогичным образом, интеллектуальная аннотация YOLO использует предварительно обученные или настроенные пользователем YOLO для выполнения инференции по изображению и добавления прогнозов — таких как ограничительные рамки, маски сегментации или ориентированные ограничительные рамки — в качестве аннотаций, которые затем можно просматривать и корректировать по мере необходимости. В совокупности эти возможности делают процесс аннотирования более быстрым, последовательным и легко масштабируемым.

Различные типы аннотаций, поддерживаемые Ultralytics

Ultralytics включает в себя встроенный редактор аннотаций, который позволяет пользователям добавлять аннотации к изображениям прямо в рабочей среде. Это упрощает создание наборов данных и управление ими, не прибегая к отдельным, зачастую трудоемким инструментам для маркировки данных.

Помимо аннотаций в виде многоугольников, Ultralytics поддерживает несколько других типов аннотаций. Вот краткий обзор:

  • Ограничительные прямоугольники: Аннотаторы могут обводить объекты простыми прямоугольниками, что упрощает detect маркировку и detect на изображении.
  • Ключевые моменты: этот метод используется для маркировки определённых точек, таких как суставы тела или ориентиры, при решении задач, например, оценки позы.
  • Ориентированные ограничительные прямоугольники (OBB): они позволяют пользователям более точно захватывать повернутые или расположенные под углом объекты по сравнению со стандартными ограничительными прямоугольниками.
  • Метки классификации: при выполнении простых задач пользователи могут присваивать метки целым изображениям вместо того, чтобы отмечать отдельные объекты.

Добавление аннотаций к объектам с помощью многоугольников на Ultralytics

А теперь давайте посмотрим, как создавать аннотации многоугольников на Ultralytics — вручную или с помощью инструментов, основанных на искусственном интеллекте.

Создание аннотаций многоугольников вручную на Ultralytics

Вот краткая пошаговая инструкция по созданию аннотаций многоугольников вручную:

  • Шаг 1 — Перейдите к набору данных: откройте набор данных, содержащий изображения, которые вы хотите аннотировать. Именно здесь хранятся и управляются ваши изображения и аннотации.
  • Шаг 2 — Откройте изображение: щелкните по изображению, чтобы открыть его в интерфейсе аннотирования. Процесс аннотирования зависит от задачи набора данных. Например, в наборе данных для сегментации объектов аннотации создаются с помощью полигональных масок.
  • Шаг 3 — Начните создавать маску: щелкните по изображению, чтобы приступить к добавлению меток. Каждый щелчок добавляет вершину вдоль границы объекта.
  • Шаг 4 — Обведите контур объекта: продолжайте щелкать по краям объекта, чтобы определить его форму.
  • Шаг 5 — Завершите создание многоугольника: вы можете либо нажать клавишу «Enter», либо щелкнуть по первой точке, чтобы завершить создание многоугольника и присвоить ему метку класса.
  • Шаг 6 — Добавьте дополнительные аннотации: повторите процесс, чтобы создать больше многоугольников для других объектов на изображении.
  • Шаг 7 — Сохранение аннотаций: Аннотации сохраняются автоматически по мере их создания.
Рис. 3. Процесс ручного создания аннотаций полигонов с помощью Ultralytics (Источник)

Интеллектуальная разметка многоугольников на Ultralytics

Далее рассмотрим функции маркировки с помощью искусственного интеллекта, поддерживаемые Ultralytics , которые ускоряют процесс аннотирования.

Платформа предлагает два подхода к интеллектуальному аннотированию: один основан на моделях Segment Anything и позволяет создавать аннотации интерактивно с помощью щелчков мышью, а другой — на YOLO и позволяет добавлять прогнозы модели непосредственно в качестве аннотаций. Оба подхода можно использовать для интеллектуального аннотирования многоугольниками. 

Интеллектуальное аннотирование с помощью SAM Ultralytics

Аннотирование SAM на Ultralytics упрощает ручную маркировку за счет использования модели Segment Anything Model (SAM) для генерации масок сегментации с минимальным вводом данных. Вместо того чтобы обводить объекты точка за точкой, пользователи могут взаимодействовать с изображением с помощью простых команд, таких как щелчки мышью, чтобы указать, что следует включить или исключить.

Платформа поддерживает несколько SAM , в том числе SAM .1 и SAM , что позволяет пользователям выбирать между более высокой скоростью обработки и большей точностью в зависимости от своих потребностей. На основе введенных пользователем данных SAM маски на уровне пикселей в режиме реального времени. Затем эти маски можно доработать и использовать в качестве полигональных аннотаций, что делает процесс быстрее, более согласованным и легче масштабируемым.

Ниже приведены инструкции по использованию SAM добавления аннотаций к полигонам в Ultralytics :

  • Шаг 1 — Откройте изображение: перейдите в папку с набором данных и щелкните по изображению, чтобы запустить полноэкранный просмотрщик.
  • Шаг 2 — Переход в режим аннотирования: нажмите «Редактировать», затем переключитесь в режим Smart (или нажмите клавишу S), чтобы включить SAM.
  • Шаг 3 — Выбор SAM : выберите SAM на панели инструментов с учетом ваших требований к скорости и точности.
  • Шаг 4 — Укажите области: щелкните левой кнопкой мыши, чтобы добавить положительные точки (включить области), и щелкните правой кнопкой мыши, чтобы добавить отрицательные точки (исключить области).
  • Шаг 5 — Создание и применение маски: SAM маску сегментации в режиме реального времени. Нажмите «Enter» (или воспользуйтесь функцией автоматического применения), чтобы применить аннотацию.
  • Шаг 6 — Уточните аннотацию: добавьте дополнительные точки или скорректируйте результат, если это необходимо, чтобы повысить точность перед сохранением. 
Рис. 4. Аннотирование многоугольников SAM в Ultralytics (Источник)

Интеллектуальное аннотирование с использованием YOLO Ultralytics

Интеллектуальная аннотация YOLO на Ultralytics ускоряет процесс маркировки за счет использования предварительно обученныхYOLO Ultralytics YOLO или тонко настроенных YOLO для генерации прогнозов по изображению и добавления их в качестве аннотаций. В зависимости от задачи набора данных эти прогнозы могут включать ограничительные прямоугольники, маски сегментации или ориентированные ограничительные прямоугольники. 

Затем пользователи могут просматривать и корректировать эти аннотации по мере необходимости. Ниже приводится обзор этапов использования интеллектуальной аннотации YOLO на Ultralytics :

  • Шаг 1 — Откройте изображение: перейдите в папку с набором данных и выберите изображение, чтобы открыть его в полноэкранном просмотрщике.
  • Шаг 2 — Переход в режим аннотирования: нажмите «Редактировать», затем переключитесь в режим Smart (или нажмите клавишу S).
  • Шаг 3 — Выбор YOLO : выберите YOLO в списке моделей на панели инструментов.
  • Шаг 4 — Запуск прогнозирования: нажмите «Прогнозировать», чтобы модель автоматически сгенерировала аннотации.
  • Шаг 5 — Проверка аннотаций: Проверьте добавленные к изображению прогнозируемые ограничительные рамки, маски сегментации или OBB.
  • Шаг 6 — Доработка и сохранение: при необходимости отредактируйте , скорректируйте или удалите неверные аннотации, а затем сохраните окончательные метки.
Рис. 5. Краткий обзор использования YOLO аннотации YOLO (Источник)

Реальные примеры применения аннотирования многоугольников

Аннотирование многоугольников оказывает реальное влияние на различные отрасли — от контроля качества в производстве до сельского хозяйства и здравоохранения. Давайте рассмотрим некоторые ключевые примеры практического применения. 

Обнаружение вредителей с помощью компьютерного зрения

В сельском хозяйстве мониторинг состояния сельскохозяйственных культур имеет решающее значение для повышения урожайности и сокращения потерь. Выявление участков на листьях растений, пораженных вредителями, может быть затруднительным, поскольку эти участки часто имеют нерегулярную форму и нечеткие границы.

К решению подобных задач можно применять методы сегментации изображений, такие как семантическая сегментация, при которой все пиксели, относящиеся к определенному классу (например, зараженные участки), помечаются соответствующими метками, или сегментация экземпляров, которая позволяет более точно выделять контуры объектов.

С помощью Ultralytics пользователи могут использовать многоугольные аннотации для обозначения точной формы этих заражённых участков. Это способствует созданию более точных наборов данных и облегчает алгоритмам искусственного интеллекта в области компьютерного зрения обнаружение едва заметных закономерностей в сельскохозяйственной среде.

В результате команды могут создавать более качественные обучающие данные, которые помогают моделям точно определять места заражения вредителями. Это более эффективно, чем использование ограничительных рамок, которые могут охватывать части листа, не пораженные вредителями.

Анализ медицинских изображений с использованием сегментации экземпляров

Подобно обнаружению вредителей в сельском хозяйстве, даже незначительные различия в границах могут повлиять на то, как анализируются такие заболевания, как рак, при медицинской визуализации. Это особенно важно при выявлении патологических отклонений, таких как опухоли, на компьютерных томограммах.

Традиционные методы аннотирования могут не учитывать мелкие края или включать окружающие ткани, что снижает точность. С помощью Ultralytics специалисты могут использовать полигональную аннотацию для точного обведения этих областей в обучающих данных, что помогает моделям выполнять более точную и надежную сегментацию опухолей.

Основные выводы

Аннотирование многоугольников играет ключевую роль, когда моделям требуется с высокой точностью распознавать формы объектов на изображениях. Это позволяет более точно отображать сложные формы, особенно при использовании Ultralytics . Сочетая точность с мощными инструментами, команды могут создавать более надёжные и высокопроизводительные модели искусственного интеллекта.

Готовы внедрить технологию компьютерного зрения в свои проекты? Присоединяйтесь к нашему сообществу и узнайте больше об искусственном интеллекте в автомобильной промышленности и о технологиях компьютерного зрения в робототехнике. Посетите наш репозиторий на GitHub, чтобы узнать больше. Ознакомьтесь с нашими вариантами лицензирования и начните работу уже сегодня! 

Давайте вместе создадим будущее искусственного интеллекта!

Начните свой путь в будущее машинного обучения