Руководство по добавлению аннотаций к многоугольникам с помощью Ultralytics
Узнайте о полигональных аннотациях, о том, как они позволяют осуществлять точную сегментацию объектов, и о том, как легко создавать аннотации с помощью Ultralytics .

Узнайте о полигональных аннотациях, о том, как они позволяют осуществлять точную сегментацию объектов, и о том, как легко создавать аннотации с помощью Ultralytics .

Передовые технологии искусственного интеллекта находят применение в самых разных отраслях — от автономного вождения до точного земледелия. Например, производители молочной продукции используют ИИ и анализ изображений для detect у крупного рогатого скота. Такие проблемы со здоровьем, как хромота, можно отслеживать, наблюдая за изменениями в походке и осанке животного, например за выгибанием спины и асимметричными движениями.

Компьютерное зрение, являющееся одной из областей искусственного интеллекта, делает возможным создание таких приложений, позволяя машинам интерпретировать и анализировать визуальные данные. В частности, сегментация объектов — это задача компьютерного зрения, которая заключается в идентификации и сегментации каждого объекта на изображении на пиксельном уровне, что позволяет точно detect анализировать отдельных животных.
Аннотирование полигонов играет ключевую роль в этом процессе. Это метод аннотирования данных, при котором точное очертание объекта на изображении тщательно прослеживается путем размещения точек вдоль его краев. В отличие от простых аннотаций в виде ограничительных прямоугольников, этот подход следует за реальным контуром объекта, что помогает создавать более точные обучающие данные и позволяет моделям искусственного интеллекта в области компьютерного зрения лучше распознавать границы объектов.
В настоящее время существует множество инструментов для создания многоугольных аннотаций. Однако эти решения зачастую кажутся разрозненными, особенно когда они обеспечивают несогласованную или ограниченную поддержку различных типов аннотаций, что затрудняет управление разнообразными задачами по маркировке в рамках одного рабочего процесса.
Ultralytics — наша новая комплексная рабочая среда для искусственного интеллекта в области компьютерного зрения, которая объединяет управление наборами данных, аннотирование, обучение, развертывание и мониторинг — решает эту проблему за счет поддержки различных типов аннотаций и рабочих процессов с использованием ИИ в единой интегрированной среде, что упрощает весь процесс аннотирования.
В этой статье мы рассмотрим, что такое аннотации многоугольников и как их создавать с помощью Ultralytics . Приступим!
Прежде чем мы углубимся в Ultralytics и её функции аннотирования полигонов, давайте сначала разберемся, что такое аннотирование полигонов.
Аннотирование изображений — это процесс добавления меток к визуальным данным, чтобы модели искусственного интеллекта могли понимать, что они видят. Обычно он включает в себя распознавание объектов на изображении и их маркировку таким образом, чтобы модель могла на этом учиться.
Один из наиболее распространённых методов — обведение объектов прямоугольными рамками, называемыми ограничительными рамками. Однако ограничительные рамки дают лишь приблизительный контур объекта. Аннотирование с помощью многоугольников представляет собой более точный подход.
Этот метод основан на том, что объект обводится (его границы) точка за точкой, а не обводится рамкой. Для этого аннотаторы размещают несколько вершин (точек) вдоль краев объекта, обводя его контур до тех пор, пока не будет охвачена вся фигура.
Эти соединенные точки образуют многоугольник, повторяющий естественные очертания объекта. Поскольку форма точно повторяет контур объекта, аннотация фиксирует детали, которые часто упускаются при использовании традиционных методов маркировки. Это особенно полезно в случае объектов с нерегулярной формой или сложными краями, таких как листья, силуэты людей и перекрывающиеся объекты.
Такая точность данных помогает моделям машинного обучения более эффективно обучаться в процессе тренировки. Когда аннотации точно отражают реальные границы объекта, модели могут лучше понимать его структуру на пиксельном уровне. Это приводит к повышению эффективности модели, особенно при решении задач сегментации, требующих высокой точности.
Итак, как же на самом деле используются аннотации многоугольников? Они тесно связаны с моделями искусственного интеллекта в области компьютерного зрения, которые поддерживают задачи сегментации изображений, такие как сегментация экземпляров.
Во многих приложениях компьютерного зрения крайне важно знать точную площадь, которую занимает каждый объект на изображении или в кадре видео. Хорошим примером является распознавание деталей автомобилей в производстве. В этом случае модели должны идентифицировать и точно очерчивать такие детали, как двери, окна и фары, даже если они перекрывают друг друга или имеют сложную форму.
Именно здесь на помощь приходит сегментация экземпляров. Она позволяет моделям detect объект и определять его точные границы на пиксельном уровне. Это отличается от базового распознавания объектов, в котором используются ограничительные прямоугольники.

Ограничительные прямоугольники определяют лишь приблизительные прямоугольные области вокруг объектов и зачастую включают лишний фон, что затрудняет выделение нестандартных форм или разделение перекрывающихся элементов.
Аннотирование многоугольников играет ключевую роль в обеспечении такого уровня точности. Трассировка точной формы каждого объекта на изображениях из набора данных позволяет создать высококачественные обучающие данные, отражающие реальные границы объектов. Эти подробные аннотации помогают моделям, таким как Ultralytics , лучше понимать структуру каждого компонента, что приводит к более точным результатам сегментации.
Далее давайте рассмотрим ограничения традиционных инструментов для создания аннотаций, чтобы понять необходимость в более эффективных и масштабируемых решениях, таких как Ultralytics .
Вот некоторые типичные проблемы, с которыми сталкиваются аннотаторы при использовании традиционных инструментов для аннотирования полигонов:
Ultralytics решает эти проблемы с помощью функций аннотирования на основе искусственного интеллекта, реализованных с использованием YOLO Segment Anything Models (SAM) и YOLO . SAM пользователям создавать высококачественные маски сегментации на основе простых входных данных, таких как щелчки мышью, которые затем можно доработать до точных полигональных аннотаций.
Аналогичным образом, интеллектуальная аннотация YOLO использует предварительно обученные или настроенные пользователем YOLO для выполнения инференции по изображению и добавления прогнозов — таких как ограничительные рамки, маски сегментации или ориентированные ограничительные рамки — в качестве аннотаций, которые затем можно просматривать и корректировать по мере необходимости. В совокупности эти возможности делают процесс аннотирования более быстрым, последовательным и легко масштабируемым.
Ultralytics включает в себя встроенный редактор аннотаций, который позволяет пользователям добавлять аннотации к изображениям прямо в рабочей среде. Это упрощает создание наборов данных и управление ими, не прибегая к отдельным, зачастую трудоемким инструментам для маркировки данных.
Помимо аннотаций в виде многоугольников, Ultralytics поддерживает несколько других типов аннотаций. Вот краткий обзор:
А теперь давайте посмотрим, как создавать аннотации многоугольников на Ultralytics — вручную или с помощью инструментов, основанных на искусственном интеллекте.
Вот краткая пошаговая инструкция по созданию аннотаций многоугольников вручную:

Далее рассмотрим функции маркировки с помощью искусственного интеллекта, поддерживаемые Ultralytics , которые ускоряют процесс аннотирования.
Платформа предлагает два подхода к интеллектуальному аннотированию: один основан на моделях Segment Anything и позволяет создавать аннотации интерактивно с помощью щелчков мышью, а другой — на YOLO и позволяет добавлять прогнозы модели непосредственно в качестве аннотаций. Оба подхода можно использовать для интеллектуального аннотирования многоугольниками.
Аннотирование SAM на Ultralytics упрощает ручную маркировку за счет использования модели Segment Anything Model (SAM) для генерации масок сегментации с минимальным вводом данных. Вместо того чтобы обводить объекты точка за точкой, пользователи могут взаимодействовать с изображением с помощью простых команд, таких как щелчки мышью, чтобы указать, что следует включить или исключить.
Платформа поддерживает несколько SAM , в том числе SAM .1 и SAM , что позволяет пользователям выбирать между более высокой скоростью обработки и большей точностью в зависимости от своих потребностей. На основе введенных пользователем данных SAM маски на уровне пикселей в режиме реального времени. Затем эти маски можно доработать и использовать в качестве полигональных аннотаций, что делает процесс быстрее, более согласованным и легче масштабируемым.
Ниже приведены инструкции по использованию SAM добавления аннотаций к полигонам в Ultralytics :

Интеллектуальная аннотация YOLO на Ultralytics ускоряет процесс маркировки за счет использования предварительно обученныхYOLO Ultralytics YOLO или тонко настроенных YOLO для генерации прогнозов по изображению и добавления их в качестве аннотаций. В зависимости от задачи набора данных эти прогнозы могут включать ограничительные прямоугольники, маски сегментации или ориентированные ограничительные прямоугольники.
Затем пользователи могут просматривать и корректировать эти аннотации по мере необходимости. Ниже приводится обзор этапов использования интеллектуальной аннотации YOLO на Ultralytics :

Аннотирование многоугольников оказывает реальное влияние на различные отрасли — от контроля качества в производстве до сельского хозяйства и здравоохранения. Давайте рассмотрим некоторые ключевые примеры практического применения.
В сельском хозяйстве мониторинг состояния сельскохозяйственных культур имеет решающее значение для повышения урожайности и сокращения потерь. Выявление участков на листьях растений, пораженных вредителями, может быть затруднительным, поскольку эти участки часто имеют нерегулярную форму и нечеткие границы.
К решению подобных задач можно применять методы сегментации изображений, такие как семантическая сегментация, при которой все пиксели, относящиеся к определенному классу (например, зараженные участки), помечаются соответствующими метками, или сегментация экземпляров, которая позволяет более точно выделять контуры объектов.
С помощью Ultralytics пользователи могут использовать многоугольные аннотации для обозначения точной формы этих заражённых участков. Это способствует созданию более точных наборов данных и облегчает алгоритмам искусственного интеллекта в области компьютерного зрения обнаружение едва заметных закономерностей в сельскохозяйственной среде.
В результате команды могут создавать более качественные обучающие данные, которые помогают моделям точно определять места заражения вредителями. Это более эффективно, чем использование ограничительных рамок, которые могут охватывать части листа, не пораженные вредителями.
Подобно обнаружению вредителей в сельском хозяйстве, даже незначительные различия в границах могут повлиять на то, как анализируются такие заболевания, как рак, при медицинской визуализации. Это особенно важно при выявлении патологических отклонений, таких как опухоли, на компьютерных томограммах.
Традиционные методы аннотирования могут не учитывать мелкие края или включать окружающие ткани, что снижает точность. С помощью Ultralytics специалисты могут использовать полигональную аннотацию для точного обведения этих областей в обучающих данных, что помогает моделям выполнять более точную и надежную сегментацию опухолей.
Аннотирование многоугольников играет ключевую роль, когда моделям требуется с высокой точностью распознавать формы объектов на изображениях. Это позволяет более точно отображать сложные формы, особенно при использовании Ultralytics . Сочетая точность с мощными инструментами, команды могут создавать более надёжные и высокопроизводительные модели искусственного интеллекта.
Готовы внедрить технологию компьютерного зрения в свои проекты? Присоединяйтесь к нашему сообществу и узнайте больше об искусственном интеллекте в автомобильной промышленности и о технологиях компьютерного зрения в робототехнике. Посетите наш репозиторий на GitHub, чтобы узнать больше. Ознакомьтесь с нашими вариантами лицензирования и начните работу уже сегодня!
Начните свой путь в будущее машинного обучения