Аннотация данных
Что такое аннотация данных? Узнайте, как маркировка данных ограничительными рамками или полигонами необходима для обучения точных моделей искусственного интеллекта и компьютерного зрения.
Аннотирование данных - это процесс маркировки или пометки исходных данных, помогающий моделям машинного обучения (ML) понимать и обучаться на их основе. Этот важнейший этап превращает неструктурированные данные, например изображения или видео, в структурированную информацию, которую могут интерпретировать алгоритмы. В контексте контролируемого обучения эти аннотации служат "базовой истиной" - правильными ответами, которые модель использует для своего обучения. Качество и точность аннотирования данных напрямую влияют на производительность и надежность итоговой модели искусственного интеллекта (ИИ). Без точных аннотаций даже самые совершенные модели не смогут эффективно изучать закономерности.
Роль аннотаций в компьютерном зрении
В компьютерном зрении (КЗ) аннотирование данных является основой для обучения моделей "видеть" и интерпретировать мир. В процессе аннотирования люди с помощью специализированного программного обеспечения идентифицируют и отмечают интересующие их объекты в визуальных данных. Существует несколько типов аннотирования, каждый из которых подходит для разных задач КВ:
- Аннотация граничной коробки: Это наиболее распространенная форма, используемая для обнаружения объектов. Аннотаторы рисуют прямоугольные рамки вокруг отдельных объектов и присваивают им метку класса (например, "автомобиль", "человек").
- Полигональная сегментация: Для задач, требующих большей точности, таких как сегментация объектов, аннотаторы прорисовывают точный контур каждого объекта. Это позволяет модели понять конкретную форму и границы объекта, даже если объекты накладываются друг на друга.
- Семантическая сегментация: Этот метод предполагает отнесение каждого пикселя изображения к определенной категории (например, "небо", "дорога", "здание"). В отличие от сегментации по экземпляру, он не различает разные экземпляры одного и того же класса объектов.
- Аннотация ключевых точек: Эта техника используется для оценки позы и включает в себя маркировку определенных точек интереса (ключевых точек) на объекте, таких как суставы человеческого тела или углы лица.
- Классификация: Простейшая форма, когда всему изображению присваивается одна метка. Она является основой для задач классификации изображений.
Выбор метода аннотирования зависит от конкретных целей проекта по созданию резюме, которые изложены в руководстве по определению целей проекта.
Применение в реальном мире
- Автономные транспортные средства: Самоуправляемые автомобили полагаются на модели, обученные на обширных аннотированных данных. На миллионах изображений и облаков точек LiDAR аннотаторы обозначают все: от пешеходов и велосипедистов до светофоров, разметки и дорожных знаков. Эти подробные обучающие данные позволяют системе восприятия автомобиля понимать окружающую обстановку и принимать решения о безопасном вождении. Такие наборы данных, как Argoverse, крайне важны для разработки надежных решений в области искусственного интеллекта в автомобилях.
- Анализ медицинских изображений: В области ИИ для здравоохранения радиологи и медицинские эксперты аннотируют медицинские снимки, такие как МРТ, КТ и рентгеновские снимки, чтобы выделить опухоли, повреждения, переломы и другие аномалии. Эти аннотированные наборы данных, такие как общедоступный набор данных по опухолям головного мозга, используются для обучения таких моделей, как Ultralytics YOLO, которые могут помочь в ранней диагностике и планировании лечения. Радиологическое общество Северной Америки (RSNA) предоставляет несколько таких наборов данных для исследований.
Аннотация данных в сравнении со смежными понятиями
Аннотирование данных часто обсуждается наряду с другими методами подготовки данных, но они служат разным целям.
- Аннотация данных и маркировка данных: Эти два термина часто используются как взаимозаменяемые и относятся к одному и тому же основному процессу. Термин "аннотация" часто используется в компьютерном зрении для описания более сложных задач, таких как рисование многоугольников или ключевых точек, в то время как "маркировка" может использоваться для более простых задач, таких как классификация. Однако для всех практических целей они являются синонимами. Более подробную информацию вы можете найти в нашей статье о маркировке данных в компьютерном зрении.
- Аннотирование данных по сравнению с дополнением данных: Аннотирование - это процесс создания исходных истинных меток. С другой стороны, увеличение данных - это техника, используемая после аннотирования для искусственного увеличения размера набора данных путем создания модифицированных версий аннотированных изображений (например, поворот, переворот или изменение яркости).
- Аннотация данных и очистка данных: Очистка данных включает в себя исправление ошибок, удаление дубликатов и обработку недостающих значений в наборе данных для обеспечения его общего качества. Очистка может происходить до аннотирования (например, удаление размытых изображений) или после (например, исправление неправильных меток), но она отличается от самого процесса добавления новых меток. Высокое качество данных необходимо для эффективного аннотирования.
Для управления процессом аннотирования можно использовать различные инструменты, от вариантов с открытым исходным кодом, таких как CVAT, до коммерческих платформ, таких как Scale AI и Labelbox. Такие платформы, как Ultralytics HUB, предоставляют интегрированные решения для управления наборами данных, обучения моделей и оптимизации всего рабочего процесса - от сбора данных и аннотирования до развертывания.