Нажав кнопку "Принять все файлы cookie", вы соглашаетесь с сохранением файлов cookie на вашем устройстве для улучшения навигации по сайту, анализа его использования и помощи в наших маркетинговых усилиях. Дополнительная информация
Настройки файлов cookie
Нажав кнопку "Принять все файлы cookie", вы соглашаетесь с сохранением файлов cookie на вашем устройстве для улучшения навигации по сайту, анализа его использования и помощи в наших маркетинговых усилиях. Дополнительная информация
Присоединяйтесь к нам, чтобы узнать о необходимости использования высококачественных данных при построении моделей компьютерного зрения. Узнайте, как качество данных может повлиять на производительность модели.
По состоянию на 2019 год внедрение искусственного интеллекта (ИИ) на предприятиях выросло на 270 % за предыдущие четыре года. Этот рост способствовал быстрой интеграции приложений компьютерного зрения (КЗ) - систем ИИ, которые позволяют машинам интерпретировать и анализировать визуальные данные из окружающего мира. Эти приложения используются в широком спектре технологий, от выявления заболеваний в медицинской визуализации и создания автономных транспортных средств до оптимизации транспортных потоков и усиления наблюдения в системах безопасности.
Удивительная точность и непревзойденная производительность передовых моделей компьютерного зрения, таких как Ultralytics YOLO11, во многом обусловили этот экспоненциальный рост. Однако производительность этих моделей в значительной степени зависит от качества и количества данных, используемых для обучения, проверки и тестирования моделей.
Без достаточного количества высококачественных данных модели компьютерного зрения сложно обучать и эффективно настраивать в соответствии с промышленными стандартами. В этой статье мы рассмотрим жизненно важную роль данных в создании моделей компьютерного зрения и объясним, почему высококачественные данные так важны в компьютерном зрении. Мы также рассмотрим несколько советов, которые помогут вам создавать высококачественные наборы данных при обучении пользовательских моделей компьютерного зрения. Давайте начнем!
Роль данных в построении моделей компьютерного зрения
Модели компьютерного зрения можно обучать на больших массивах данных изображений и видео, чтобы распознавать закономерности и делать точные прогнозы. Например, модель обнаружения объектов может быть обучена на сотнях или даже тысячах помеченных изображений и видео, чтобы точно идентифицировать объекты.
Поскольку модели компьютерного зрения могут обучаться только на основе данных, которые они получают, предоставление высококачественных данных и разнообразных примеров имеет решающее значение для их успеха. Без достаточного количества разнообразных данных эти модели могут не справиться с точным анализом реальных сценариев и выдать необъективные или неточные результаты.
Именно поэтому важно четко понимать роль данных в обучении моделей . Прежде чем мы рассмотрим характеристики высококачественных данных, давайте разберемся, с какими типами наборов данных вы можете столкнуться при обучении моделей компьютерного зрения.
Типы наборов данных компьютерного зрения
В компьютерном зрении данные, используемые в процессе обучения, делятся на три типа, каждый из которых служит определенной цели. Вот краткий обзор каждого типа:
Учебные данные: Это основной набор данных, используемый для обучения модели с нуля. Он состоит из изображений и видео с заранее определенными метками, что позволяет модели изучать шаблоны и распознавать объекты.
Валидационные данные: Это набор данных, используемых для проверки того, насколько хорошо работает модель в процессе обучения. Он помогает убедиться, что модель работает правильно на новых, невидимых данных.
Данные тестирования: Отдельный набор данных, используемый для оценки конечной эффективности обученной модели. Он проверяет, насколько хорошо модель может делать предсказания на совершенно новых, невидимых данных.
Рис. 1. Как классифицируются данные в компьютерном зрении.
Топ-5 признаков высококачественных наборов данных компьютерного зрения
Независимо от типа набора данных, качественные данные необходимы для построения успешных моделей компьютерного зрения. Вот некоторые ключевые характеристики, которые делают набор данных высококачественным:
Точность: В идеале данные должны точно отражать реальные ситуации и содержать правильные метки. Например, когда речь идет о Vision AI в здравоохранении, изображения рентгеновских снимков или сканов должны быть точно промаркированы, чтобы помочь модели правильно обучаться.
Разнообразие: Хороший набор данных включает в себя множество примеров, помогающих модели хорошо работать в различных ситуациях. Например, если модель учится обнаруживать автомобили, в набор данных должны входить автомобили разных форм, размеров и цветов в различных условиях (днем, ночью, в дождь и т. д.).
Последовательность: Высококачественные наборы данных имеют единый формат и стандарты качества. Например, изображения должны иметь одинаковое разрешение (а не размытые и четкие) и проходить одни и те же этапы предварительной обработки, например изменение размера или цветокоррекцию, чтобы модель обучалась на основе согласованной информации.
Своевременность: Наборы данных, которые регулярно обновляются, могут успевать за изменениями в реальном мире. Допустим, вы обучаете модель для обнаружения всех типов транспортных средств. Если появляются новые, например электрические скутеры, их следует добавить в набор данных, чтобы модель оставалась точной и актуальной.
Конфиденциальность: Если набор данных содержит конфиденциальную информацию, например фотографии людей, необходимо соблюдать правила конфиденциальности. Такие методы, как анонимизация (удаление идентифицируемых деталей) и маскировка данных (сокрытие конфиденциальных деталей), позволяют защитить конфиденциальность и при этом безопасно использовать данные.
Проблемы, вызванные низким качеством данных
Хотя понимание признаков высококачественных данных очень важно, не менее важно учитывать, как низкокачественные данные могут повлиять на ваши модели компьютерного зрения.
Такие проблемы, как чрезмерная и недостаточная подгонка, могут сильно повлиять на производительность модели. Переподгонка происходит, когда модель хорошо работает на обучающих данных, но испытывает трудности с новыми или неизвестными данными, часто из-за недостаточного разнообразия набора данных. С другой стороны, недостаточная подгонка возникает, когда набор данных не обеспечивает достаточного количества примеров или качества, чтобы модель могла изучить значимые закономерности. Чтобы избежать этих проблем, важно поддерживать разнообразные, непредвзятые и высококачественные наборы данных, обеспечивающие надежную работу как в процессе обучения, так и в реальных приложениях.
Низкое качество данных также может затруднить извлечение и изучение моделями значимых закономерностей из исходных данных - этот процесс известен как извлечение признаков. Если набор данных неполный, неактуальный или недостаточно разнообразный, модель может работать неэффективно.
Иногда некачественные данные могут быть результатом упрощения данных. Упрощение данных помогает сэкономить место для хранения и снизить затраты на обработку, но чрезмерное упрощение может привести к удалению важных деталей, необходимых для правильной работы модели. Вот почему так важно поддерживать высокое качество данных на протяжении всего процесса работы с компьютерным зрением- от сбора до развертывания. Как правило, наборы данных должны включать основные характеристики, оставаясь при этом разнообразными и точными, чтобы гарантировать надежность предсказаний модели.
Советы по поддержанию качества наборов данных компьютерного зрения
Теперь, когда мы поняли важность высококачественных данных и влияние некачественных данных, давайте рассмотрим, как сделать так, чтобы ваш набор данных соответствовал высоким стандартам.
Все начинается с надежного сбора данных. Использование различных источников, таких как краудсорсинг, данные из разных географических регионов и синтетические данные , снижает погрешность и помогает моделям справляться с реальными сценариями. После сбора данных крайне важна их предварительная обработка. Такие методы, как нормализация, которая приводит значения пикселей к единому диапазону, и увеличение, которое применяет такие преобразования, как поворот, переворот и масштабирование, улучшают набор данных. Эти шаги помогут вашей модели лучше обобщить данные и стать более надежной, снизив риск перебора.
Правильное разделение наборов данных - еще один ключевой шаг. Общепринятый подход заключается в выделении 70 % данных для обучения, 15 % для проверки и 15 % для тестирования. Двойной контроль за тем, чтобы эти наборы не пересекались, предотвращает утечку данных и обеспечивает точную оценку модели.
Рис. 4. Общее разделение данных на обучающие, проверочные и тестовые.
Для экономии времени и вычислительных ресурсов можно использовать предварительно обученные модели, такие как YOLO11. Модель YOLO11, обученная на больших наборах данных и предназначенная для решения различных задач компьютерного зрения, может быть точно настроена на вашем конкретном наборе данных в соответствии с вашими потребностями. Настраивая модель в соответствии с вашими данными, вы сможете избежать чрезмерной подгонки и сохранить высокую производительность.
Дорога вперед для наборов данных компьютерного зрения
Сообщество ИИ традиционно фокусируется на повышении производительности за счет построения более глубоких моделей с большим количеством слоев. Однако по мере развития ИИ акцент смещается с оптимизации моделей на повышение качества наборов данных. Эндрю Нг, которого часто называют "отцом ИИ", считает, что "самым важным сдвигом, который должен произойти в мире ИИ в этом десятилетии, станет переход к ИИ, ориентированному на данные".
В этом подходе особое внимание уделяется уточнению наборов данных путем повышения точности меток, удаления зашумленных примеров и обеспечения разнообразия. Для компьютерного зрения эти принципы очень важны для решения таких проблем, как предвзятость и некачественные данные, что позволяет моделям надежно работать в реальных сценариях.
Если смотреть в будущее, то развитие компьютерного зрения будет зависеть от создания небольших высококачественных наборов данных, а не от сбора огромного количества данных. По словам Эндрю Нг, "улучшение данных - это не разовый шаг предварительной обработки; это основная часть итеративного процесса разработки моделей машинного обучения ". Если сосредоточиться на принципах, ориентированных на данные, компьютерное зрение будет и дальше становиться все более доступным, эффективным и влиятельным в различных отраслях.
Основные выводы
Данные играют важную роль на протяжении всего жизненного цикла модели технического зрения. От сбора данных, их предварительной обработки, обучения, проверки и тестирования качество данных напрямую влияет на производительность и надежность модели. Отдавая предпочтение высококачественным данным и точной маркировке, мы можем создавать надежные модели компьютерного зрения, обеспечивающие достоверные и точные результаты.
По мере того как мы движемся к будущему, основанному на данных, важно учитывать этические аспекты, чтобы снизить риски, связанные с предвзятостью и правилами конфиденциальности. В конечном итоге обеспечение целостности и справедливости данных является ключом к раскрытию всего потенциала технологий компьютерного зрения.
Присоединяйтесь к нашему сообществу и ознакомьтесь с нашим репозиторием GitHub, чтобы узнать больше об искусственном интеллекте. Загляните на страницы наших решений, чтобы узнать больше о применении ИИ в таких отраслях, как сельское хозяйство и производство.