Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Настройки cookie
Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Присоединяйтесь к нам, и мы рассмотрим необходимость в высококачественных данных при создании моделей компьютерного зрения. Узнайте, как качество данных может повлиять на производительность модели.
По состоянию на 2019 год внедрение искусственного интеллекта (AI) на предприятиях увеличилось на 270% за предыдущие четыре года. Этот рост способствовал быстрой интеграции приложений компьютерного зрения (CV) — AI-систем, которые позволяют машинам интерпретировать и анализировать визуальные данные из окружающего мира. Эти приложения поддерживают широкий спектр технологий, от обнаружения заболеваний в медицинской визуализации и обеспечения автономных транспортных средств до оптимизации транспортного потока и повышения эффективности наблюдения в системах безопасности.
Замечательная точность и непревзойденная производительность передовых моделей компьютерного зрения, таких как Ultralytics YOLO11, в значительной степени обусловили этот экспоненциальный рост. Однако производительность этих моделей во многом зависит от качества и количества данных, используемых для обучения, валидации и тестирования моделей.
Без достаточного количества высококачественных данных модели компьютерного зрения сложно эффективно обучать и точно настраивать в соответствии с отраслевыми стандартами. В этой статье мы рассмотрим жизненно важную роль данных в создании моделей компьютерного зрения и то, почему высококачественные данные так важны в компьютерном зрении. Мы также рассмотрим несколько советов, которые помогут вам создавать высококачественные наборы данных при работе над обучением пользовательских моделей компьютерного зрения. Давайте начнем!
Роль данных в создании моделей компьютерного зрения
Модели компьютерного зрения можно обучать на больших наборах данных изображений и видео для распознавания закономерностей и выполнения точных прогнозов. Например, модель обнаружения объектов можно обучить на сотнях или даже тысячах размеченных изображений и видео для точной идентификации объектов.
Поскольку модели компьютерного зрения могут обучаться только на тех данных, которые им предоставляются, предоставление высококачественных данных и разнообразных примеров имеет решающее значение для их успеха. Без достаточных и разнообразных наборов данных эти модели могут неточно анализировать реальные сценарии и выдавать предвзятые или неточные результаты.
Вот почему важно четко понимать роль данных в обучении моделей. Прежде чем мы рассмотрим характеристики высококачественных данных, давайте разберемся, с какими типами наборов данных вы можете столкнуться при обучении моделей компьютерного зрения.
Типы наборов данных для компьютерного зрения
В компьютерном зрении данные, используемые в процессе обучения, делятся на три типа, каждый из которых служит определенной цели. Вот краткий обзор каждого типа:
Данные для обучения: Это основной набор данных, используемый для обучения модели с нуля. Он состоит из изображений и видео с предопределенными метками, что позволяет модели изучать закономерности и распознавать объекты.
Данные для валидации: Это набор данных, используемый для проверки эффективности модели в процессе обучения. Он помогает убедиться, что модель правильно работает с новыми, ранее не виденными данными.
Тестовые данные: Отдельный набор данных, используемый для оценки конечной производительности обученной модели. Он проверяет, насколько хорошо модель может делать прогнозы на совершенно новых, невиданных данных.
Рис. 1. Как данные классифицируются в компьютерном зрении.
Топ-5 признаков высококачественных наборов данных компьютерного зрения
Независимо от типа набора данных, высококачественные данные необходимы для создания успешных моделей компьютерного зрения. Вот некоторые из ключевых характеристик, которые делают набор данных высококачественным:
Точность: В идеале данные должны точно отражать реальные ситуации и содержать правильные метки. Например, когда речь идет об использовании Vision AI в здравоохранении, изображения рентгеновских снимков или сканов должны быть точно помечены, чтобы помочь модели правильно обучаться.
Разнообразие: Хороший набор данных включает в себя множество примеров, чтобы помочь модели хорошо работать в различных ситуациях. Например, если модель учится обнаруживать автомобили, набор данных должен включать автомобили разных форм, размеров и цветов в различных условиях (день, ночь, дождь и т. д.).
Согласованность: Высококачественные наборы данных соответствуют единому формату и стандартам качества. Например, изображения должны иметь одинаковое разрешение (некоторые размытые, а другие четкие) и проходить одни и те же этапы предварительной обработки, такие как изменение размера или корректировка цвета, чтобы модель училась на согласованной информации.
Своевременность: Наборы данных, которые регулярно обновляются, могут идти в ногу с изменениями в реальном мире. Предположим, вы обучаете модель для обнаружения всех типов транспортных средств. Если появляются новые, такие как электрические самокаты, их следует добавить в набор данных, чтобы убедиться, что модель остается точной и актуальной.
Конфиденциальность: Если набор данных содержит конфиденциальную информацию, например фотографии людей, необходимо соблюдать правила конфиденциальности. Такие методы, как анонимизация (удаление идентифицируемых деталей) и маскирование данных (скрытие конфиденциальных частей), могут защитить конфиденциальность, при этом позволяя безопасно использовать данные.
Проблемы, вызванные низким качеством данных
Хотя понимание характеристик высококачественных данных важно, не менее важно учитывать, как низкокачественные данные могут повлиять на ваши модели компьютерного зрения.
Такие проблемы, как переобучение и недообучение, могут серьезно повлиять на производительность модели. Переобучение происходит, когда модель хорошо работает на обучающих данных, но испытывает трудности с новыми или невидимыми данными, часто из-за недостатка разнообразия в наборе данных. Недообучение, с другой стороны, возникает, когда набор данных не предоставляет достаточно примеров или качества для того, чтобы модель выучила значимые закономерности. Чтобы избежать этих проблем, важно поддерживать разнообразные, непредвзятые и высококачественные наборы данных, обеспечивая надежную производительность как в обучении, так и в реальных приложениях.
Данные низкого качества также могут затруднить извлечение и изучение моделью значимых закономерностей из необработанных данных, процесс, известный как извлечение признаков. Если набор данных неполный, нерелевантный или ему не хватает разнообразия, модель может испытывать трудности с эффективной работой.
Иногда низкое качество данных может быть результатом упрощения данных. Упрощение данных может помочь сэкономить место для хранения и снизить затраты на обработку, но чрезмерное упрощение может удалить важные детали, необходимые для хорошей работы модели. Вот почему так важно поддерживать высокое качество данных на протяжении всего процесса компьютерного зрения, от сбора до развертывания. Как правило, наборы данных должны включать основные функции, оставаясь при этом разнообразными и точными, чтобы гарантировать надежные прогнозы модели.
Советы по поддержанию качества набора данных для компьютерного зрения
Теперь, когда мы поняли важность высококачественных данных и влияние низкокачественных данных, давайте рассмотрим, как убедиться, что ваш набор данных соответствует высоким стандартам.
Все начинается с надежного сбора данных. Использование разнообразных источников, таких как краудсорсинг, данные из различных географических регионов и генерация синтетических данных, снижает предвзятость и помогает моделям справляться с реальными сценариями. После сбора данных критически важна предварительная обработка. Такие методы, как нормализация, которая масштабирует значения пикселей до согласованного диапазона, и аугментация, которая применяет преобразования, такие как вращение, отражение и масштабирование, улучшают набор данных. Эти шаги помогают вашей модели лучше обобщать и становиться более надежной, снижая риск переобучения.
Правильное разделение наборов данных — еще один ключевой шаг. Распространенный подход — выделить 70% данных для обучения, 15% для валидации и 15% для тестирования. Двойная проверка отсутствия перекрытия между этими наборами предотвращает утечку данных и обеспечивает точную оценку модели.
Рис. 4. Распространенное разделение данных на обучающий, проверочный и тестовый наборы.
Вы также можете использовать предварительно обученные модели, такие как YOLO11, чтобы сэкономить время и вычислительные ресурсы. YOLO11, обученная на больших наборах данных и предназначенная для различных задач компьютерного зрения, может быть точно настроена на вашем конкретном наборе данных для удовлетворения ваших потребностей. Настроив модель под свои данные, вы сможете избежать переобучения и сохранить высокую производительность.
Перспективы наборов данных для компьютерного зрения
Традиционно, AI-сообщество фокусировалось на повышении производительности путем создания более глубоких моделей с большим количеством слоев. Однако, по мере развития AI, акцент смещается с оптимизации моделей на улучшение качества наборов данных. Эндрю Ын, которого часто называют “отцом AI”, считает, что “самым важным сдвигом, который должен произойти в мире AI в этом десятилетии, будет переход к дата-ориентированному AI.”
Этот подход подчеркивает совершенствование наборов данных за счет повышения точности меток, удаления зашумленных примеров и обеспечения разнообразия. Для компьютерного зрения эти принципы имеют решающее значение для решения таких проблем, как предвзятость и низкое качество данных, что позволяет моделям надежно работать в реальных сценариях.
В будущем развитие компьютерного зрения будет зависеть от создания небольших, высококачественных наборов данных, а не от сбора огромных объемов данных. По словам Эндрю Ына, «Улучшение данных — это не одноразовый этап предварительной обработки; это основная часть итеративного процесса разработки модели машинного обучения». Сосредоточив внимание на принципах, ориентированных на данные, компьютерное зрение будет продолжать становиться более доступным, эффективным и значимым в различных отраслях.
Основные выводы
Данные играют решающую роль на протяжении всего жизненного цикла модели машинного зрения. От сбора данных до предварительной обработки, обучения, проверки и тестирования качество данных напрямую влияет на производительность и надежность модели. Уделяя приоритетное внимание высококачественным данным и точной маркировке, мы можем создавать надежные модели компьютерного зрения, которые обеспечивают надежные и точные результаты.
По мере продвижения к будущему, основанному на данных, важно учитывать этические соображения, чтобы снизить риски, связанные со смещением и правилами конфиденциальности. В конечном счете, обеспечение целостности и справедливости данных является ключом к раскрытию всего потенциала технологий компьютерного зрения.