Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Индивидуальное обучение Ultralytics YOLO11 с помощью наборов данных компьютерного зрения

Абирами Вина

4 мин чтения

7 января 2025 г.

Узнайте, как интеграция Roboflow может упростить индивидуальное обучение Ultralytics YOLO11 , сделав наборы данных компьютерного зрения с открытым исходным кодом легкодоступными.

Обучение модели компьютерного зрения типа Ultralytics YOLO11 обычно включает в себя сбор изображений для вашего набора данных, их аннотирование, подготовку данных и тонкую настройку модели в соответствии с вашими конкретными требованиями. Хотя пакетUltralytics Python делает эти шаги простыми и удобными для пользователя, разработка ИИ в области компьютерного зрения все равно может занять много времени.

Это особенно актуально, когда вы работаете в сжатые сроки или разрабатываете прототип. В таких ситуациях наличие инструментов или интеграций, упрощающих отдельные части процесса - например, упрощающих подготовку наборов данных или автоматизирующих повторяющиеся задачи, - может иметь большое значение. Сокращая время и усилия, эти решения помогают сосредоточиться на создании и совершенствовании модели. Именно это и предлагает интеграция Roboflow .

Интеграция с Roboflow позволяет вам легко получить доступ к наборам данных из Roboflow Universe, большой библиотеки наборов данных компьютерного зрения с открытым исходным кодом. Вместо того чтобы тратить часы на сбор и организацию данных, вы можете быстро найти и использовать существующие наборы данных, чтобы запустить процесс обучения YOLO11 . Такая интеграция значительно ускоряет и упрощает эксперименты и итерации при разработке моделей компьютерного зрения.

В этой статье мы рассмотрим, как можно использовать интеграцию Roboflow для ускорения разработки моделей. Давайте начнем!

Что такое Roboflow Universe?

Roboflow Universe - это платформа, поддерживаемая компанией Roboflow, которая занимается упрощением разработки компьютерного зрения. Она включает в себя более 350 миллионов изображений, 500 000 наборов данных и 100 000 точно настроенных моделей для таких задач, как обнаружение объектов, классификация изображений и сегментация. Вселенная Roboflow , в которую вносят свой вклад разработчики и исследователи со всего мира, является центром совместной работы для всех, кто хочет начать или улучшить свои проекты в области компьютерного зрения.

Рис. 1. Примеры наборов данных по обнаружению объектов во вселенной Roboflow .

Roboflow Universe включает в себя следующие ключевые особенности:

  • Инструменты для изучения наборов данных: Изучайте, фильтруйте и визуализируйте наборы данных, чтобы быстро найти ресурсы, соответствующие требованиям вашего проекта.
  • Параметры экспорта: Экспортируйте данные в такие форматы, как COCO, YOLO, TFRecord, CSV и другие, чтобы соответствовать вашему рабочему процессу.
  • Аналитика набора данных: Получите представление о различных наборах данных с помощью инструментов аналитики, которые предоставляют визуализации распределений меток, дисбаланса классов и качества набора данных. 
  • Отслеживание версий: Просмотр и доступ к различным версиям наборов данных, загруженных участниками, что позволяет track обновления, сравнивать изменения и выбирать версию, которая лучше всего соответствует потребностям вашего проекта. 

Интеграция с Roboflow поможет вам найти нужные данные

Поиск подходящего набора данных часто является одной из самых сложных задач при создании модели компьютерного зрения. Создание набора данных обычно включает в себя сбор большого количества изображений, обеспечение их соответствия вашей задаче и последующую точную маркировку. 

Этот процесс может занять много времени и ресурсов, особенно если вы экспериментируете с различными подходами в течение короткого периода. Даже поиск существующих наборов данных может быть затруднен, поскольку они часто разбросаны по платформам, не имеют надлежащей документации или не содержат необходимых аннотаций.

Например, если вы создаете приложение компьютерного зрения для detect сорняков на сельскохозяйственных полях, вам может понадобиться протестировать различные подходы Vision AI, например обнаружение объектов или сегментацию экземпляров. Это позволит вам поэкспериментировать и выяснить, какой метод работает лучше, прежде чем тратить время и силы на сбор и маркировку собственного набора данных.

Рис. 2. Обнаружение деталей автомобиля с помощью YOLO11.

С помощью интеграции Roboflow вы можете просматривать различные наборы данных, связанные с сельским хозяйством, включая те, которые направлены на обнаружение сорняков, здоровье культур или мониторинг полей. Эти готовые наборы данных позволят вам опробовать различные методики и усовершенствовать свою модель, не прибегая к созданию собственных данных. 

Как работает интеграция с Roboflow

Теперь, когда мы обсудили, как можно использовать интеграцию Roboflow для поиска нужных наборов данных, давайте посмотрим, как она вписывается в ваш рабочий процесс. Выбрав набор данных из Roboflow Universe, вы можете экспортировать или загрузить его в формате YOLO11 . После того как набор данных экспортирован, его можно использовать для обучения YOLO11 с помощью пакета Ultralytics Python . 

Загрузив свой набор данных, вы можете заметить, что Roboflow Universe поддерживает и другие форматы для обучения различных моделей. Итак, почему вы должны выбрать для обучения Ultralytics YOLO11? 

YOLO11 - это последняя версия моделей Ultralytics YOLO , созданная для более быстрого и точного обнаружения объектов. Она использует на 22 % меньше параметров (внутренних значений, которые модель настраивает в процессе обучения для прогнозирования), чем YOLOv8m, но при этом достигает более высокой средней точностиmAP) на наборе данных COCO . Такой баланс скорости и точности делает YOLO11 универсальным выбором для широкого спектра приложений компьютерного зрения, особенно при обучении моделей под конкретные задачи.

Вот более подробный взгляд на то, как работает индивидуальный тренинг YOLO11:

  • Подача данных: Модель YOLO11 обрабатывает ваш набор данных, обучаясь detect и classify объекты на основе изображений и аннотаций к ним.
  • Прогнозирование и обратная связь: Модель делает прогнозы об объектах на изображениях и сравнивает их с правильными ответами, представленными в наборе данных.
  • Отслеживание производительности: Для оценки прогресса отслеживаются такие метрики, как точность (правильные обнаружения), полнота (пропущенные обнаружения) и потери (ошибки прогнозирования).
  • Итеративное обучение: Модель корректирует свои параметры в течение нескольких раундов (эпох), чтобы повысить точность обнаружения и минимизировать ошибки.
  • Финальный вывод модели: После обучения оптимизированная модель сохраняется и готова к развертыванию.

Другие интеграции, ориентированные на разработку систем компьютерного зрения.

Изучая интеграцию Roboflow , вы заметите и другие интеграции, упомянутые в документацииUltralytics . Мы поддерживаем множество интеграций, связанных с различными этапами развития компьютерного зрения. 

Это сделано для того, чтобы предоставить нашему сообществу ряд опций, чтобы вы могли выбрать то, что лучше всего подходит для вашего конкретного рабочего процесса.

Рис. 3. Обзор интеграций, поддерживаемых Ultralytics.

Помимо наборов данных, другие Ultralytics интеграции посвящены различным частям процесса компьютерного зрения, таким как обучение, развертывание и оптимизация. Вот несколько примеров других интеграций, которые мы поддерживаем:

  • Интеграции для обучения: Такие интеграции, как Amazon SageMaker и Paperspace Gradient, упрощают рабочие процессы обучения, предлагая облачные платформы для эффективной разработки и тестирования моделей.
  • Интеграция рабочих процессов и отслеживания экспериментов: ClearML, MLFlow и Weights & Biases (W&B) помогают автоматизировать рабочие процессы, track эксперименты и улучшать совместную работу, упрощая управление проектами машинного обучения.
  • Интеграции для оптимизации и развертывания: CoreML, ONNX и OpenVINO позволяют оптимизировать развертывание на различных устройствах и фреймворках, обеспечивая эффективную работу на таких платформах, как оборудование Apple и процессоры Intel .
  • Интеграции для мониторинга и визуализации: TensorBoard и Weights & Biases предоставляют инструменты для визуализации прогресса обучения и мониторинга производительности, давая подробную информацию для совершенствования моделей.

Приложения YOLO11 и роль интеграций

Интеграции, поддерживающие разработку компьютерного зрения, в сочетании с надежными возможностями YOLO11 облегчают решение реальных задач. Рассмотрим такие инновации, как компьютерное зрение в производстве, где искусственное зрение используется для detect дефектов на производственной линии - например, царапин на металлических деталях или отсутствующих компонентов. Сбор нужных данных для таких задач часто может быть медленным и сложным, требующим доступа к специализированным средам. 

Обычно это включает в себя установку камер или датчиков вдоль производственных линий для захвата изображений продукции. Эти изображения необходимо делать в больших объемах, часто при постоянном освещении и углах, чтобы обеспечить четкость и однородность. 

После захвата изображения должны быть тщательно аннотированы с точными метками для каждого типа дефекта, такого как царапины, вмятины или отсутствующие компоненты. Этот процесс требует значительного времени и ресурсов, а также опыта, чтобы убедиться, что набор данных точно отражает реальную изменчивость. Необходимо учитывать такие факторы, как различные размеры, формы и материалы дефектов, чтобы создать надежный и достоверный набор данных.

Интеграции, предоставляющие готовые наборы данных, облегчают такие задачи, как промышленный контроль качества, а благодаря возможностям обнаружения в реальном времени YOLO11производители могут контролировать производственные линии, мгновенно выявлять дефекты и повышать эффективность.

Рис. 4. Пример использования Ultralytics YOLO11 для detect и подсчета выпускаемых банок.

Помимо производства, интеграция, связанная с наборами данных, может использоваться во многих других отраслях. Соединив скорость и точность YOLO11с легкодоступными наборами данных, предприятия могут быстро разрабатывать и внедрять решения, отвечающие их специфическим потребностям. Например, в здравоохранении - интеграция наборов данных может помочь разработать решения для анализа медицинских изображений с целью detect аномалий, таких как опухоли. Аналогично, в автономном вождении такие интеграции могут помочь в идентификации транспортных средств, пешеходов и дорожных знаков для повышения безопасности.

Основные выводы

Поиск подходящего набора данных часто является одной из самых трудоемких частей создания модели компьютерного зрения. Однако интеграция с Roboflow упрощает поиск наилучших наборов данных для индивидуального обучения моделей Ultralytics YOLO , даже если вы новичок в компьютерном зрении. 

Благодаря доступу к обширным наборам данных для задач компьютерного зрения, таких как обнаружение объектов, классификация изображений или сегментация экземпляров, Roboflow Universe избавляет вас от лишних хлопот, связанных с поиском данных. Он помогает быстро приступить к работе и сосредоточиться на построении модели, а не тратить время на сбор и организацию данных. Такой оптимизированный подход позволяет разработчикам более эффективно создавать прототипы, проводить итерации и разрабатывать решения для компьютерного зрения.

Чтобы узнать больше, посетите наш репозиторий GitHub и взаимодействуйте с нашим сообществом. Изучите инновации в таких областях, как ИИ в автомобилях с автоматическим управлением и компьютерное зрение в сельском хозяйстве, на страницах наших решений. 🚀

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно