Нажав кнопку "Принять все файлы cookie", вы соглашаетесь с сохранением файлов cookie на вашем устройстве для улучшения навигации по сайту, анализа его использования и помощи в наших маркетинговых усилиях. Дополнительная информация
Настройки файлов cookie
Нажав кнопку "Принять все файлы cookie", вы соглашаетесь с сохранением файлов cookie на вашем устройстве для улучшения навигации по сайту, анализа его использования и помощи в наших маркетинговых усилиях. Дополнительная информация
Узнайте, как интеграция Roboflow может упростить индивидуальное обучение Ultralytics YOLO11, сделав наборы данных компьютерного зрения с открытым исходным кодом легкодоступными.
Обучение модели компьютерного зрения, подобной Ultralytics YOLO11, обычно включает в себя сбор изображений для вашего набора данных, их аннотирование, подготовку данных и тонкую настройку модели в соответствии с вашими конкретными требованиями. Хотя пакет Ultralytics Python делает эти шаги простыми и удобными для пользователя, разработка ИИ в области компьютерного зрения все равно может занять много времени.
Это особенно актуально, когда вы работаете в сжатые сроки или разрабатываете прототип. В таких ситуациях наличие инструментов или интеграций, упрощающих отдельные части процесса - например, упрощающих подготовку наборов данных или автоматизирующих повторяющиеся задачи, - может иметь большое значение. Сокращая время и усилия, эти решения помогают сосредоточиться на создании и совершенствовании модели. Именно это и предлагает интеграция Roboflow.
Интеграция с Roboflow позволяет вам легко получить доступ к наборам данных из Roboflow Universe, большой библиотеки наборов данных компьютерного зрения с открытым исходным кодом. Вместо того чтобы тратить часы на сбор и организацию данных, вы можете быстро найти и использовать существующие наборы данных, чтобы запустить процесс обучения YOLO11. Такая интеграция значительно ускоряет и упрощает эксперименты и итерации при разработке моделей компьютерного зрения.
В этой статье мы рассмотрим, как можно использовать интеграцию Roboflow для ускорения разработки моделей. Давайте начнем!
Что такое Roboflow Universe?
Roboflow Universe - это платформа, поддерживаемая компанией Roboflow, которая занимается упрощением разработки компьютерного зрения. Она включает в себя более 350 миллионов изображений, 500 000 наборов данных и 100 000 точно настроенных моделей для таких задач, как обнаружение объектов, классификация изображений и сегментация. Вселенная Roboflow, в которую вносят свой вклад разработчики и исследователи со всего мира, является центром совместной работы для всех, кто хочет начать или улучшить свои проекты в области компьютерного зрения.
Рис. 1. Примеры наборов данных по обнаружению объектов во вселенной Roboflow.
Roboflow Universe включает в себя следующие ключевые особенности:
Инструменты для изучения наборов данных: Изучайте, фильтруйте и визуализируйте наборы данных, чтобы быстро найти ресурсы, соответствующие требованиям вашего проекта.
Параметры экспорта: Экспортируйте данные в такие форматы, как COCO, YOLO, TFRecord, CSV и другие, чтобы соответствовать вашему рабочему процессу.
Аналитика наборов данных: Получите представление о различных наборах данных с помощью инструментов анализа, которые обеспечивают визуализацию распределений меток, дисбаланса классов и качества наборов данных.
Отслеживание версий: Просмотр и доступ к различным версиям наборов данных, загруженных участниками, что позволяет отслеживать обновления, сравнивать изменения и выбирать версию, которая лучше всего соответствует потребностям вашего проекта.
Интеграция с Roboflow поможет вам найти нужные данные
Поиск подходящего набора данных часто является одной из самых сложных частей создания модели компьютерного зрения. Создание набора данных обычно включает в себя сбор большого количества изображений, проверку их соответствия поставленной задаче и их точную маркировку.
Этот процесс может занять много времени и ресурсов, особенно если вы экспериментируете с различными подходами в течение короткого периода времени. Даже найти уже существующие наборы данных может быть непросто, поскольку они часто разбросаны по платформам, не документированы должным образом или не содержат нужных вам аннотаций.
Например, если вы создаете приложение компьютерного зрения для обнаружения сорняков на сельскохозяйственных полях, вам может понадобиться протестировать различные подходы Vision AI, например обнаружение объектов или сегментацию экземпляров. Это позволит вам поэкспериментировать и выяснить, какой метод работает лучше, прежде чем тратить время и силы на сбор и маркировку собственного набора данных.
Рис. 2. Обнаружение деталей автомобиля с помощью YOLO11.
С помощью интеграции Roboflow вы можете просматривать различные наборы данных, связанные с сельским хозяйством, включая те, которые направлены на обнаружение сорняков, здоровье культур или мониторинг полей. Эти готовые наборы данных позволят вам опробовать различные методики и усовершенствовать свою модель без необходимости создавать собственные данные.
Как работает интеграция с Roboflow
Теперь, когда мы обсудили, как можно использовать интеграцию Roboflow для поиска нужных наборов данных, давайте посмотрим, как она вписывается в ваш рабочий процесс. Выбрав набор данных из Roboflow Universe, вы можете экспортировать или загрузить его в формате YOLO11. После того как набор данных экспортирован, его можно использовать для обучения YOLO11 с помощью пакета Ultralytics Python.
Загрузив свой набор данных, вы можете заметить, что Roboflow Universe поддерживает и другие форматы для обучения различных моделей. Итак, почему вы должны выбрать для обучения Ultralytics YOLO11?
YOLO11 - это последняя версия моделей Ultralytics YOLO, созданная для более быстрого и точного обнаружения объектов. Она использует на 22 % меньше параметров (внутренних значений, которые модель настраивает в процессе обучения для прогнозирования), чем YOLOv8m, но при этом достигает более высокой средней точности (mAP) на наборе данных COCO. Такой баланс скорости и точности делает YOLO11 универсальным выбором для широкого спектра приложений компьютерного зрения, особенно при обучении моделей под конкретные задачи.
Подача данных: Модель YOLO11 обрабатывает ваш набор данных, обучаясь обнаруживать и классифицировать объекты на основе изображений и аннотаций к ним.
Прогнозирование и обратная связь: Модель делает предсказания относительно объектов на изображениях и сравнивает их с правильными ответами, представленными в наборе данных.
Отслеживание эффективности: Для оценки прогресса отслеживаются такие показатели, как точность (правильные обнаружения), отзыв (пропущенные обнаружения) и потери (ошибки предсказания).
Итеративное обучение: Модель настраивает свои параметры в течение нескольких раундов (эпох), чтобы повысить точность обнаружения и минимизировать ошибки.
Окончательный вывод модели: После обучения оптимизированная модель сохраняется и готова к развертыванию.
Другие интеграции, направленные на развитие компьютерного зрения
Изучая интеграцию Roboflow, вы заметите и другие интеграции, упомянутые в документации Ultralytics. Мы поддерживаем множество интеграций, связанных с различными этапами развития компьютерного зрения.
Это делается для того, чтобы предоставить нашему сообществу широкий выбор вариантов, чтобы вы могли выбрать то, что лучше всего подходит для вашего конкретного рабочего процесса.
Помимо наборов данных, другие поддерживаемые Ultralytics интеграции посвящены различным частям процесса компьютерного зрения, таким как обучение, развертывание и оптимизация. Вот несколько примеров других интеграций, которые мы поддерживаем:
Интеграции для обучения: Такие интеграции, как Amazon SageMaker и Paperspace Gradient, упрощают рабочие процессы обучения, предлагая облачные платформы для эффективной разработки и тестирования моделей.
Интеграция рабочих процессов и отслеживания экспериментов: ClearML, MLFlow и Weights & Biases (W&B) помогают автоматизировать рабочие процессы, отслеживать эксперименты и улучшать совместную работу, упрощая управление проектами машинного обучения.
Интеграции для оптимизации и развертывания: CoreML, ONNX и OpenVINO позволяют оптимизировать развертывание на различных устройствах и фреймворках, обеспечивая эффективную работу на таких платформах, как оборудование Apple и процессоры Intel.
Интеграции для мониторинга и визуализации: TensorBoard и Weights & Biases предоставляют инструменты для визуализации прогресса обучения и мониторинга производительности, давая подробную информацию для совершенствования моделей.
Приложения YOLO11 и роль интеграций
Интеграции, поддерживающие разработку компьютерного зрения, в сочетании с надежными возможностями YOLO11 облегчают решение реальных задач. Рассмотрим такие инновации, как компьютерное зрение в производстве, где искусственное зрение используется для обнаружения дефектов на производственной линии - например, царапин на металлических деталях или отсутствующих компонентов. Сбор нужных данных для таких задач часто может быть медленным и сложным, требующим доступа к специализированным средам.
Как правило, он предполагает установку камер или датчиков вдоль производственных линий для получения изображений продукции. Эти изображения должны быть сделаны в больших объемах, часто при постоянном освещении и под разными углами, чтобы обеспечить четкость и однородность.
После съемки изображения должны быть тщательно аннотированы с точными метками для каждого типа дефектов, таких как царапины, вмятины или отсутствующие компоненты. Этот процесс требует значительного времени и ресурсов, а также специальных знаний, чтобы набор данных точно отражал реальную ситуацию. Для создания надежного и достоверного набора данных необходимо учесть такие факторы, как различные размеры, формы и материалы дефектов.
Интеграции, предоставляющие готовые наборы данных, облегчают такие задачи, как промышленный контроль качества, а благодаря возможностям обнаружения в реальном времени YOLO11 производители могут контролировать производственные линии, мгновенно выявлять дефекты и повышать эффективность.
Рис. 4. Пример использования Ultralytics YOLO11 для обнаружения и подсчета выпускаемых банок.
Помимо производства, интеграция, связанная с наборами данных, может использоваться во многих других отраслях. Соединив скорость и точность YOLO11 с легкодоступными наборами данных, предприятия могут быстро разрабатывать и внедрять решения, отвечающие их специфическим потребностям. Например, в здравоохранении - интеграция наборов данных может помочь разработать решения для анализа медицинских изображений с целью обнаружения аномалий, таких как опухоли. Аналогично, в автономном вождении такие интеграции могут помочь в идентификации транспортных средств, пешеходов и дорожных знаков для повышения безопасности.
Основные выводы
Поиск подходящего набора данных часто является одной из самых трудоемких частей создания модели компьютерного зрения. Однако интеграция с Roboflow упрощает поиск наилучших наборов данных для индивидуального обучения моделей Ultralytics YOLO, даже если вы новичок в компьютерном зрении.
Благодаря доступу к обширным наборам данных для задач компьютерного зрения, таких как обнаружение объектов, классификация изображений или сегментация экземпляров, Roboflow Universe избавляет вас от лишних хлопот, связанных с поиском данных. Он помогает быстро приступить к работе и сосредоточиться на построении модели, а не тратить время на сбор и организацию данных. Такой оптимизированный подход позволяет разработчикам более эффективно создавать прототипы, проводить итерации и разрабатывать решения для компьютерного зрения.