Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Настройки cookie
Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Узнайте, как интеграция Roboflow может упростить пользовательское обучение Ultralytics YOLO11, сделав общедоступные наборы данных компьютерного зрения легкодоступными.
Обучение модели компьютерного зрения, такой как Ultralytics YOLO11, обычно включает в себя сбор изображений для вашего набора данных, их аннотирование, подготовку данных и точную настройку модели в соответствии с вашими конкретными требованиями. Хотя пакет Ultralytics Python делает эти шаги простыми и удобными, разработка Vision AI по-прежнему может занимать много времени.
Это становится особенно актуальным, когда вы работаете в сжатые сроки или разрабатываете прототип. В этих ситуациях наличие инструментов или интеграций, которые упрощают части процесса, например, оптимизация подготовки набора данных или автоматизация повторяющихся задач, может иметь большое значение. Сокращая необходимое время и усилия, эти решения помогают вам сосредоточиться на создании и совершенствовании вашей модели. Именно это и предлагает интеграция Roboflow.
Интеграция с Roboflow позволяет легко получать доступ к наборам данных из Roboflow Universe, большой библиотеки наборов данных компьютерного зрения с открытым исходным кодом. Вместо того чтобы тратить часы на сбор и организацию данных, вы можете быстро найти и использовать существующие наборы данных, чтобы ускорить процесс обучения YOLO11. Эта интеграция значительно ускоряет и упрощает эксперименты и итерации при разработке модели компьютерного зрения.
В этой статье мы углубимся в то, как вы можете использовать интеграцию Roboflow для более быстрой разработки моделей. Давайте начнем!
Что такое Roboflow Universe?
Roboflow Universe — это платформа, поддерживаемая компанией Roboflow, которая занимается упрощением разработки систем компьютерного зрения. Она состоит из более чем 350 миллионов изображений, 500 000 наборов данных и 100 000 точно настроенных моделей для таких задач, как обнаружение объектов, классификация изображений и сегментация. Благодаря вкладу разработчиков и исследователей со всего мира, Roboflow Universe является центром сотрудничества для всех, кто хочет быстро начать или улучшить свои проекты в области компьютерного зрения.
Рис. 1. Примеры наборов данных для обнаружения объектов в Roboflow Universe.
Roboflow Universe включает в себя следующие ключевые функции:
Инструменты для изучения наборов данных: Изучайте, фильтруйте и визуализируйте наборы данных, чтобы быстро найти ресурсы, соответствующие требованиям вашего проекта.
Параметры экспорта: Экспортируйте данные в таких форматах, как COCO, YOLO, TFRecord, CSV и других, в соответствии с вашим рабочим процессом.
Аналитика набора данных: Получите представление о различных наборах данных с помощью инструментов аналитики, которые предоставляют визуализации распределений меток, дисбаланса классов и качества набора данных.
Отслеживание версий: Просматривайте и получайте доступ к различным версиям наборов данных, загруженных участниками, что позволяет отслеживать обновления, сравнивать изменения и выбирать версию, которая лучше всего соответствует потребностям вашего проекта.
Интеграция с Roboflow помогает вам найти нужные данные
Поиск подходящего набора данных часто является одной из самых сложных задач при создании модели компьютерного зрения. Создание набора данных обычно включает в себя сбор большого количества изображений, обеспечение их соответствия вашей задаче и последующую точную маркировку.
Этот процесс может занять много времени и ресурсов, особенно если вы экспериментируете с различными подходами в течение короткого периода. Даже поиск существующих наборов данных может быть затруднен, поскольку они часто разбросаны по платформам, не имеют надлежащей документации или не содержат необходимых аннотаций.
Например, если вы создаете приложение компьютерного зрения для обнаружения сорняков на сельскохозяйственных полях, вы можете захотеть протестировать различные подходы Vision AI, такие как обнаружение объектов и сегментация экземпляров. Это позволяет вам экспериментировать и выяснять, какой метод работает лучше всего, прежде чем тратить время и усилия на сбор и маркировку собственного набора данных.
Рис. 2. Обнаружение автомобильных деталей с использованием YOLO11.
Используя интеграцию Roboflow, вы можете просматривать различные наборы данных, связанные с сельским хозяйством, в том числе те, которые посвящены обнаружению сорняков, здоровью сельскохозяйственных культур или мониторингу полей. Эти готовые к использованию наборы данных позволяют вам опробовать различные методы и усовершенствовать свою модель без предварительных усилий по созданию собственных данных.
Как работает интеграция с Roboflow
Теперь, когда мы обсудили, как можно использовать интеграцию Roboflow для поиска подходящих наборов данных, давайте посмотрим, как она вписывается в ваш рабочий процесс. После того, как вы выбрали набор данных из Roboflow Universe, вы можете экспортировать или загрузить его в формате YOLO11. После экспорта набора данных вы можете использовать его для пользовательской тренировки YOLO11 с помощью пакета Ultralytics Python.
Пока вы скачиваете свой набор данных, вы можете заметить, что Roboflow Universe также поддерживает другие форматы для обучения различных моделей. Так почему же вам стоит выбрать пользовательское обучение Ultralytics YOLO11?
YOLO11 — это последняя версия моделей Ultralytics YOLO, созданная для обеспечения более быстрого и точного обнаружения объектов. Она использует на 22% меньше параметров (внутренние значения, которые модель корректирует во время обучения для прогнозирования), чем YOLOv8m, но при этом достигает более высокой средней точности (mAP) на наборе данных COCO. Этот баланс скорости и точности делает YOLO11 универсальным выбором для широкого спектра приложений компьютерного зрения, особенно при пользовательской подготовке моделей для конкретных задач.
Подача данных: Модель YOLO11 обрабатывает ваш набор данных, обучаясь обнаруживать и классифицировать объекты на изображениях и их аннотациях.
Прогнозирование и обратная связь: Модель делает прогнозы об объектах на изображениях и сравнивает их с правильными ответами, представленными в наборе данных.
Отслеживание производительности: Для оценки прогресса отслеживаются такие метрики, как точность (правильные обнаружения), полнота (пропущенные обнаружения) и потери (ошибки прогнозирования).
Итеративное обучение: Модель корректирует свои параметры в течение нескольких раундов (эпох), чтобы повысить точность обнаружения и минимизировать ошибки.
Финальный вывод модели: После обучения оптимизированная модель сохраняется и готова к развертыванию.
Другие интеграции, ориентированные на разработку систем компьютерного зрения.
Изучая интеграцию Roboflow, вы заметите другие интеграции, упомянутые в документации Ultralytics. Мы поддерживаем множество интеграций, связанных с различными этапами разработки компьютерного зрения.
Это сделано для того, чтобы предоставить нашему сообществу ряд опций, чтобы вы могли выбрать то, что лучше всего подходит для вашего конкретного рабочего процесса.
В дополнение к наборам данных, другие интеграции, поддерживаемые Ultralytics, ориентированы на различные части процесса компьютерного зрения, такие как обучение, развертывание и оптимизация. Вот несколько примеров других поддерживаемых нами интеграций:
Интеграции для обучения: Интеграции, такие как Amazon SageMaker и Paperspace Gradient, упрощают процессы обучения, предлагая облачные платформы для эффективной разработки и тестирования моделей.
Интеграции для отслеживания рабочих процессов и экспериментов: ClearML, MLFlow и Weights & Biases (W&B) помогают автоматизировать рабочие процессы, отслеживать эксперименты и улучшать совместную работу, упрощая управление проектами машинного обучения.
Интеграция оптимизации и развертывания: CoreML, ONNX и OpenVINO обеспечивают оптимизированное развертывание на различных устройствах и платформах, обеспечивая эффективную работу на таких платформах, как оборудование Apple и процессоры Intel.
Интеграции для мониторинга и визуализации: TensorBoard и Weights & Biases предоставляют инструменты для визуализации прогресса обучения и мониторинга производительности, предоставляя подробную информацию для улучшения моделей.
Приложения YOLO11 и роль интеграций
Интеграции, поддерживающие разработку компьютерного зрения, в сочетании с надежными возможностями YOLO11, упрощают решение реальных задач. Рассмотрите такие инновации, как компьютерное зрение в производстве, где Vision AI используется для обнаружения дефектов на производственной линии, таких как царапины на металлических деталях или отсутствующие компоненты. Сбор правильных данных для таких задач часто может быть медленным и сложным, требующим доступа к специализированным средам.
Обычно это включает в себя установку камер или датчиков вдоль производственных линий для захвата изображений продукции. Эти изображения необходимо делать в больших объемах, часто при постоянном освещении и углах, чтобы обеспечить четкость и однородность.
После захвата изображения должны быть тщательно аннотированы с точными метками для каждого типа дефекта, такого как царапины, вмятины или отсутствующие компоненты. Этот процесс требует значительного времени и ресурсов, а также опыта, чтобы убедиться, что набор данных точно отражает реальную изменчивость. Необходимо учитывать такие факторы, как различные размеры, формы и материалы дефектов, чтобы создать надежный и достоверный набор данных.
Интеграции, предоставляющие готовые наборы данных, облегчают такие задачи, как контроль качества в промышленности, а благодаря возможностям обнаружения в реальном времени YOLO11 производители могут отслеживать производственные линии, мгновенно выявлять дефекты и повышать эффективность.
Рис. 4. Пример использования Ultralytics YOLO11 для обнаружения и подсчета производимых банок.
Помимо производства, интеграции, связанные с наборами данных, могут использоваться во многих других отраслях. Объединив скорость и точность YOLO11 с легкодоступными наборами данных, предприятия могут быстро разрабатывать и развертывать решения, адаптированные к их конкретным потребностям. Возьмем, к примеру, здравоохранение — интеграция наборов данных может помочь в разработке решений для анализа медицинских изображений с целью выявления аномалий, таких как опухоли. Аналогичным образом, в автономном вождении такие интеграции могут помочь в идентификации транспортных средств, пешеходов и дорожных знаков для повышения безопасности.
Основные выводы
Поиск подходящего набора данных часто является одной из самых трудоемких частей создания модели компьютерного зрения. Однако интеграция Roboflow упрощает поиск лучшего набора данных для пользовательской тренировки ваших моделей Ultralytics YOLO, даже если вы новичок в компьютерном зрении.
Благодаря доступу к обширной коллекции наборов данных для задач компьютерного зрения, таких как обнаружение объектов, классификация изображений или сегментация экземпляров, Roboflow Universe избавляет от хлопот, связанных с процессом обнаружения данных. Это помогает вам быстро начать работу и сосредоточиться на создании своей модели, а не тратить время на сбор и организацию данных. Такой оптимизированный подход позволяет разработчикам более эффективно создавать прототипы, итерации и разрабатывать решения в области компьютерного зрения.