Специальное обучение Ultralytics YOLO11 с наборами данных компьютерного зрения
Узнай, как интеграция с Roboflow может упростить специальное обучение Ultralytics YOLO11, делая наборы данных компьютерного зрения с открытым исходным кодом легко доступными.

Обучение модели компьютерного зрения, такой как Ultralytics YOLO11, обычно включает сбор изображений для твоего набора данных, их аннотирование, подготовку данных и дообучение модели для соответствия твоим специфическим требованиям. Хотя пакет Ultralytics для Python делает эти шаги простыми и удобными, разработка ИИ для зрения все равно может отнимать много времени.
Это становится особенно актуально, когда ты работаешь в условиях сжатых сроков или разрабатываешь прототип. В таких ситуациях наличие инструментов или интеграций, которые упрощают части процесса — например, оптимизация подготовки данных или автоматизация повторяющихся задач — может иметь большое значение. Сокращая время и усилия, эти решения помогают тебе сосредоточиться на создании и уточнении твоей модели. Именно это и предлагает интеграция с Roboflow.
Интеграция с Roboflow позволяет тебе легко получать доступ к наборам данных из Roboflow Universe, большой библиотеки наборов данных компьютерного зрения. Вместо того чтобы часами собирать и организовывать данные, ты можешь быстро находить и использовать существующие наборы данных, чтобы ускорить процесс обучения YOLO11. Эта интеграция значительно ускоряет и упрощает эксперименты и итерации при разработке твоей модели компьютерного зрения.
В этой статье мы углубимся в то, как ты можешь использовать интеграцию с Roboflow для более быстрой разработки моделей. Давай начнем!
Link to this sectionЧто такое Roboflow Universe?#
Roboflow Universe — это платформа, поддерживаемая Roboflow, компанией, сосредоточенной на упрощении разработки компьютерного зрения. Она состоит из более чем 350 миллионов изображений, 500 000 наборов данных и 100 000 дообученных моделей для таких задач, как обнаружение объектов, классификация изображений и сегментация. Благодаря вкладу разработчиков и исследователей со всего мира, Roboflow Universe является центром совместной работы для всех, кто хочет быстро начать или улучшить свои проекты в области компьютерного зрения.

Рис. 1. Примеры наборов данных для обнаружения объектов на Roboflow Universe.
Roboflow Universe включает следующие ключевые функции:
- Инструменты для изучения наборов данных: исследуй, фильтруй и визуализируй наборы данных, чтобы быстро находить ресурсы, соответствующие требованиям твоего проекта.
- Опции экспорта: экспортируй данные в таких форматах, как COCO, YOLO, TFRecord, CSV и других, чтобы они подходили для твоего рабочего процесса.
- Аналитика наборов данных: получай представление о различных наборах данных с помощью инструментов аналитики, которые предоставляют визуализацию распределения меток, дисбаланса классов и качества данных.
- Отслеживание версий: просматривай и получай доступ к различным версиям наборов данных, загруженных участниками, что позволяет тебе отслеживать обновления, сравнивать изменения и выбирать версию, которая лучше всего соответствует потребностям твоего проекта.
Link to this sectionИнтеграция с Roboflow помогает тебе найти подходящие данные#
Поиск подходящего набора данных часто является одной из самых сложных частей создания модели компьютерного зрения. Создание набора данных обычно включает сбор огромного количества изображений, проверку их актуальности для твоей задачи, а затем их точную маркировку.
Этот процесс может отнимать много времени и ресурсов, особенно если ты экспериментируешь с разными подходами в короткие сроки. Даже поиск уже существующих наборов данных может быть затруднительным, поскольку они часто разбросаны по разным платформам, недостаточно документированы или им не хватает необходимых тебе специфических аннотаций.
Например, если ты создаешь приложение компьютерного зрения для обнаружения сорняков на сельскохозяйственных полях, ты можешь захотеть протестировать разные подходы ИИ для зрения, такие как обнаружение объектов по сравнению с сегментацией экземпляров. Это позволит тебе поэкспериментировать и выяснить, какой метод работает лучше всего, прежде чем тратить время и силы на сбор и маркировку собственного набора данных.

Рис. 2. Обнаружение деталей автомобиля с помощью YOLO11.
Используя интеграцию с Roboflow, ты можешь просматривать множество наборов данных, связанных с сельским хозяйством, включая те, которые сосредоточены на обнаружении сорняков, здоровье сельскохозяйственных культур или мониторинге полей. Эти готовые к использованию наборы данных позволят тебе опробовать различные методы и усовершенствовать свою модель без предварительных затрат на создание собственных данных.
Link to this sectionКак работает интеграция с Roboflow#
Теперь, когда мы обсудили, как ты можешь использовать интеграцию с Roboflow для поиска подходящих наборов данных, давай посмотрим, как это вписывается в твой рабочий процесс. Как только ты выберешь набор данных в Roboflow Universe, ты сможешь экспортировать или загрузить его в формате YOLO11. После того как твой набор данных будет экспортирован, ты сможешь использовать его для пользовательского обучения YOLO11 с помощью пакета Ultralytics Python.
При загрузке набора данных ты можешь заметить, что Roboflow Universe поддерживает и другие форматы для обучения других моделей. Итак, почему тебе стоит выбрать пользовательское обучение Ultralytics YOLO11?
YOLO11 — это последняя версия моделей Ultralytics YOLO, созданная для обеспечения более быстрого и точного обнаружения объектов. Она использует на 22% меньше параметров (внутренних значений, которые модель корректирует во время обучения для составления прогнозов), чем YOLOv8m, но при этом достигает более высокой средней точности (mAP) на наборе данных COCO. Этот баланс скорости и точности делает YOLO11 универсальным выбором для широкого спектра приложений компьютерного зрения, особенно при пользовательском обучении моделей для выполнения специфических задач.
Вот более подробный обзор того, как работает пользовательское обучение YOLO11:
- Подача данных: модель YOLO11 обрабатывает твой набор данных, обучаясь обнаруживать и классифицировать объекты на изображениях и их аннотациях.
- Прогнозирование и обратная связь: модель делает прогнозы относительно объектов на изображениях и сравнивает их с правильными ответами, предоставленными в наборе данных.
- Отслеживание производительности: метрики, такие как точность (правильные обнаружения), полнота (пропущенные обнаружения) и потери (ошибки прогнозирования), отслеживаются для оценки прогресса.
- Итеративное обучение: модель корректирует свои параметры в течение нескольких раундов (эпох) для улучшения точности обнаружения и минимизации ошибок.
- Финальный результат модели: после обучения оптимизированная модель сохраняется и готова к развертыванию.
Link to this sectionДругие интеграции, ориентированные на разработку компьютерного зрения#
Изучая интеграцию с Roboflow, ты заметишь и другие интеграции, упомянутые в документации Ultralytics. Мы поддерживаем множество интеграций, связанных с различными этапами разработки компьютерного зрения.
Это сделано для того, чтобы предоставить нашему сообществу широкий выбор опций, чтобы ты мог выбрать то, что лучше всего подходит для твоего конкретного рабочего процесса.

Рис. 3. Обзор интеграций, поддерживаемых Ultralytics.
В дополнение к наборам данных, другие интеграции, поддерживаемые Ultralytics, сосредоточены на различных частях процесса компьютерного зрения, таких как обучение, развертывание и оптимизация. Вот несколько примеров других интеграций, которые мы поддерживаем:
- Интеграции для обучения: такие интеграции, как Amazon SageMaker и Paperspace Gradient, оптимизируют рабочие процессы обучения, предлагая облачные платформы для эффективной разработки и тестирования моделей.
- Интеграции для отслеживания рабочих процессов и экспериментов: ClearML, MLflow и Weights & Biases (W&B) помогают автоматизировать рабочие процессы, отслеживать эксперименты и улучшать сотрудничество, что упрощает управление проектами машинного обучения.
- Интеграции для оптимизации и развертывания: CoreML, ONNX и OpenVINO обеспечивают оптимизированное развертывание на различных устройствах и фреймворках, гарантируя эффективную производительность на таких платформах, как оборудование Apple и процессоры Intel.
- Интеграции для мониторинга и визуализации: TensorBoard и Weights & Biases предоставляют инструменты для визуализации прогресса обучения и мониторинга производительности, давая подробное представление для улучшения моделей.
Link to this sectionПриложения YOLO11 и роль интеграций#
Интеграции, которые поддерживают разработку компьютерного зрения, в сочетании с надежными возможностями YOLO11, упрощают решение реальных задач. Рассмотри инновации, такие как компьютерное зрение в производстве, где ИИ для зрения используется для обнаружения дефектов на производственной линии — например, царапин на металлических деталях или отсутствующих компонентов. Сбор подходящих данных для таких задач часто может быть медленным и сложным, требующим доступа к специализированным средам.
Обычно это включает установку камер или датчиков вдоль производственных линий для захвата изображений продуктов. Эти изображения должны быть получены в больших объемах, часто при постоянном освещении и углах, чтобы обеспечить четкость и однородность.
После получения изображения должны быть тщательно аннотированы точными метками для каждого типа дефекта, таких как царапины, вмятины или отсутствующие компоненты. Этот процесс требует значительного времени и ресурсов, а также опыта, чтобы убедиться, что набор данных точно отражает изменчивость реального мира. Такие факторы, как разные размеры дефектов, формы и материалы, должны быть учтены для создания надежного и качественного набора данных.
Интеграции, предоставляющие готовые наборы данных, облегчают такие задачи, как промышленный контроль качества, а благодаря способностям YOLO11 к обнаружению в реальном времени производители могут контролировать производственные линии, мгновенно выявлять дефекты и повышать эффективность.

Рис. 4. Пример использования Ultralytics YOLO11 для обнаружения и подсчета производимых банок.
Помимо производства, интеграции, связанные с наборами данных, могут использоваться во многих других отраслях. Объединяя скорость и точность YOLO11 с легкодоступными наборами данных, компании могут быстро разрабатывать и развертывать решения, адаптированные к их конкретным потребностям. Возьмем, к примеру, здравоохранение: интеграции наборов данных могут помочь в разработке решений для анализа медицинских изображений для выявления аномалий, таких как опухоли. Точно так же, в автономном вождении такие интеграции могут помочь с идентификацией транспортных средств, пешеходов и дорожных знаков для повышения безопасности.
Link to this sectionОсновные выводы#
Поиск подходящего набора данных часто является одной из самых трудоемких частей создания модели компьютерного зрения. Однако интеграция с Roboflow упрощает поиск лучшего набора данных для пользовательского обучения твоих моделей Ultralytics YOLO, даже если ты новичок в компьютерном зрении.
Благодаря доступу к огромной коллекции наборов данных для задач компьютерного зрения, таких как обнаружение объектов, классификация изображений или сегментация экземпляров, Roboflow Universe избавляет от хлопот в процессе поиска данных. Это помогает тебе быстро начать работу и сосредоточиться на создании своей модели, а не тратить время на сбор и организацию данных. Такой оптимизированный подход дает разработчикам возможность создавать прототипы, итерировать и развивать решения компьютерного зрения более эффективно.
Чтобы узнать больше, посети наш репозиторий GitHub и пообщайся с нашим сообществом. Изучай инновации в таких областях, как ИИ в беспилотных автомобилях и компьютерное зрение в сельском хозяйстве на наших страницах решений. 🚀






