Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Как использовать Ultralytics YOLO11 для классификации изображений

Абирами Вина

4 мин чтения

11 ноября 2024 г.

Узнайте, как новая модель Ultralytics YOLO11 улучшает классификацию изображений, обеспечивая более высокую точность при решении задач в сельском хозяйстве, розничной торговле и мониторинге дикой природы.

Предположим, робот смотрит на двух кошек, черную и белую, и ему нужно определить, какая из них какая. Для этого он может использовать классификацию изображений — задачу компьютерного зрения, которая помогает идентифицировать и классифицировать объекты или сцены на изображении. Фактически, благодаря последним достижениям в области искусственного интеллекта (ИИ), классификация изображений может использоваться в самых разных приложениях, от мониторинга животных до производства и сельского хозяйства с обнаружением болезней сельскохозяйственных культур.

Одним из последних достижений в области классификации изображений является модельUltralytics YOLO11 . Она была представлена на ежегодном гибридном мероприятииUltralytics YOLO Vision 2024 (YV24), YOLO11 предназначена для решения широкого спектра задач искусственного интеллекта, включая классификацию изображений, с легкостью и точностью.

В этой статье мы рассмотрим основы классификации изображений, обсудим реальные приложения и покажем, как можно использовать YOLO11 для классификации изображений с помощью пакетаUltralytics Python . Мы также рассмотрим, как вы можете опробовать возможности YOLO11 на Ultralytics HUB в несколько простых шагов. Давайте начнем!

__wf_reserved_inherit
Рис. 1. Пример использования Ultralytics YOLO11 для classify персидской кошки.

Что такое классификация изображений?

Классификация изображений осуществляется путем присвоения изображению метки или тега на основе шаблонов, полученных из ранее помеченных изображений. Тщательно анализируя пиксели изображения, модель компьютерного зрения может найти наилучшее соответствие для него. Надежные модели, такие как YOLO11 справляются с этим процессом без проблем. Архитектура модели YOLO11позволяет обрабатывать изображения или видеокадры практически мгновенно, что делает ее идеальным решением для приложений, требующих быстрой и точной классификации изображений.

Чтобы по-настоящему понять масштабы классификации изображений, полезно отличать ее от других задач, таких как обнаружение объектов. В то время как классификация изображений присваивает метку всему изображению, обнаружение объектов идентифицирует и локализует каждый объект внутри изображения. 

__wf_reserved_inherit
Рис. 2. Сравнение классификации изображений, обнаружения объектов и сегментации изображений.

Рассмотрим изображение жирафа. В классификации изображений модель может пометить все изображение просто как жирафа на основе его общего содержания. Однако при обнаружении объектов модель не останавливается на идентификации жирафа; она также помещает ограничивающую рамку вокруг жирафа, точно определяя его местоположение на изображении.

Теперь представьте себе жирафа, стоящего возле дерева в саванне с другими животными. Модель классификации изображений может пометить всю сцену как саванну или просто дикую природу. Однако при обнаружении объектов модель идентифицирует каждый элемент по отдельности, распознавая жирафа, дерево и других животных, каждый со своими ограничивающими рамками.

Приложения для классификации изображений YOLO11

Точность и производительность модели Ultralytics YOLO11 для классификации изображений делает ее полезной в самых разных отраслях. Давайте рассмотрим некоторые из ключевых применений YOLO11 в классификации изображений.

Классификация изображений YOLO11 в сельском хозяйстве

Классификация изображений может помочь оптимизировать многие функции в сельском хозяйстве и фермерской отрасли. В частности, используя такие модели классификации изображений, как YOLO11, фермеры могут постоянно следить за состоянием своих посевов, detect серьезные заболевания и с высокой точностью определять наличие вредителей

Вот как это работает:

  • Захват изображений: Устройства Интернета вещей (IoT), такие как камеры и дроны, могут быть развернуты для захвата изображений сельскохозяйственных культур в режиме реального времени с различных углов и местоположений по всему полю.
  • Обработка: В зависимости от доступных ресурсов и подключения изображения могут обрабатываться на месте с помощью периферийных вычислений или загружаться в облако для более интенсивного анализа.
  • Классификация изображений с помощью YOLO11: модель YOLO11 может анализировать эти изображения, чтобы classify различные состояния сельскохозяйственных культур. Общие классы могут включать здоровые, больные, пораженные вредителями или испытывающие дефицит питательных веществ, что помогает определить конкретные проблемы, затрагивающие различные участки поля.
  • Генерирование информации: Основываясь на классификации, YOLO11 предоставляет информацию о показателях здоровья сельскохозяйственных культур, помогая фермерам detect ранние признаки заболеваний, выявить очаги вредителей или обнаружить дефицит питательных веществ.
  • Принятие обоснованных решений: Благодаря этим сведениям фермеры могут принимать целенаправленные решения об орошении, внесении удобрений и борьбе с вредителями, применяя ресурсы только там, где они больше всего необходимы.
__wf_reserved_inherit
Рис. 3. Пример различных классов листьев: от здоровых до зараженных.

YOLO11 классификация изображений в розничной торговле

Классификация изображений может значительно улучшить опыт розничной торговли, делая его более персонализированным и удобным для пользователя. Ритейлеры могут использовать специально обученные модели компьютерного зрения для распознавания продуктов в своем инвентаре и интегрировать эту возможность в свои мобильные приложения или веб-сайты. Затем клиенты могут искать продукты, просто загрузив фотографию, что делает покупки быстрее и удобнее.

После того как клиент загружает изображение в систему визуального поиска, происходит несколько вещей за кулисами, прежде чем появятся результаты поиска. 

Во-первых, обнаружение объектов можно использовать для выделения основных элементов на изображении, например, для идентификации предмета одежды или мебели и отделения его от фона. Далее, классификация изображений может быть использована для дальнейшей категоризации каждого элемента, распознавая, является ли это куртка, рубашка, диван или стол. 

Имея эту информацию, система может выводить аналогичные продукты, доступные для покупки, что особенно полезно для поиска уникальных или модных товаров, которые трудно описать одними словами. Эта же технология может также помочь оптимизировать другие розничные задачи, такие как управление запасами, путем автоматического распознавания и классификации товаров.

__wf_reserved_inherit
Рис. 4. Платформа визуального поиска на основе классификации изображений в действии.

Мониторинг дикой природы с помощью классификации изображений YOLO11

Традиционно наблюдение за животными в дикой природе - утомительная задача, требующая от многих людей ручной сортировки и анализа тысяч фотографий. С помощью таких режимов компьютерного зрения, как YOLO11, исследователи могут автоматически следить за животными с большей скоростью. Камеры можно разместить в естественной среде обитания и делать снимки. Затем модель искусственного зрения может быть использована для анализа этих фотографий и classify животных на них (если таковые имеются). Такая система может помочь исследователям изучать и track популяции животных, их миграцию и т. д.

Еще один способ, которым модели искусственного интеллекта и компьютерного зрения, подобные YOLO11 , могут помочь в этой области, - это упрощение процесса классификации исчезающих видов. Определяя потенциальные виды или категории пород, к которым может принадлежать животное, эти модели могут предоставить важные данные для исследователей. Например, Университет Тасмании (UTAS) разработал систему классификации изображений для мониторинга различных видов тасманийских диких животных. Прогнозы, полученные с помощью моделей, помогают ученым и исследователям следить за активностью и поведением животных, которые могут сигнализировать о таких угрозах, как браконьерство или потеря среды обитания

__wf_reserved_inherit
Рис. 5. YOLO11 предсказывает возможные породы, к которым может принадлежать собака.

Пробуем классификацию изображений с помощью модели YOLO11

Теперь, когда мы обсудили, что такое классификация изображений, и рассмотрели некоторые области ее применения. Давайте посмотрим, как можно опробовать классификацию изображений с помощью новой модели YOLO11 . Есть два простых способа начать: использовать пакетUltralytics Python или Ultralytics HUB. Мы рассмотрим оба варианта.

Выполнение выводов с помощью YOLO11

Чтобы начать работу с пакетом Ultralytics Python , просто установите его с помощью pip, conda или Docker. Если у вас возникнут проблемы, ознакомьтесь с нашим руководством по общим проблемам, чтобы получить полезные советы по устранению неполадок.

После установки пакета вы можете использовать следующий код, чтобы загрузить вариант модели классификации изображений YOLO11 и выполнить вывод на изображении. Выполнить вывод - значит использовать обученную модель для предсказаний на новых, невидимых данных. Вы можете попробовать это на выбранном вами изображении!

__wf_reserved_inherit
Рис. 6. Выполнение выводов с использованием модели YOLO11 .

Обучение пользовательской модели классификации YOLO11

Вы также можете использовать тот же пакет Python для обучения пользовательской модели классификации YOLO11 . Пользовательское обучение позволяет точно настроить модель YOLO11 под ваши конкретные нужды. Например, если вы разрабатываете приложение для classify различных пород кошек, вы можете обучить модель YOLO11 специально для этой цели.

Приведенный ниже код показывает, как загрузить и обучить модель классификации изображений YOLO11 . Он позволяет передавать предварительно обученные веса, используя знания из существующей модели для повышения производительности вашей собственной модели. Вы можете указать набор данных, например, набор данных "fashion-mnist", который представляет собой хорошо известный набор полутоновых изображений предметов одежды (рубашки, брюки, обувь и т. д.). Обучение модели на этом наборе данных научит ее распознавать различные категории одежды. Вы можете заменить "fashion-mnist" на любой набор данных, подходящий для вашего проекта, например породы кошек или виды растений.

__wf_reserved_inherit
Рис. 7. Индивидуальное обучение модели YOLO11 для классификации изображений.

Испытайте YOLO11 на Ultralytics HUB

Хотя работа с пакетом Ultralytics проста, она требует некоторых знаний Python. Если вы ищете более удобный для новичков вариант, вы можете воспользоваться Ultralytics HUB - платформой, разработанной для простого и доступного обучения и развертывания различных моделей YOLO . Чтобы начать работу, вам нужно будет создать учетную запись.

Войдя в систему, перейдите в раздел "Модели" и выберите модель YOLO11 для классификации изображений. Вы увидите ряд доступных размеров модели: нано, малый, средний, большой и сверхбольшой. После выбора модели вы можете загрузить изображение в раздел "Предварительный просмотр", где прогнозы появятся в левой части страницы после обработки изображения.

__wf_reserved_inherit
Рис. 8. Использование Ultralytics HUB для выполнения умозаключений.

Основные выводы

YOLO11 предлагает мощные возможности классификации изображений, которые открывают новые возможности в различных отраслях. Скорость и точность YOLO11делают его идеальным решением для самых разных задач - от улучшения мониторинга урожая в сельском хозяйстве и поиска товаров в розничной торговле до поддержки охраны дикой природы. Благодаря возможности индивидуального обучения с помощью пакета Ultralytics Python или удобной настройки без кода на Ultralytics HUB, пользователи могут легко внедрить YOLO11 в свои рабочие процессы. По мере того как все больше отраслей промышленности внедряют решения на основе искусственного интеллекта, YOLO11 предлагает гибкий, высокопроизводительный инструмент, который поддерживает инновации и практические достижения.

Чтобы узнать больше, посетите наш репозиторий GitHub и присоединяйтесь к нашему сообществу. Изучите приложения ИИ в автомобилях с автоматическим управлением и здравоохранении на страницах наших решений. 🚀

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно