Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024

Как использовать Ultralytics YOLO11 для классификации изображений

Абирами Вина

4 мин чтения

11 ноября 2024 г.

Узнайте, как новая модель Ultralytics YOLO11 улучшает классификацию изображений, обеспечивая более высокую точность для задач в сельском хозяйстве, розничной торговле и мониторинге дикой природы.

Предположим, робот смотрит на двух кошек, черную и белую, и ему нужно определить, какая из них какая. Для этого он может использовать классификацию изображений — задачу компьютерного зрения, которая помогает идентифицировать и классифицировать объекты или сцены на изображении. Фактически, благодаря последним достижениям в области искусственного интеллекта (ИИ), классификация изображений может использоваться в самых разных приложениях, от мониторинга животных до производства и сельского хозяйства с обнаружением болезней сельскохозяйственных культур.

Одним из последних достижений в области классификации изображений является модель Ultralytics YOLO11. Запущенная на ежегодном гибридном мероприятии Ultralytics, YOLO Vision 2024 (YV24), YOLO11 предназначена для решения широкого спектра задач Vision AI, включая классификацию изображений, с легкостью и точностью.

В этой статье мы рассмотрим основы классификации изображений, обсудим реальные примеры применения и покажем, как можно использовать YOLO11 для классификации изображений с помощью пакета Ultralytics Python. Мы также рассмотрим, как можно опробовать возможности YOLO11 на Ultralytics HUB за несколько простых шагов. Давайте начнем!

__wf_reserved_inherit
Рис. 1. Пример использования Ultralytics YOLO11 для классификации персидского кота.

Что такое классификация изображений?

Классификация изображений работает путем присвоения метки или тега изображению на основе шаблонов, полученных из ранее помеченных изображений. Тщательно анализируя пиксели изображения, модель компьютерного зрения может найти наилучшее соответствие для изображения. Надежные модели, такие как YOLO11, могут беспрепятственно обрабатывать этот процесс. Архитектура модели YOLO11 позволяет обрабатывать изображения или видеокадры почти мгновенно, что делает ее идеальной для приложений, требующих быстрой и точной классификации изображений.

Чтобы по-настоящему понять масштабы классификации изображений, полезно отличать ее от других задач, таких как обнаружение объектов. В то время как классификация изображений присваивает метку всему изображению, обнаружение объектов идентифицирует и локализует каждый объект внутри изображения. 

__wf_reserved_inherit
Рис. 2. Сравнение классификации изображений, обнаружения объектов и сегментации изображений.

Рассмотрим изображение жирафа. В классификации изображений модель может пометить все изображение просто как жирафа на основе его общего содержания. Однако при обнаружении объектов модель не останавливается на идентификации жирафа; она также помещает ограничивающую рамку вокруг жирафа, точно определяя его местоположение на изображении.

Теперь представьте себе жирафа, стоящего возле дерева в саванне с другими животными. Модель классификации изображений может пометить всю сцену как саванну или просто дикую природу. Однако при обнаружении объектов модель идентифицирует каждый элемент по отдельности, распознавая жирафа, дерево и других животных, каждый со своими ограничивающими рамками.

Приложения классификации изображений YOLO11

Точность и производительность модели Ultralytics YOLO11 для классификации изображений делают ее полезной в самых разных отраслях. Давайте рассмотрим некоторые из ключевых применений YOLO11 в классификации изображений.

Классификация изображений YOLO11 в сельском хозяйстве

Классификация изображений может помочь оптимизировать многие функции в сельском хозяйстве и фермерской отрасли. В частности, используя модели классификации изображений, такие как YOLO11, фермеры могут постоянно следить за здоровьем своих культур, выявлять серьезные заболевания и идентифицировать любые заражения вредителями с высокой точностью. 

Вот как это работает:

  • Захват изображений: Устройства Интернета вещей (IoT), такие как камеры и дроны, могут быть развернуты для захвата изображений сельскохозяйственных культур в режиме реального времени с различных углов и местоположений по всему полю.
  • Обработка: В зависимости от доступных ресурсов и подключения изображения могут обрабатываться на месте с помощью периферийных вычислений или загружаться в облако для более интенсивного анализа.
  • Классификация изображений с помощью YOLO11: Модель YOLO11 может анализировать эти изображения для классификации различных состояний сельскохозяйственных культур. Общие классы могут включать здоровые, больные, зараженные вредителями или испытывающие недостаток питательных веществ, что помогает выявить конкретные проблемы, затрагивающие различные участки поля.
  • Генерация аналитической информации: На основе классификаций YOLO11 предоставляет аналитическую информацию о показателях здоровья сельскохозяйственных культур, помогая фермерам обнаруживать ранние признаки заболеваний, выявлять очаги вредителей или обнаруживать дефицит питательных веществ.
  • Принятие обоснованных решений: Благодаря этим сведениям фермеры могут принимать целенаправленные решения об орошении, внесении удобрений и борьбе с вредителями, применяя ресурсы только там, где они больше всего необходимы.
__wf_reserved_inherit
Рис. 3. Пример различных классов листьев: от здоровых до зараженных.

Классификация изображений YOLO11 в розничной торговле

Классификация изображений может значительно улучшить опыт розничной торговли, делая его более персонализированным и удобным для пользователя. Ритейлеры могут использовать специально обученные модели компьютерного зрения для распознавания продуктов в своем инвентаре и интегрировать эту возможность в свои мобильные приложения или веб-сайты. Затем клиенты могут искать продукты, просто загрузив фотографию, что делает покупки быстрее и удобнее.

После того как клиент загружает изображение в систему визуального поиска, происходит несколько вещей за кулисами, прежде чем появятся результаты поиска. 

Во-первых, обнаружение объектов можно использовать для выделения основных элементов на изображении, например, для идентификации предмета одежды или мебели и отделения его от фона. Далее, классификация изображений может быть использована для дальнейшей категоризации каждого элемента, распознавая, является ли это куртка, рубашка, диван или стол. 

Имея эту информацию, система может выводить аналогичные продукты, доступные для покупки, что особенно полезно для поиска уникальных или модных товаров, которые трудно описать одними словами. Эта же технология может также помочь оптимизировать другие розничные задачи, такие как управление запасами, путем автоматического распознавания и классификации товаров.

__wf_reserved_inherit
Рис. 4. Платформа визуального поиска на основе классификации изображений в действии.

Мониторинг дикой природы с помощью классификации изображений YOLO11

Традиционно мониторинг диких животных — это утомительная задача, требующая, чтобы множество людей вручную сортировали и анализировали тысячи фотографий. С помощью режимов компьютерного зрения, таких как YOLO11, исследователи могут автоматически отслеживать животных с большей скоростью. Камеры можно размещать в естественной среде обитания для съемки фотографий. Затем модель Vision AI можно использовать для анализа этих фотографий и классификации животных на них (если таковые имеются). Такая система может помочь исследователям изучать и отслеживать популяции животных, их модели миграции и т. д.

Еще один способ, которым AI и модели компьютерного зрения, такие как YOLO11, могут помочь в этой области, — это оптимизация процесса классификации исчезающих видов. Определяя потенциальные виды или категории пород, к которым может принадлежать животное, эти модели могут предоставлять важные данные для исследователей. Например, Университет Тасмании (UTAS) разработал систему на основе классификации изображений для мониторинга различных видов тасманийской дикой природы. Прогнозы моделей могут затем помочь ученым и исследователям следить за активностью и поведением животных, что может сигнализировать об угрозах, таких как браконьерство или утрата среды обитания

__wf_reserved_inherit
Рис. 5. YOLO11 предсказывает возможные породы, к которым может принадлежать собака.

Пробуем классификацию изображений с помощью модели YOLO11

Теперь, когда мы обсудили, что такое классификация изображений, и рассмотрели некоторые из ее применений, давайте посмотрим, как вы можете опробовать классификацию изображений с помощью новой модели YOLO11. Есть два простых способа начать: с помощью пакета Ultralytics Python или через Ultralytics HUB. Мы рассмотрим оба варианта.

Запуск инференсов с использованием YOLO11

Чтобы начать работу с пакетом Ultralytics Python, просто установите его с помощью pip, conda или Docker. Если у вас возникнут какие-либо проблемы, ознакомьтесь с нашим руководством по распространенным проблемам для получения полезных советов по устранению неполадок.

После установки пакета вы можете использовать следующий код для загрузки варианта модели классификации изображений YOLO11 и выполнения инференса на изображении. Выполнение инференса означает использование обученной модели для прогнозирования на новых, ранее не виденных данных. Вы можете попробовать это с изображением по вашему выбору!

__wf_reserved_inherit
Рис. 6. Запуск инференсов с использованием модели YOLO11.

Обучение пользовательской модели классификации YOLO11

Вы также можете использовать тот же пакет Python для обучения пользовательской модели классификации YOLO11. Индивидуальное обучение позволяет точно настроить модель YOLO11 для ваших конкретных потребностей. Например, если вы разрабатываете приложение для классификации различных пород кошек, вы можете обучить пользовательскую модель YOLO11 специально для этой цели.

Приведенный ниже код показывает, как загрузить и обучить модель классификации изображений YOLO11. Он позволяет передавать предварительно обученные веса, используя знания из существующей модели для повышения производительности вашей собственной модели. Вы можете указать набор данных, например, набор данных "fashion-mnist", который представляет собой хорошо известный набор изображений предметов одежды в оттенках серого (рубашки, брюки, обувь и т. д.). Обучение модели на этом наборе данных учит ее распознавать различные категории одежды. Вы можете заменить "fashion-mnist" любым набором данных, который соответствует вашему проекту, например, породами кошек или типами растений.

__wf_reserved_inherit
Рис. 7. Пользовательская тренировка модели YOLO11 для классификации изображений.

Попробуйте YOLO11 на Ultralytics HUB

Несмотря на то, что использовать пакет Ultralytics довольно просто, требуются определенные знания Python. Если вы ищете более подходящий вариант для начинающих, вы можете использовать Ultralytics HUB — платформу, разработанную для упрощения и обеспечения доступности обучения и развертывания различных моделей YOLO. Для начала вам потребуется создать учетную запись.

После входа в систему перейдите в раздел «Модели» и выберите модель YOLO11 для классификации изображений. Вы увидите ряд доступных размеров моделей: nano, small, medium, large и extra-large. После выбора модели вы можете загрузить изображение в разделе «Предварительный просмотр», где прогнозы появятся в левой части страницы после обработки изображения.

__wf_reserved_inherit
Рис. 8. Использование Ultralytics HUB для запуска инференса.

Основные выводы

YOLO11 предлагает мощные возможности классификации изображений, которые открывают новые возможности в различных отраслях. От улучшения мониторинга урожая в сельском хозяйстве и улучшения поиска продуктов в розничной торговле до поддержки охраны дикой природы, скорость и точность YOLO11 делают ее идеальной для различных приложений. Благодаря возможностям пользовательского обучения через пакет Ultralytics Python или удобной настройке без кода в Ultralytics HUB пользователи могут легко интегрировать YOLO11 в свои рабочие процессы. Поскольку все больше отраслей внедряют решения на основе ИИ, YOLO11 предлагает гибкий и высокопроизводительный инструмент, который поддерживает инновации и практические достижения.

Чтобы узнать больше, посетите наш репозиторий GitHub и присоединяйтесь к нашему сообществу. Изучите приложения ИИ в автомобилях с автоматическим управлением и здравоохранении на страницах наших решений. 🚀

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно
Ссылка скопирована в буфер обмена