Откройте для себя классификацию изображений с помощью Ultralytics YOLO: обучайте собственные модели для здравоохранения, сельского хозяйства, розничной торговли и других областей, используя передовые инструменты.
Классификация изображений — это фундаментальная задача в области компьютерного зрения (CV), которая включает в себя присвоение одной конкретной метки всему изображению из предопределенного набора категорий. Основная цель состоит в том, чтобы идентифицировать главный объект изображения и соответствующим образом его классифицировать. Например, модель классификации проанализирует изображение и выдаст метку, такую как «кошка», «собака» или «автомобиль». Эта задача составляет основу для многих более сложных приложений CV и является основным компонентом машинного обучения (ML). Этот процесс основан на алгоритмах, в первую очередь на сверточных нейронных сетях (CNNs), для изучения отличительных признаков из больших помеченных наборов данных.
Модели классификации изображений обучаются с использованием обучения с учителем, где им предоставляется огромное количество изображений, которые уже были вручную помечены с указанием правильного класса. Во время обучения нейронная сеть учится выявлять закономерности, текстуры, формы и цветовые комбинации, связанные с каждой категорией. Это обучение достигается посредством процесса, называемого обратным распространением, который корректирует внутренние параметры модели или веса, чтобы минимизировать разницу между ее прогнозами и фактическими метками.
Современные модели классификации часто используют архитектуры глубокого обучения со многими слоями. Ранние слои могут научиться распознавать простые признаки, такие как края и углы, а более глубокие слои объединяют их для идентификации более сложных структур, таких как глаза, колеса или лица. Последний слой сети обычно использует функцию softmax для получения оценки вероятности для каждого возможного класса. Класс с наивысшей вероятностью выбирается в качестве окончательного прогноза. Ключом к этому процессу является извлечение признаков, где модель автоматически изучает наиболее информативные признаки для задачи классификации.
Классификация изображений используется во многих отраслях для автоматизации и масштабирования задач визуального распознавания. Два основных примера включают:
Классификация изображений тесно связана с другими задачами компьютерного зрения, но имеет distinct (отдельную) цель. Важно отличать ее от:
В заключение, классификация говорит вам, что находится на изображении, обнаружение говорит вам, что и где, а сегментация предоставляет подробную карту каждого пикселя в сцене.
Модели Ultralytics YOLO, известные в первую очередь благодаря детекции объектов, также превосходно справляются с задачами классификации изображений. Современные модели, такие как YOLO11, можно легко обучить или дообучить на пользовательских наборах данных, используя интуитивно понятный пакет Ultralytics Python или платформу Ultralytics HUB, не требующую написания кода.
Наша документация предоставляет обширные ресурсы, включая советы по обучению моделей и подробное руководство по использованию YOLO11 для классификации изображений. Разработчики могут использовать предварительно обученные модели на эталонных наборах данных, таких как ImageNet, CIFAR-100 и Caltech-101, или обучить новую модель с нуля. Для тех, кто интересуется последними достижениями, такие ресурсы, как Papers With Code, предлагают всесторонний обзор самых эффективных моделей. Вы также можете сравнить производительность моделей YOLO на стандартных тестах. Фреймворки, такие как PyTorch и TensorFlow, обеспечивают основу для построения и обучения этих моделей.