Глоссарий

Классификация изображений

Откройте для себя классификацию изображений с помощью Ultralytics YOLO: обучайте пользовательские модели для здравоохранения, сельского хозяйства, розничной торговли и других с помощью передовых инструментов.

Классификация изображений - это фундаментальная задача в Компьютерное зрение (КЗ) предполагает присвоение присвоение единой метки или категории всему цифровому изображению на основе его визуального содержания. Этот процесс позволяет машинам "видеть" и интерпретировать мир, распознавая паттерны, объекты или сцены в визуальных данных. Как основной компонент искусственного интеллекта (ИИ), он служит строительным блоком для более сложных систем визуального распознавания, позволяя автоматизированным системам классифицировать огромные огромные объемы визуальной информации.

Как работает классификация изображений

На техническом уровне классификация изображений опирается на алгоритмы машинного обучения (ML), в частности модели глубокого обучения (ГОО), известные как Конволюционные нейронные сети (CNN). Эти сети предназначены для обработки пиксельных данных и автоматического извлечение признаков, определяя низкоуровневые атрибутов, таких как края и текстуры на ранних слоях и сложные формы на более глубоких слоях.

Как правило, процесс происходит по принципу контролируемого обучения:

Обучение: Модель получает набор данных с метками, например ImageNetсодержащий тысячи или миллионы изображений с известными категориями.
Обучение: С помощью Благодаря обратному распространению, сеть регулирует свои внутренние весов модели, чтобы минимизировать ошибки предсказания.
Выводы: После обучения модель может анализировать новые, еще не просмотренные изображения и выдавать оценку вероятности для каждого класса с помощью функции softmax. Категория с наибольшей вероятностью присваивается в качестве окончательной метки.

Такие популярные фреймворки, как PyTorch и TensorFlow предоставляют необходимые инструменты для создания и обучения этих сложных архитектур.

Отличие классификации от смежных задач

Хотя классификация изображений отвечает на вопрос "Что находится на этом изображении?", ее часто путают с другими задачами компьютерного зрения. Понимание различий имеет решающее значение для выбора правильного инструмента для проекта:

Обнаружение объекта: В отличие от классификации, которая маркирует все изображение, обнаружение объектов определяет , где находятся объекты. расположены. Он рисует ограничительную рамку вокруг каждого объекта и классифицирует их по отдельности.
Сегментация изображений: Она обеспечивает точность на уровне пикселей. Семантическая сегментация классифицирует каждый пиксель в определенную категорию (например, дорога против неба), в то время как сегментация по экземпляру различает отдельные объекты одного класса.

Применение в реальном мире

Классификация изображений повсеместно используется в различных отраслях промышленности, обеспечивая автоматизацию и улучшая процессы принятия решений.

1. Медицинская визуализация и здравоохранение

В области анализа медицинских изображений, модели классификации помогают радиологам в предварительном отборе снимков. Например, алгоритмы могут classify рентгеновские снимки грудной клетки или МРТ как "нормальные" или "ненормальные", отмечая потенциальные проблемы, такие как пневмония или опухоли, для приоритетного рассмотрения. рассмотрения. Исследования Национального института здоровья (NIH) демонстрируют, как ИИ помогает в ранней диагностике заболеваний, значительно улучшая состояние пациентов. Вы можете подробнее ознакомиться с нашей работой в области обнаружении опухолей с помощью YOLO11.

2. Умное сельское хозяйство

Точное земледелие использует классификацию изображений для мониторинга состояния посевов. Дроны, оснащенные камерами, делают снимки полей, которые затем анализируются, чтобы classify растения как здоровые, испытывающие недостаток питательных веществ или больные. Это позволяет целенаправленное вмешательство, сокращая использование химикатов и повышая урожайность. Сайт Министерство сельского хозяйства США (USDA) подчеркивает, что такие технологии способствуют устойчивому ведению сельского хозяйства. Узнайте, как Ultralytics поддерживает ИИ в сельском хозяйстве, чтобы совершить революцию в современном фермерство.

Реализация классификации с помощью YOLO11

Несмотря на то, что он знаменит своим обнаружением. Ultralytics YOLO11 архитектура Ultralytics YOLO11 также высокоэффективна для задач классификации изображений. Она обеспечивает баланс между скоростью и точности, что делает ее подходящей для приложений, работающих в режиме реального времени.

Вот краткий пример того, как использовать предварительно обученную модель YOLO11 для classify изображений с помощью ultralytics Пакет Python :

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Run inference on an external image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Predicted class: {results[0].names[results[0].probs.top1]}")

Пользователи, желающие создавать собственные решения, могут обучать пользовательские модели на определенных наборах данных, используя тот же простой API. Вне зависимости от того, развертываете ли вы решение на пограничных устройствах с помощью таких инструментов, как OpenCV или масштабируете с помощью облачной инфраструктуры, современные модели классификации обеспечивают универсальность, необходимую для различных сценариев развертывания сценариев.

Классификация изображений

Обучение моделям Ultralytics YOLO для оптимизации рабочих процессов в разных отраслях

Гибкое корпоративное лицензирование для развития ваших инноваций

Обучайте модели искусственного интеллекта за считанные секунды с помощью Ultralytics YOLO

Как работает классификация изображений

Отличие классификации от смежных задач

Применение в реальном мире

1. Медицинская визуализация и здравоохранение

2. Умное сельское хозяйство

Реализация классификации с помощью YOLO11

Читать больше в этой категории

Понимание важности аннотации с участием человека

Что такое дистилляция наборов данных? Краткий обзор

Очки Oakley Meta AI переосмысливают концепцию очков с помощью Vision AI

Присоединяйтесь к сообществу Ultralytics