Image Classification
Изучи основы классификации изображений — от CNN до реальных применений ИИ. Научись обучать и развертывать современные классификаторы с помощью Ultralytics YOLO26.
Классификация изображений — это фундаментальная задача в компьютерном зрении (CV), где модель машинного обучения анализирует все изображение целиком и присваивает ему одну метку из заранее определенного набора категорий. По сути, она отвечает на вопрос: «Что является основным объектом на этом снимке?». Являясь ключевым компонентом искусственного интеллекта (AI), этот процесс позволяет автоматизированным системам организовывать, классифицировать и интерпретировать визуальные данные в масштабе. Хотя человеческому глазу это может показаться простым, обучение компьютеров распознаванию паттернов требует использования сложных алгоритмов машинного обучения (ML), чтобы преодолеть разрыв между «сырыми» пикселями и осмысленными концепциями.
Link to this sectionМеханизм классификации#
Современная классификация изображений в значительной степени опирается на архитектуры глубинного обучения (DL), известные как сверточные нейронные сети (CNN). Эти сети разработаны так, чтобы имитировать способ обработки информации биологической зрительной корой. В процессе, называемом извлечением признаков, модель учится идентифицировать низкоуровневые атрибуты, такие как края и текстуры на ранних слоях, в конечном итоге объединяя их для распознавания сложных форм и объектов на более глубоких уровнях.
Для создания классификатора разработчики используют обучение с учителем, предоставляя модели огромное количество обучающих данных с размеченными примерами. Большие публичные наборы данных, такие как ImageNet, сыграли важную роль в повышении точности таких систем. Во время этапа вывода (инференса) модель выдает оценку вероятности для каждой категории, часто используя функцию softmax для определения наиболее вероятного класса.
Link to this sectionКлассификация по сравнению с другими задачами компьютерного зрения#
Важно отличать классификацию изображений от смежных возможностей компьютерного зрения, поскольку выбор метода зависит от конкретной задачи:
- Классификация vs Обнаружение объектов: Классификация присваивает одну метку всему изображению целиком. В отличие от нее, обнаружение объектов определяет местоположение нескольких объектов в кадре, рисуя граничную рамку (bbox) вокруг каждого из них.
- Классификация vs Сегментация изображений: Если классификация рассматривает глобальный контекст, то сегментация обеспечивает точность на уровне пикселей. Семантическая сегментация классифицирует каждый отдельный пиксель, позволяя точно определить границы между объектами и фоном.
Link to this sectionРеальные приложения#
Классификация изображений обеспечивает работу широкого спектра реальных AI-приложений в различных отраслях:
Link to this sectionМедицинская диагностика#
В медицине модели классификации помогают рентгенологам, анализируя диагностические сканы. Инструменты медицинского анализа изображений могут быстро классифицировать рентгеновские снимки или МРТ как «нормальные» или «аномальные», а также выявлять специфические состояния, например, при обнаружении опухолей, что ускоряет сортировку пациентов и постановку диагноза.
Link to this sectionКонтроль качества в производстве#
На заводах используют автоматизированный визуальный контроль для соблюдения стандартов продукции. Камеры на сборочных линиях захватывают изображения компонентов, а модели классификации мгновенно помечают их как «годен» или «брак» на основе видимых дефектов. Этот автоматизированный контроль качества гарантирует, что только качественные изделия попадут на этап упаковки.
Link to this sectionУмное сельское хозяйство#
Фермеры используют ИИ в сельском хозяйстве для мониторинга здоровья посевов. Классифицируя изображения, полученные с дронов или смартфонов, системы могут выявлять признаки заболеваний, дефицита питательных веществ или заражения вредителями, что позволяет проводить точечные вмешательства в рамках точного земледелия.
Link to this sectionРеализация классификации с помощью YOLO26#
Фреймворк Ultralytics YOLO26, хотя и известен своим функционалом обнаружения, предлагает передовую производительность для задач классификации изображений. Его архитектура оптимизирована по скорости и точности, что делает её подходящей для приложений реального времени.
Вот краткий пример того, как загрузить предобученную модель и классифицировать изображение с помощью Python-пакета ultralytics:
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")
# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")Для команд, стремящихся оптимизировать свой рабочий процесс, платформа Ultralytics упрощает весь пайплайн целиком. Она позволяет пользователям управлять наборами данных для классификации, выполнять обучение в облаке и развертывать модели в различных форматах, таких как ONNX или TensorRT, без создания сложной инфраструктуры для кодинга.






