Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Обучение с учителем

Узнайте, как обучение с учителем поддерживает ИИ с помощью размеченных данных, обеспечивая точные прогнозы и такие приложения, как обнаружение объектов и анализ тональности.

Контролируемое обучение - это доминирующая парадигма в области Машинное обучение (ML), при котором алгоритм обучается обучается на входных данных, которые были помечены правильными выходными данными. В отличие от других методов, когда система может исследовать данные автономно, этот подход опирается на "супервизора" - помеченные данные. помеченные данные, чтобынаправлять процесс обучения. Сайт Основная цель состоит в том, чтобы модель обучилась функции отображения входных переменных на выходные переменные с достаточной достаточной точностью, чтобы она могла предсказывать результаты для новых, еще не изученных данных. Эта методология служит основой для многих коммерческих . искусственного интеллекта (ИИ) от спам-фильтров до продвинутых систем компьютерного зрения. систем компьютерного зрения (CV).

Как работает процесс

Рабочий процесс начинается с набора данных, содержащего пары входных данных (признаков) и желаемых выходных данных (меток). Эта коллекция обычно делится на отдельные подмножества: обучающие данные для обучения модели, валидационные данные для настройки параметров, и тестовые данные для окончательной оценки.

На этапе обучения модели алгоритм обрабатывает входные данные и делает прогноз. Математическая формула, известная как функция потерь, вычисляет разницу между этим прогнозом и фактической меткой. Чтобы минимизировать эту ошибку, используется алгоритм оптимизации, такой как градиентный спуск, итеративно регулирует внутренние весовые коэффициенты модели. Этот цикл продолжается в течение многих проходов, или эпох, пока модель не достигнет удовлетворительной производительности без чрезмерной подгонки под обучающий набор. Для более глубокого погружения в эту механику, вы можете изучить Руководство Scikit-learn по контролируемому обучению.

Основные категории контролируемого обучения

Большинство задач контролируемого обучения делятся на две основные категории в зависимости от типа выходной переменной:

  • Классификация изображений: На сайте Выходной переменной является категория или класс. Цель - предсказать дискретные метки, например определить, является ли электронное письмо "спам" или "не спам", или если на картинке изображена "кошка" или "собака". Современные архитектуры, такие как Ultralytics YOLO11 отлично справляются с этими задачи классификации, быстро выявляя закономерности в визуальных данных.
  • Регрессия: Выходная переменная является непрерывной реальной величиной. В качестве примера можно привести прогнозирование цен на недвижимость на основе площади или прогнозирование тенденций на фондовом рынке. Подробнее о статистических основах этих методов вы можете узнать в обзоре IBM по регрессионному анализу.

Реализация модели классификации

Обучение модели с супервизией становится все более доступным благодаря высокоуровневым API. Следующий пример на Python демонстрирует, как обучить модель YOLO11 на наборе данных MNIST , стандартном эталоне для классификации цифр.

from ultralytics import YOLO

# Load a pretrained classification model
model = YOLO("yolo11n-cls.pt")

# Train the model on the MNIST dataset
# Ultralytics handles the download of the 'mnist160' dataset automatically
results = model.train(data="mnist160", epochs=5, imgsz=64)

# Run inference on a sample image to verify the supervised learning
print(model("https://ultralytics.com/images/bus.jpg"))

Применение в реальном мире

Контролируемое обучение является важнейшей технологией в различных отраслях. Два ярких примера включают:

  1. Автономные транспортные средства: Самостоятельно управляемые автомобили в значительной степени полагаются на системы обнаружения объектов, обученные с помощью контролируемого обучения. Аннотированные наборы данных, содержащие тысячи изображений пешеходов, светофоров и других транспортных средств, позволяют искусственному интеллекту автомобиля распознавать опасности в режиме реального времени. ИИ автомобиля распознавать и находить опасные объекты в режиме реального времени. Такие компании, как NVIDIA , используют глубокое обучение для обработки этих огромных датчиков для безопасной навигации.
  2. Анализ медицинских изображений: В здравоохранении модели обучаются на снимках, помеченных экспертами-радиологами, чтобы помочь в диагностике. Например. модель может научиться определять ранние признаки патологий на рентгеновских или магнитно-резонансных снимках. Исследователи часто используют такие ресурсы, как набор данных "Обнаружение опухолей головного мозга" для создания для создания систем, поддерживающих принятие клинических решений.

Различение смежных понятий

Важно отличать контролируемое обучение от других парадигм машинного обучения:

  • Неконтролируемое обучение: В отличие от контролируемого обучения, этот метод работает с немаркированными данными. Цель - обнаружить скрытые структуры, такие как например, группировка покупателей с похожими покупательскими привычками с помощью кластерный анализ.
  • Обучение с подкреплением: Вместо того чтобы учиться на статичном наборе данных с правильными ответами, агент учится, взаимодействуя с окружающей средой. Он получает обратную связь в виде вознаграждений или наказаний - концепция, подробно описанная в Саттон и Барто "Введение в обучение с подкреплением".
  • Полуподконтрольное обучение: Этот подход представляет собой промежуточное звено, использующее небольшое количество помеченных данных наряду с большим количеством немеченых. Для повышения эффективности обучения часто используется, когда маркировка данных стоит дорого или требует много времени.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас