Узнайте, как самообучение с учителем использует неразмеченные данные для эффективного обучения, преобразуя ИИ в компьютерном зрении, NLP и других областях.
Самоконтролируемое обучение (SSL) - это трансформационный подход в области искусственного интеллекта (ИИ) позволяющий системам обучаться на немаркированных данных, не требуя явной аннотации человека. В отличие от традиционного контролируемого обучениякоторое в значительной степени зависит от огромных наборов данных с помеченными вручную примерами, SSL получает собственные сигналы супервизии непосредственно из самих данных. Создавая и решая "предтекстовые задачи", такие как заполнение пропущенных слов в предложении или предсказание поворота изображения, модель учится заполнение пропущенных слов в предложении или предсказание поворота изображения - модель учится понимать базовую структуру, контекст и особенности входных данных. Эта способность крайне важна для разработки надежных базовых моделей которые можно адаптировать к широкому спектру задач, решаемых в дальнейшем, с минимальным дополнительным обучением.
Основной механизм SSL заключается в удалении части доступных данных и задании нейронной сети (НС) на реконструировать ее. Этот процесс заставляет модель обучаться высококачественным представлениям, или вкраплениякоторые передают семантический смысл. Существует две основные категории задач, связанных с претекстом, которые используются в научных исследованиях и промышленности:
Самоконтролируемое обучение произвело революцию в промышленности, раскрыв ценность огромных, не хранящихся в памяти наборов данных. Вот два конкретных примера его влияния:
Чтобы полностью понять SSL, необходимо отличать его от аналогичных парадигм обучения:
На практике большинство разработчиков используют SSL, применяя веса моделей которые уже были предварительно обученных на огромных наборах данных. Например. Ultralytics YOLO11 архитектура использует благодаря глубоким возможностям извлечения признаков, отточенным в ходе длительного обучения. Хотя YOLO работает под надзором, концепция обучения с передачей данных - взятие модели, понимающей визуальные особенности, и применение ее к новой задаче - является основной преимуществом исследования SSL.
Следующий пример на Python демонстрирует, как загрузить предварительно обученную модель и произвести ее тонкую настройку на определенном наборе данных. Этот процесс опирается на представления признаков, полученные на этапе начального предварительного обучения.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model (weights act as the learned representation)
model = YOLO("yolo11n.pt")
# Fine-tune the model on a specific task, leveraging its existing visual knowledge
# This transfer learning process is highly efficient due to robust pre-training
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
# Perform inference to verify the model detects objects correctly
model.predict("https://ultralytics.com/images/bus.jpg", save=True)
В то время как исследователи стремятся к созданию моделей, которые бы обучались подобно человеку - путем наблюдения, а не заучивания - SL остается в авангарде инноваций. Крупнейшие исследовательские лаборатории, включая Google DeepMind и Meta AIпродолжают публиковать открытия, которые снижают зависимость от меченых данных. В Ultralytics мы интегрируем эти достижения в наши исследования и разработки для YOLO26стремясь создать более быстрые, компактные и точные модели, способные эффективно обобщать различные данные. Компьютерное зрение (КВ) задачи. Такие инструменты, как PyTorch и готовящаяся к выпуску платформа Ultralytics Platform позволяют легче, чем когда-либо, развернуть эти передовые возможности в реальных производственных средах.