Узнай, как самоконтролируемое обучение использует немаркированные данные для эффективного обучения, преобразуя ИИ в компьютерном зрении, NLP и других областях.
Самоконтролируемое обучение (SSL) - это подход к машинному обучению (ML), который позволяет моделям обучаться на огромном количестве немаркированных данных. В отличие от контролируемого обучения, которое сильно зависит от тщательно маркированных данных, SSL гениально создает свои собственные контролирующие сигналы непосредственно из самих входных данных. Это делает его исключительно ценным в таких областях, как компьютерное зрение (CV) и обработка естественного языка (NLP), где немаркированных данных много, но стоимость и усилия по ручному маркированию(аннотированию данных) могут быть непомерно высоки.
Основной механизм SSL заключается в разработке "предтекстовой задачи". Это вспомогательная, самогенерируемая задача, в которой модель должна предсказать определенные свойства данных, которые были намеренно скрыты или изменены. Решая эту предтекстовую задачу, модель вынуждена изучать значимые глубинные структуры и представления(эмбеддинги) данных без навязанных человеком меток. Этот начальный этап обучения принято называть предтренингом.
Например, в компьютерном зрении предтекстовая задача может включать в себя:
В НЛП известной предтекстовой задачей является моделирование языка по маске, знаменитое тем, что используется в таких моделях, как BERT. Здесь модель учится предсказывать слова, которые были случайным образом замаскированы (скрыты) в предложениях.
После предварительного обучения на больших наборах немаркированных данных модель получает богатые представления признаков. Затем эта предварительно обученная модель может быть адаптирована для решения конкретных задач - например, обнаружения объектов, классификации изображений или анализа настроений - с помощьюпроцесса, называемого тонкой настройкой. Тонкая настройка обычно требует гораздо меньшего количества помеченных данных по сравнению с обучением модели с нуля, что делает SSL ключевым фактором для эффективного трансферного обучения.
Очень важно отличать SSL от смежных парадигм ML:
SSL значительно продвинул возможности искусственного интеллекта (ИИ):
SSL значительно снижает зависимость от дорогостоящих меченых наборов данных, демократизируя разработку мощных моделей ИИ. Такие инструменты, как PyTorch и TensorFlowа также такие платформы, как Ultralytics HUB, предоставляют среду для использования методов SSL для создания и развертывания передовых решений в области ИИ.