Глоссарий

Одноразовое обучение

Откройте для себя возможности One-Shot Learning - революционной техники ИИ, позволяющей обобщать модели на основе минимальных данных для применения в реальном мире.

One-Shot Learning (OSL) - это задача классификации в машинном обучении (ML), в которой модель обучается распознавать новый класс объектов на основе всего одного примера. В отличие от традиционных моделей глубокого обучения, требующих огромных объемов обучающих данных, OSL призвана имитировать человеческую способность узнавать о новой концепции на основе одного примера. Это делает ее особенно ценной в сценариях, где сбор данных дорог, затруднен или невозможен. Основная идея заключается не в том, чтобы научиться классифицировать объекты напрямую, а в том, чтобы выучить функцию сходства, которая позволяет определить, принадлежат ли два изображения к одному классу.

Как работает одноразовое обучение

Вместо того чтобы обучать модель для определения конкретных классов, модели OSL обычно обучаются для решения другой задачи: определения того, являются ли два входных изображения одинаковыми или разными. Для этого обычно используется сиамская сеть, состоящая из двух идентичных нейронных сетей с одинаковыми весами. Каждая сеть обрабатывает одно из двух входных изображений, чтобы создать вставку -компактное числовое представление изображения.

Затем модель сравнивает эти два вкрапления, чтобы вычислить балл сходства. В процессе обучения модели сеть учится создавать схожие вкрапления для изображений одного класса и несхожие вкрапления для изображений из разных классов. После обучения модель может классифицировать новое изображение, сравнивая его с единственным "снимком" или примером из каждого известного класса. Новое изображение относится к классу с наибольшей оценкой сходства. Этот подход в значительной степени опирается на хорошее извлечение признаков для создания надежных представлений.

Взаимосвязь с другими парадигмами обучения

OSL является частью более широкого семейства методов обучения, разработанных для сценариев с малым количеством данных:

  • Few-Shot Learning (FSL): Обобщение OSL, при котором модель обучается не на одном, а на небольшом количестве примеров (например, от 2 до 5) для каждого класса. FSL предоставляет больше информации, чем OSL, что часто приводит к лучшей производительности.
  • Zero-Shot Learning (ZSL): Более сложная парадигма, в которой модель должна распознавать классы, которые она никогда не видела во время обучения, как правило, путем обучения отображению между визуальными признаками и высокоуровневыми семантическими описаниями.
  • Мета-обучение: Этот подход часто называют "обучением, чтобы учиться". Он позволяет тренировать модель на широком спектре учебных задач, чтобы она могла решать новые задачи более эффективно. Многие методы OSL и FSL основаны на принципах метаобучения, описанных в исследованиях таких институтов, как BAIR Калифорнийского университета в Беркли.
  • Трансферное обучение: Это предполагает использование модели, предварительно обученной на большом наборе данных (например, ImageNet), а затем ее тонкую настройку на меньшем, конкретном наборе данных. Хотя этот метод и является родственным, OSL фокусируется на обучении на одном примере без обширной тонкой настройки.

Применение в реальном мире

Одномоментное обучение очень эффективно в ситуациях с дефицитом данных.

  1. Распознавание лиц: Системы безопасности могут использовать OSL для идентификации человека после того, как ему будет показана только одна фотография. Система учится создавать уникальную подпись лица (встраивание) и затем может распознавать человека под разными углами и при различных условиях освещения. Это используется в самых разных областях - от разблокировки смартфонов до обеспечения безопасного доступа в здания. Ранняя влиятельная статья DeepFace от Facebook AI продемонстрировала возможности глубоких сетей для решения этой задачи.
  2. Открытие лекарств: В фармакологии выявление новых молекул, которые могут стать эффективными лекарствами, - дорогостоящий процесс. OSL можно использовать для построения моделей, предсказывающих свойства новой молекулы на основе единственного известного примера с желаемыми характеристиками. Это ускоряет процесс отбора, о чем говорится в исследовании по глубокому обучению на основе графов для разработки лекарств.

Проблемы и будущие направления

Основной проблемой в OSL является обобщение. Модель должна изучить суть класса на одном примере, не перестраиваясь на его специфические особенности. Поэтому качество единичного примера имеет решающее значение. Текущие исследования, такие как работа, освещенная в Papers with Code, направлены на разработку более надежных представлений признаков и продвинутых стратегий метаобучения. Интеграция возможностей OSL в платформы технического зрения общего назначения, такие как Ultralytics HUB, может значительно расширить их применение в условиях ограниченных данных. По мере того как модели становятся все более мощными, их оценка с помощью соответствующих метрик производительности в таких жестких условиях также является ключевой областью исследования.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена