Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

One-Shot Learning

Откройте для себя мощь обучения с одного примера (One-Shot Learning), революционной техники AI, позволяющей моделям обобщать данные из минимального объема данных для реальных приложений.

One-Shot Learning (OSL) — это задача классификации в рамках машинного обучения (ML), где модель обучается распознавать новый класс объектов всего по одному примеру. В отличие от традиционных моделей глубокого обучения, требующих огромных объемов данных для обучения, OSL стремится имитировать способность человека узнавать новую концепцию на основе единственного примера. Это делает его особенно ценным в сценариях, где сбор данных является дорогостоящим, трудным или невозможным. Основная идея состоит не в том, чтобы научиться напрямую классифицировать объекты, а в том, чтобы изучить функцию сходства, которая может определить, принадлежат ли два изображения к одному классу.

Как работает обучение с одного примера (One-Shot Learning)

Вместо того чтобы обучать модель для идентификации конкретных классов, модели OSL обычно обучаются для решения другой задачи: определения, являются ли два входных изображения одинаковыми или разными. Распространенной архитектурой, используемой для этого, является Siamese Network, которая состоит из двух идентичных нейронных сетей, которые используют одни и те же веса. Каждая сеть обрабатывает одно из двух входных изображений для создания эмбеддинга — компактного числового представления изображения.

Затем модель сравнивает эти два вложения для вычисления оценки сходства. Во время обучения модели сеть учится создавать похожие вложения для изображений одного и того же класса и непохожие вложения для изображений из разных классов. После обучения модель может классифицировать новое изображение, сравнивая его с единственным «снимком» или примером из каждого известного класса. Новое изображение назначается классу с наивысшей оценкой сходства. Этот подход в значительной степени зависит от хорошего извлечения признаков для построения надежных представлений.

Связь с другими парадигмами обучения

OSL является частью более широкого семейства методов обучения, разработанных для сценариев с небольшим объемом данных:

  • Обучение с небольшим количеством примеров (Few-Shot Learning, FSL): Обобщение OSL, когда модель учится на небольшом количестве примеров (например, от 2 до 5) на класс, а не только на одном. FSL предоставляет больше информации, чем OSL, что часто приводит к лучшей производительности.
  • Обучение с нулевого цикла (Zero-Shot Learning, ZSL): Более сложная парадигма, в которой модель должна распознавать классы, которые она никогда не видела во время обучения, обычно путем изучения соответствия между визуальными признаками и семантическими описаниями высокого уровня.
  • Мета-обучение: Часто называемый "обучением обучению", этот подход обучает модель на широком спектре задач обучения, чтобы позволить ей более эффективно решать новые задачи. Многие методы OSL и FSL основаны на принципах мета-обучения, как описано в исследованиях таких учреждений, как BAIR Калифорнийского университета в Беркли.
  • Transfer Learning (перенос обучения): Это включает в себя использование модели, предварительно обученной на большом наборе данных (например, ImageNet), а затем ее тонкую настройку на меньшем, конкретном наборе данных. Хотя OSL и связана с этим, она фокусируется на обучении на одном примере без обширной тонкой настройки.

Применение в реальном мире

One-Shot Learning очень эффективен в ситуациях с ограниченным объемом данных.

  1. Распознавание лиц: Системы безопасности могут использовать OSL для идентификации человека после показа только одной фотографии. Система учится создавать уникальную подпись лица (векторное представление) и может затем распознавать этого человека с разных углов и в различных условиях освещения. Это используется в приложениях, от разблокировки смартфонов до безопасного доступа в здания. Ранняя влиятельная статья DeepFace от Facebook AI продемонстрировала возможности глубоких сетей для этой задачи.
  2. Открытие лекарств: В фармакологии выявление новых молекул, которые могут стать эффективными лекарствами, — дорогостоящий процесс. OSL можно использовать для создания моделей, которые прогнозируют свойства новой молекулы на основе одного известного примера с желаемыми характеристиками. Это ускоряет процесс скрининга, как обсуждается в исследованиях по глубокому обучению на основе графов для разработки лекарств.

Проблемы и будущие направления

Основная проблема в OSL — это обобщение. Модель должна усвоить основную суть класса по одному примеру, не переобучаясь на его конкретных признаках. Поэтому качество единственного примера имеет решающее значение. Текущие исследования, такие как работа, освещенная на Papers with Code, сосредоточены на разработке более надежных представлений признаков и передовых стратегий мета-обучения. Интеграция возможностей OSL в универсальные платформы машинного зрения, такие как Ultralytics HUB, может значительно расширить их использование в средах с ограниченным объемом данных. Поскольку модели становятся более мощными, их оценка с использованием соответствующих метрик производительности в этих сложных условиях также является ключевой областью исследований.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена