Откройте для себя мощь обучения с одного примера (One-Shot Learning), революционной техники AI, позволяющей моделям обобщать данные из минимального объема данных для реальных приложений.
One-Shot Learning (OSL) — это задача классификации в рамках машинного обучения (ML), где модель обучается распознавать новый класс объектов всего по одному примеру. В отличие от традиционных моделей глубокого обучения, требующих огромных объемов данных для обучения, OSL стремится имитировать способность человека узнавать новую концепцию на основе единственного примера. Это делает его особенно ценным в сценариях, где сбор данных является дорогостоящим, трудным или невозможным. Основная идея состоит не в том, чтобы научиться напрямую классифицировать объекты, а в том, чтобы изучить функцию сходства, которая может определить, принадлежат ли два изображения к одному классу.
Вместо того чтобы обучать модель для идентификации конкретных классов, модели OSL обычно обучаются для решения другой задачи: определения, являются ли два входных изображения одинаковыми или разными. Распространенной архитектурой, используемой для этого, является Siamese Network, которая состоит из двух идентичных нейронных сетей, которые используют одни и те же веса. Каждая сеть обрабатывает одно из двух входных изображений для создания эмбеддинга — компактного числового представления изображения.
Затем модель сравнивает эти два вложения для вычисления оценки сходства. Во время обучения модели сеть учится создавать похожие вложения для изображений одного и того же класса и непохожие вложения для изображений из разных классов. После обучения модель может классифицировать новое изображение, сравнивая его с единственным «снимком» или примером из каждого известного класса. Новое изображение назначается классу с наивысшей оценкой сходства. Этот подход в значительной степени зависит от хорошего извлечения признаков для построения надежных представлений.
OSL является частью более широкого семейства методов обучения, разработанных для сценариев с небольшим объемом данных:
One-Shot Learning очень эффективен в ситуациях с ограниченным объемом данных.
Основная проблема в OSL — это обобщение. Модель должна усвоить основную суть класса по одному примеру, не переобучаясь на его конкретных признаках. Поэтому качество единственного примера имеет решающее значение. Текущие исследования, такие как работа, освещенная на Papers with Code, сосредоточены на разработке более надежных представлений признаков и передовых стратегий мета-обучения. Интеграция возможностей OSL в универсальные платформы машинного зрения, такие как Ultralytics HUB, может значительно расширить их использование в средах с ограниченным объемом данных. Поскольку модели становятся более мощными, их оценка с использованием соответствующих метрик производительности в этих сложных условиях также является ключевой областью исследований.