Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Обучение с небольшим количеством примеров

Узнайте, как обучение с небольшим количеством примеров позволяет ИИ адаптироваться с минимальным количеством данных, преобразуя такие области, как медицинская диагностика и охрана дикой природы.

FSL (Few-Shot Learning) — это специализированная область машинного обучения (ML), предназначенная для обучения моделей распознаванию и classify концепций с использованием очень небольшого количества помеченных примеров. В традиционном глубоком обучении (DL) для достижения высокой точности обычно требуются огромные наборы данных, содержащие тысячи изображений в каждой категории. Однако FSL имитирует человеческую когнитивную способность быстро обобщать на основе ограниченного опыта — подобно тому, как ребенок может распознать жирафа, увидев всего одну или две картинки в книге. Эта способность необходима для внедрения искусственного интеллекта (AI) в сценариях, где сбор больших объемов учебных данных является чрезмерно дорогостоящим, занимает много времени или практически невозможен.

Основные механизмы обучения по нескольким снимкам

Основная цель FSL — уменьшить зависимость от сбора обширных данных за счет использования предварительных знаний. Вместо того чтобы изучать паттерны с нуля, модель использует «набор поддержки», содержащий несколько помеченных примеров, для понимания новых классов. Это часто достигается с помощью передовых технологий, таких как метаобучение, также известное как «обучение обучению». В этой парадигме модель обучается на различных задачах, чтобы выработать оптимальное правило инициализации или обновления, позволяющее ей адаптироваться к новым задачам с минимальными корректировками.

Другой распространенный подход включает в себя обучение на основе метрик, при котором модель учится отображать входные данные в векторное пространство с помощью вложений. В этом пространстве похожие элементы группируются близко друг к другу, а непохожие — раздвигаются. Алгоритмы, такие как прототипные сети, вычисляют среднее представление, или прототип, для каждого класса и classify образцы запросов на основе их расстояния до этих прототипов. Это часто зависит от возможностей извлечения признаков, разработанных во время предварительного обучения на более крупных общих наборах данных.

Применение в реальном мире

Обучение по нескольким примерам трансформирует отрасли, в которых нехватка данных ранее препятствовала внедрению технологий искусственного интеллекта.

Медицинская визуализация и диагностика

В области анализа медицинских изображений зачастую невозможно получить тысячи помеченных сканов редких патологий. FSL позволяет исследователям обучать системы компьютерного зрения (CV) detect редкие типы опухолей или определенные генетические аномалии, используя лишь несколько аннотированных клинических случаев. Эта возможность демократизирует доступ к передовым диагностическим инструментам, что является целью таких учреждений, как Stanford Medicine, помогая выявлять состояния, которые в противном случае потребовали бы специализированных знаний.

Промышленный контроль качества

Современный искусственный интеллект в производстве в значительной степени полагается на автоматизированный контроль. Однако определенные дефекты могут возникать очень редко, что затрудняет создание большого набора данных о «бракованных» деталях. FSL позволяет системам обнаружения аномалий изучать характеристики нового типа дефектов по нескольким изображениям. Это позволяет операторам заводов быстро обновлять свои протоколы обеспечения качества без остановки производства для сбора данных, что значительно повышает эффективность в динамичных производственных средах.

Различение смежных понятий

Чтобы понять специфику FSL, полезно отличать его от схожих парадигм обучения с низким объемом данных:

  • Перенос обучения: FSL часто реализуется как специфическая, крайняя форма переноса обучения. В то время как стандартный перенос обучения может точно настроить модель, такую как YOLO26, на сотнях изображений, FSL нацелен на сценарии, в которых возможно, всего 5–10 изображений на класс (известные как классификация «N-way K-shot»).
  • Однократное обучение: это строгое подмножество FSL, при котором модель должна учиться на основе только одного помеченного примера. Обычно используется в системах распознавания лиц для проверки личности по единственной сохраненной фотографии.
  • Обучение без примеров (Zero-Shot Learning): в отличие от FSL, которое требует хотя бы небольшой набор визуальных примеров, обучение без примеров не требует визуальных примеров целевого класса во время обучения. Вместо этого оно полагается на семантические описания или атрибуты (такие как текстовые подсказки) для распознавания невиданных объектов.

Практическая реализация с помощью Ultralytics

На практике одним из наиболее эффективных способов выполнения обучения по методу Few-Shot Learning является использование высоконадежной предварительно обученной модели. Современные модели, такие как новая YOLO26, обучились представлению богатых характеристик на основе огромных наборов данных, таких как COCO или ImageNet. Благодаря тонкой настройке этих моделей на небольшом пользовательском наборе данных, они могут адаптироваться к новым задачам с поразительной скоростью и точностью.

Следующий Python демонстрирует, как обучить модель на небольшом наборе данных с помощью ultralytics пакет, эффективно выполняющий адаптацию по нескольким выстрелам:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (incorporates learned features)
model = YOLO("yolo26n.pt")

# Fine-tune on a tiny dataset (e.g., coco8 has only 4 images per batch)
# This leverages the model's prior knowledge for the new task
results = model.train(data="coco8.yaml", epochs=20, imgsz=640)

# The model adapts to detect objects in the small dataset
print("Few-shot adaptation complete.")

Проблемы и перспективы

Несмотря на свою мощность, FSL сталкивается с проблемами надежности. Если несколько предоставленных примеров являются выбросами или содержат шумы, производительность модели может снизиться, что приводит к проблеме, известной как переобучение. Исследования в области увеличения объема данных и генерации синтетических данных имеют решающее значение для снижения этих рисков. По мере того как базовые модели становятся все более масштабными и функциональными, а такие инструменты, как Ultralytics упрощают обучение моделей и управление ими, возможность создания индивидуальных решений искусственного интеллекта с использованием минимального количества данных станет все более доступной для разработчиков по всему миру.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас