Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024

Понимание обучения с малым количеством примеров, обучением с нулевым количеством примеров и переноса обучения

Абирами Вина

5 мин чтения

29 января 2025 г.

Изучите различия между обучением с малым количеством примеров, обучением с нулевым количеством примеров и переносом обучения в компьютерном зрении и то, как эти парадигмы формируют обучение моделей ИИ.

Системы искусственного интеллекта (ИИ) могут справляться со сложными задачами, такими как распознавание лиц, классификация изображений и вождение автомобилей с минимальным участием человека. Они делают это, изучая данные, распознавая закономерности и используя эти закономерности для прогнозирования или принятия решений. По мере развития ИИ мы наблюдаем все более сложные способы, с помощью которых модели ИИ могут учиться, адаптироваться и выполнять задачи с замечательной эффективностью.

Например, компьютерное зрение — это отрасль ИИ, которая фокусируется на том, чтобы дать машинам возможность интерпретировать и понимать визуальную информацию из мира. Традиционная разработка моделей компьютерного зрения в значительной степени зависит от больших, аннотированных наборов данных для обучения. Сбор и маркировка таких данных могут быть трудоемкими и дорогостоящими. 

Чтобы справиться с этими проблемами, исследователи представили инновационные подходы, такие как обучение с малым количеством примеров (FSL), которое учится на ограниченном количестве примеров; обучение с нулевым количеством примеров (ZSL), которое идентифицирует невидимые объекты; и перенос обучения (TL), который применяет знания из предварительно обученных моделей к новым задачам.

В этой статье мы рассмотрим, как работают эти парадигмы обучения, выделим их ключевые различия и рассмотрим реальные приложения. Давайте начнем!

Обзор парадигм обучения

Давайте рассмотрим, что такое обучение с малым количеством примеров, обучение с нулевым количеством примеров и перенос обучения в отношении компьютерного зрения и как они работают. 

Обучение с малым количеством примеров

Обучение с малым количеством примеров — это метод, при котором системы учатся распознавать новые объекты, используя лишь небольшое количество примеров. Например, если вы покажете модели несколько изображений пингвина, пеликана и тупика (эта небольшая группа называется «набором поддержки»), она узнает, как выглядят эти птицы. 

Позже, если вы покажете модели новое изображение, например, пингвина, она сравнит это новое изображение с изображениями в своем наборе поддержки и выберет наиболее близкое соответствие. Когда сбор большого количества данных затруднен, этот метод полезен, поскольку система все еще может учиться и адаптироваться, имея лишь несколько примеров.

__wf_reserved_inherit
Рис. 1. Обзор того, как работает обучение с малым количеством примеров.

Zero-shot learning (Обучение с нулевым количеством примеров)

Zero-shot learning (Обучение с нулевым количеством примеров) — это метод, позволяющий машинам распознавать объекты, которые они никогда раньше не видели, без необходимости в примерах. Он использует семантическую информацию, такую как описания, для установления связей.

Например, если машина изучила таких животных, как кошки, львы и лошади, понимая такие признаки, как «маленький и пушистый», «большая дикая кошка» или «длинное лицо», она может использовать эти знания для идентификации нового животного, например, тигра. Даже если она никогда раньше не видела тигра, она может использовать описание, например, «животное, похожее на льва, с темными полосами», чтобы правильно его идентифицировать. Это упрощает машинам обучение и адаптацию без необходимости в большом количестве примеров.

__wf_reserved_inherit
Рис. 2. Zero-shot learning (Обучение с нулевым количеством примеров) идентифицирует новые объекты, используя описания.

Transfer learning (Трансферное обучение)

Transfer learning (Трансферное обучение) — это парадигма обучения, в которой модель использует знания, полученные при выполнении одной задачи, для решения аналогичной новой задачи. Этот метод особенно полезен в задачах компьютерного зрения, таких как обнаружение объектов, классификация изображений и распознавание образов. 

Например, в компьютерном зрении предварительно обученная модель может распознавать общие объекты, такие как животные, а затем быть точно настроена с помощью трансферного обучения для идентификации конкретных, таких как различные породы собак. Благодаря повторному использованию знаний, полученных при выполнении предыдущих задач, трансферное обучение упрощает обучение моделей компьютерного зрения на небольших наборах данных, экономя время и усилия.

__wf_reserved_inherit
Рис. 3. Обзор принципа работы трансферного обучения.

Возможно, вам интересно, какие типы моделей поддерживают трансферное обучение. Ultralytics YOLO11 — отличный пример модели компьютерного зрения, которая может это делать. Это современная модель обнаружения объектов, которая сначала предварительно обучается на большом, общем наборе данных. После этого ее можно точно настроить и обучить на заказ на меньшем, специализированном наборе данных для конкретных задач.

Сравнение парадигм обучения

Теперь, когда мы поговорили о few-shot learning (обучении с небольшим количеством примеров), zero-shot learning (обучении с нулевым количеством примеров) и transfer learning (трансферном обучении), давайте сравним их, чтобы увидеть, чем они отличаются.

__wf_reserved_inherit
Рис. 4. Ключевые различия между few-shot, zero-shot и transfer learning. Изображение автора.

Few-shot learning (Обучение с небольшим количеством примеров) полезно, когда у вас есть лишь небольшое количество размеченных данных. Оно позволяет AI-модели учиться всего на нескольких примерах. Zero-shot learning (Обучение с нулевым количеством примеров), с другой стороны, не требует никаких размеченных данных. Вместо этого оно использует описания или контекст, чтобы помочь системе справиться с новыми задачами. Между тем, transfer learning (трансферное обучение) использует другой подход, применяя знания из предварительно обученных моделей, что позволяет им быстро адаптироваться к новым задачам с минимальным количеством дополнительных данных. Каждый метод имеет свои сильные стороны в зависимости от типа данных и задачи, над которой вы работаете.

Применение различных парадигм обучения в реальном мире

Эти парадигмы обучения уже меняют ситуацию во многих секторах, решая сложные проблемы с помощью инновационных решений. Давайте подробнее рассмотрим, как их можно применять в реальном мире.

Диагностика редких заболеваний с помощью few-shot learning

Few-shot learning (Обучение с небольшим количеством примеров) меняет правила игры в сфере здравоохранения, особенно в медицинской визуализации. Оно может помочь врачам диагностировать редкие заболевания, используя всего несколько примеров или даже описаний, без необходимости в больших объемах данных. Это особенно полезно, когда данные ограничены, что часто бывает, поскольку сбор больших наборов данных для редких заболеваний может быть сложным.

Например, SHEPHERD использует few-shot learning (обучение с небольшим количеством примеров) и биомедицинские графы знаний для диагностики редких генетических заболеваний. Он сопоставляет информацию о пациенте, такую как симптомы и результаты анализов, с сетью известных генов и заболеваний. Это помогает точно определить вероятную генетическую причину и найти похожие случаи, даже когда данных мало. 

__wf_reserved_inherit
Рис. 5. Модель Shepherd диагностирует редкие заболевания, используя минимальное количество данных.

Улучшение обнаружения болезней растений с помощью zero-shot learning

В сельском хозяйстве быстрая идентификация болезней растений имеет важное значение, поскольку задержки в обнаружении могут привести к широко распространенному повреждению посевов, снижению урожайности и значительным финансовым потерям. Традиционные методы часто опираются на большие наборы данных и экспертные знания, которые не всегда могут быть доступны, особенно в отдаленных или ограниченных в ресурсах районах. Именно здесь вступают в игру достижения в области искусственного интеллекта, такие как zero-shot learning (обучение с нулевым количеством примеров).

Предположим, фермер выращивает помидоры и картофель и замечает такие симптомы, как пожелтение листьев или коричневые пятна. Zero-shot learning (Обучение с нулевым количеством примеров) может помочь идентифицировать такие заболевания, как фитофтороз, без необходимости в больших наборах данных. Используя описания симптомов, модель может классифицировать заболевания, которые она раньше не видела. Этот подход является быстрым, масштабируемым и позволяет фермерам выявлять различные проблемы с растениями. Он помогает им более эффективно контролировать здоровье посевов, своевременно принимать меры и сокращать потери.

__wf_reserved_inherit
Рис. 6.  Использование zero-shot learning (обучения с нулевым количеством примеров) для идентификации болезней растений.

Автономные транспортные средства и трансферное обучение

Автономным транспортным средствам часто необходимо адаптироваться к различным условиям окружающей среды, чтобы безопасно перемещаться. Transfer learning (Трансферное обучение) помогает им использовать предварительные знания для быстрой адаптации к новым условиям, не начиная обучение с нуля. В сочетании с компьютерным зрением, которое помогает транспортным средствам интерпретировать визуальную информацию, эти технологии обеспечивают более плавную навигацию по различным местностям и погодным условиям, что делает автономное вождение более эффективным и надежным.

Хорошим примером этого в действии является система управления парковкой, которая использует Ultralytics YOLO11 для мониторинга парковочных мест. YOLO11, предварительно обученная модель обнаружения объектов, может быть точно настроена с использованием transfer learning для идентификации пустых и занятых парковочных мест в режиме реального времени. Обучив модель на небольшом наборе изображений парковки, она научится точно определять свободные места, занятые места и даже зарезервированные зоны.

__wf_reserved_inherit
Рис. 7. Управление парковкой с использованием Ultralytics YOLO11.

Интегрированная с другими технологиями, эта система может направлять водителей к ближайшему доступному месту, помогая сократить время поиска и уменьшить заторы на дорогах. Transfer learning делает это возможным, опираясь на существующие возможности обнаружения объектов YOLO11, позволяя ей адаптироваться к конкретным потребностям управления парковкой, не начиная с нуля. Такой подход экономит время и ресурсы, создавая при этом высокоэффективное и масштабируемое решение, которое улучшает работу парковки и повышает общее удобство для пользователей.

Новые тенденции в парадигмах обучения

Будущее парадигм обучения в компьютерном зрении склоняется к разработке более интеллектуальных и устойчивых систем Vision AI. В частности, одной из растущих тенденций является использование гибридных подходов, которые сочетают в себе обучение с небольшим количеством примеров (few-shot learning), обучение с нулевым количеством примеров (zero-shot learning) и transfer learning. Объединяя сильные стороны этих методов, модели могут осваивать новые задачи с минимальным объемом данных и применять свои знания в различных областях.

Интересным примером является использование адаптированных глубоких вложений для точной настройки моделей с использованием знаний из предыдущих задач и небольшого количества новых данных, что упрощает работу с ограниченными наборами данных. 

Аналогично, X-shot learning предназначен для обработки задач с разным объемом данных. Он использует слабое обучение (weak supervision), когда модели учатся на ограниченных или зашумленных метках, и четкие инструкции, чтобы помочь им быстро адаптироваться, даже при наличии небольшого количества или отсутствии предварительных примеров. Эти гибридные подходы показывают, как интеграция различных методов обучения может помочь системам искусственного интеллекта более эффективно решать задачи.

Основные выводы

Few-shot learning, zero-shot learning и transfer learning решают конкретные задачи в компьютерном зрении, что делает их подходящими для разных задач. Правильный подход зависит от конкретного приложения и объема доступных данных. Например, few-shot learning хорошо работает с ограниченными данными, а zero-shot learning отлично подходит для работы с невидимыми или незнакомыми классами.

Заглядывая в будущее, вероятно, основным направлением станет объединение этих методов для создания гибридных моделей, которые интегрируют зрение, язык и звук. Эти достижения направлены на то, чтобы сделать системы искусственного интеллекта более гибкими, эффективными и способными решать сложные проблемы, открывая новые возможности для инноваций в этой области.

Узнайте больше об ИИ, присоединившись к нашему сообществу и посетив наш репозиторий на GitHub. Узнайте, как ИИ в самоуправляемых автомобилях и компьютерное зрение в сельском хозяйстве меняют будущее. Ознакомьтесь с доступными вариантами лицензии YOLO, чтобы начать работу!

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно
Ссылка скопирована в буфер обмена