Понимание обучения с несколькими выстрелами, нулевого выстрела и переноса

Абирами Вина

5 минут чтения

29 января 2025 г.

Изучите различия между обучением с несколькими выстрелами, обучением с нулевыми выстрелами и трансферным обучением в компьютерном зрении и то, как эти парадигмы формируют обучение моделей ИИ.

Системы искусственного интеллекта (ИИ) могут решать такие сложные задачи, как распознавание лиц, классификация изображений и управление автомобилями, при минимальном участии человека. Для этого они изучают данные, распознают закономерности и используют их для принятия прогнозов и решений. По мере развития искусственного интеллекта мы наблюдаем все более сложные способы, с помощью которых модели ИИ могут обучаться, адаптироваться и выполнять задачи с поразительной эффективностью.

Например, компьютерное зрение - это направление ИИ, которое фокусируется на том, чтобы дать машинам возможность интерпретировать и понимать визуальную информацию из окружающего мира. Традиционная разработка моделей компьютерного зрения в значительной степени опирается на большие аннотированные наборы данных для обучения. Сбор и маркировка таких данных могут занимать много времени и быть дорогостоящими. 

Чтобы справиться с этими проблемами, исследователи внедрили такие инновационные подходы, как обучение по нескольким снимкам (FSL), которое происходит на ограниченных примерах; обучение по нулевым снимкам (ZSL), которое идентифицирует невидимые объекты; и трансферное обучение (TL), которое применяет знания из предварительно обученных моделей к новым задачам.

В этой статье мы рассмотрим, как работают эти парадигмы обучения, выделим их ключевые различия и рассмотрим реальные способы применения. Давайте начнем!

Обзор парадигм обучения

Давайте разберемся, что такое обучение с несколькими выстрелами, обучение с нулевыми выстрелами и трансферное обучение применительно к компьютерному зрению и как они работают. 

Обучение с помощью нескольких выстрелов

Обучение по нескольким снимкам - это метод, при котором системы учатся распознавать новые объекты на небольшом количестве примеров. Например, если показать модели несколько изображений пингвина, пеликана и синицы (эта небольшая группа называется "набором опор"), она узнает, как выглядят эти птицы. 

Позже, если вы покажете модели новую картинку, например пингвина, она сравнит ее с картинками из набора поддержки и выберет наиболее подходящую. Когда собрать большой объем данных сложно, этот метод выгоден тем, что система может обучаться и адаптироваться, имея всего несколько примеров.

__wf_reserved_inherit
Рис. 1. Обзор того, как работает обучение с помощью нескольких выстрелов.

Обучение с нуля

Обучение с нуля - это способ, с помощью которого машины распознают вещи, которых они никогда раньше не видели, не нуждаясь в примерах. Для установления связей используется семантическая информация, например описания.

Например, если машина узнала о таких животных, как кошки, львы и лошади, по таким признакам, как "маленький и пушистый", "большая дикая кошка" или "длинная морда", она может использовать эти знания для определения нового животного, например тигра. Даже если машина никогда раньше не видела тигра, она сможет правильно определить его по описанию, например "львоподобное животное с темными полосами". Таким образом, машины легче обучаются и адаптируются, не нуждаясь в большом количестве примеров.

__wf_reserved_inherit
Рис. 2. Обучение с нулевого выстрела идентифицирует новые объекты с помощью описаний.

Трансферное обучение

Трансферное обучение - это парадигма обучения, при которой модель использует знания, полученные при решении одной задачи, для решения аналогичной, новой задачи. Эта техника особенно полезна при решении задач компьютерного зрения, таких как обнаружение объектов, классификация изображений и распознавание образов. 

Например, в компьютерном зрении предварительно обученная модель может распознавать общие объекты, например, животных, а затем с помощью трансферного обучения настраиваться на определение конкретных объектов, например, различных пород собак. Благодаря повторному использованию знаний, полученных при решении предыдущих задач, трансферное обучение облегчает обучение моделей компьютерного зрения на небольших наборах данных, что экономит время и силы.

__wf_reserved_inherit
Рис. 3. Обзор того, как работает трансферное обучение.

Вам может быть интересно, какие модели поддерживают трансферное обучение. Ultralytics YOLO11 - отличный пример модели компьютерного зрения, которая может это делать. Это современная модель обнаружения объектов, которая сначала предварительно обучается на большом общем наборе данных. После этого ее можно доработать и обучить на меньшем специализированном наборе данных для решения конкретных задач.

Сравнение парадигм обучения

Теперь, когда мы поговорили об обучении с несколькими выстрелами, обучении с нулевыми выстрелами и обучении с переносом, давайте сравним их и посмотрим, чем они отличаются.

__wf_reserved_inherit
Рис. 4. Основные различия между обучением с несколькими выстрелами, обучением с нулевым выстрелом и трансферным обучением Изображение автора.

Обучение на нескольких примерах полезно, когда у вас есть лишь небольшой объем помеченных данных. Оно позволяет модели ИИ обучаться всего на нескольких примерах. С другой стороны, нулевое обучение не требует никаких помеченных данных. Вместо этого он использует описания или контекст, чтобы помочь системе справиться с новыми задачами. Трансферное обучение использует другой подход, используя знания из предварительно обученных моделей, что позволяет им быстро адаптироваться к новым задачам с минимальным количеством дополнительных данных. Каждый метод имеет свои сильные стороны в зависимости от типа данных и задачи, над которой вы работаете.

Применение различных парадигм обучения в реальном мире

Эти парадигмы обучения уже приносят пользу во многих отраслях, решая сложные проблемы с помощью инновационных решений. Давайте подробнее рассмотрим, как их можно применить в реальном мире.

Диагностика редких заболеваний с помощью обучения по нескольким снимкам

Обучение с помощью нескольких снимков - это революционный шаг в сфере здравоохранения, особенно в области медицинской визуализации. Оно может помочь врачам диагностировать редкие заболевания на основе всего нескольких примеров или даже описаний, не требуя больших объемов данных. Это особенно полезно, когда данные ограничены, что часто случается, поскольку сбор больших массивов данных для редких заболеваний может быть затруднен.

Например, в программе SHEPHERD для диагностики редких генетических заболеваний используется обучение на основе нескольких снимков и графы биомедицинских знаний. Он отображает информацию о пациенте, такую как симптомы и результаты анализов, на сеть известных генов и заболеваний. Это помогает точно определить вероятную генетическую причину и найти похожие случаи, даже если данные ограничены. 

__wf_reserved_inherit
Рис. 5. Модель Shepherd диагностирует редкие заболевания, используя минимальное количество данных.

Улучшение обнаружения болезней растений с помощью обучения по нулевым снимкам

В сельском хозяйстве быстрое выявление болезней растений имеет огромное значение, поскольку задержки в их обнаружении могут привести к массовому повреждению урожая, снижению урожайности и значительным финансовым потерям. Традиционные методы часто опираются на большие массивы данных и экспертные знания, которые не всегда доступны, особенно в отдаленных или ограниченных в ресурсах районах. Именно здесь на помощь приходят достижения в области искусственного интеллекта, такие как обучение с нулевым результатом.

Допустим, фермер выращивает помидоры и картофель и замечает такие симптомы, как пожелтение листьев или бурые пятна. Обучение на нулевых снимках может помочь выявить такие заболевания, как поздняя пятнистость, не требуя больших массивов данных. Используя описания симптомов, модель может классифицировать заболевания, с которыми она раньше не сталкивалась. Этот подход является быстрым, масштабируемым и позволяет фермерам выявлять различные проблемы с растениями. Он помогает им более эффективно следить за состоянием посевов, своевременно принимать меры и сокращать потери.

__wf_reserved_inherit
Рис. 6. Использование обучения по нулевым снимкам для идентификации болезней растений.

Автономные транспортные средства и трансферное обучение

Автономным транспортным средствам часто приходится адаптироваться к различным условиям для безопасной навигации. Трансферное обучение помогает им использовать предыдущие знания, чтобы быстро адаптироваться к новым условиям, не начиная обучение с нуля. В сочетании с компьютерным зрением, которое помогает автомобилям интерпретировать визуальную информацию, эти технологии обеспечивают более плавную навигацию по различным местностям и погодным условиям, делая автономное вождение более эффективным и надежным.

Хорошим примером этого является система управления парковкой, которая использует Ultralytics YOLO11 для мониторинга парковочных мест. YOLO11, предварительно обученная модель обнаружения объектов, может быть точно настроена с помощью трансферного обучения для определения пустых и занятых парковочных мест в режиме реального времени. Благодаря обучению модели на небольшом наборе данных изображений парковок, она учится точно определять свободные места, заполненные места и даже зарезервированные зоны.

__wf_reserved_inherit
Рис. 7. Управление парковкой с помощью Ultralytics YOLO11.

Интегрированная с другими технологиями, эта система может направлять водителей к ближайшему свободному месту, помогая сократить время поиска и уменьшить количество пробок на дорогах. Трансферное обучение делает это возможным, опираясь на существующие возможности YOLO11 по обнаружению объектов, что позволяет адаптировать систему к специфическим потребностям управления парковками без необходимости начинать работу с нуля. Такой подход позволяет экономить время и ресурсы, создавая высокоэффективное и масштабируемое решение, которое улучшает работу парковок и повышает общий уровень обслуживания пользователей.

Новые тенденции в парадигмах обучения

Будущее парадигм обучения в компьютерном зрении склоняется к разработке более интеллектуальных и устойчивых систем искусственного зрения. В частности, одной из растущих тенденций является использование гибридных подходов, сочетающих обучение с несколькими выстрелами, обучение с нулевыми выстрелами и трансферное обучение. Благодаря сочетанию сильных сторон этих методов модели могут обучаться новым задачам с минимальным количеством данных и применять свои знания в различных областях.

Интересным примером является использование адаптированных глубоких вкраплений для точной настройки моделей с использованием знаний из предыдущих задач и небольшого количества новых данных, что облегчает работу с ограниченными наборами данных. 

Аналогично, обучение X-shot предназначено для решения задач с различным объемом данных. В нем используется слабый контроль, когда модели учатся на ограниченных или зашумленных метках, и четкие инструкции, помогающие им быстро адаптироваться даже при небольшом количестве или отсутствии предыдущих примеров. Эти гибридные подходы показывают, как интеграция различных методов обучения может помочь системам ИИ решать задачи более эффективно.

Основные выводы

Обучение на нескольких снимках, обучение на нулевых снимках и трансферное обучение решают специфические задачи в компьютерном зрении, поэтому они подходят для разных задач. Выбор правильного подхода зависит от конкретной задачи и объема имеющихся данных. Например, обучение по нескольким снимкам хорошо работает при ограниченном количестве данных, а обучение по нулевым снимкам отлично подходит для работы с невидимыми или незнакомыми классами.

В будущем, вероятно, ключевым направлением станет комбинирование этих методов для создания гибридных моделей, объединяющих зрение, язык и аудио. Эти достижения призваны сделать системы ИИ более гибкими, эффективными и способными решать сложные задачи, открывая новые возможности для инноваций в этой области.

Узнайте больше об искусственном интеллекте, присоединившись к нашему сообществу и ознакомившись с нашим репозиторием на GitHub. Узнайте, как ИИ в самоуправляемых автомобилях и компьютерное зрение в сельском хозяйстве меняют будущее. Ознакомьтесь с доступными вариантами лицензии YOLO, чтобы начать работу!

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена