Руководство по обучению с помощью нескольких, нуля и трансфера

Системы искусственного интеллекта (ИИ) могут справляться со сложными задачами, такими как распознавание лиц, классификация изображений и вождение автомобилей с минимальным участием человека. Они делают это, изучая данные, распознавая закономерности и используя эти закономерности для прогнозирования или принятия решений. По мере развития ИИ мы наблюдаем все более сложные способы, с помощью которых модели ИИ могут учиться, адаптироваться и выполнять задачи с замечательной эффективностью.

Например, компьютерное зрение — это отрасль ИИ, которая фокусируется на том, чтобы дать машинам возможность интерпретировать и понимать визуальную информацию из мира. Традиционная разработка моделей компьютерного зрения в значительной степени зависит от больших, аннотированных наборов данных для обучения. Сбор и маркировка таких данных могут быть трудоемкими и дорогостоящими.

Чтобы справиться с этими проблемами, исследователи представили инновационные подходы, такие как обучение с малым количеством примеров (FSL), которое учится на ограниченном количестве примеров; обучение с нулевым количеством примеров (ZSL), которое идентифицирует невидимые объекты; и перенос обучения (TL), который применяет знания из предварительно обученных моделей к новым задачам.

В этой статье мы рассмотрим, как работают эти парадигмы обучения, выделим их ключевые различия и рассмотрим реальные приложения. Давайте начнем!

Обзор парадигм обучения

Давайте рассмотрим, что такое обучение с малым количеством примеров, обучение с нулевым количеством примеров и перенос обучения в отношении компьютерного зрения и как они работают.

Обучение с малым количеством примеров

Обучение с малым количеством примеров — это метод, при котором системы учатся распознавать новые объекты, используя лишь небольшое количество примеров. Например, если вы покажете модели несколько изображений пингвина, пеликана и тупика (эта небольшая группа называется «набором поддержки»), она узнает, как выглядят эти птицы.

Позже, если вы покажете модели новое изображение, например, пингвина, она сравнит это новое изображение с изображениями в своем наборе поддержки и выберет наиболее близкое соответствие. Когда сбор большого количества данных затруднен, этот метод полезен, поскольку система все еще может учиться и адаптироваться, имея лишь несколько примеров.

__wf_reserved_inherit — Рис. 1. Обзор того, как работает обучение с малым количеством примеров.

‍

Zero-shot learning (Обучение с нулевым количеством примеров)

Zero-shot learning (Обучение с нулевым количеством примеров) — это метод, позволяющий машинам распознавать объекты, которые они никогда раньше не видели, без необходимости в примерах. Он использует семантическую информацию, такую как описания, для установления связей.

Например, если машина изучила таких животных, как кошки, львы и лошади, понимая такие признаки, как «маленький и пушистый», «большая дикая кошка» или «длинное лицо», она может использовать эти знания для идентификации нового животного, например, тигра. Даже если она никогда раньше не видела тигра, она может использовать описание, например, «животное, похожее на льва, с темными полосами», чтобы правильно его идентифицировать. Это упрощает машинам обучение и адаптацию без необходимости в большом количестве примеров.

‍

Transfer learning (Трансферное обучение)

Transfer learning (Трансферное обучение) — это парадигма обучения, в которой модель использует знания, полученные при выполнении одной задачи, для решения аналогичной новой задачи. Этот метод особенно полезен в задачах компьютерного зрения, таких как обнаружение объектов, классификация изображений и распознавание образов.

Например, в компьютерном зрении предварительно обученная модель может распознавать общие объекты, такие как животные, а затем быть точно настроена с помощью трансферного обучения для идентификации конкретных, таких как различные породы собак. Благодаря повторному использованию знаний, полученных при выполнении предыдущих задач, трансферное обучение упрощает обучение моделей компьютерного зрения на небольших наборах данных, экономя время и усилия.

‍

Вам может быть интересно, какие модели поддерживают трансферное обучение. Ultralytics YOLO11 является отличным примером модели компьютерного зрения, которая может это делать. Это современная модель обнаружения объектов, которая сначала предварительно обучается на большом общем наборе данных. После этого ее можно доработать и обучить на меньшем специализированном наборе данных для решения конкретных задач.

Сравнение парадигм обучения

Теперь, когда мы поговорили о few-shot learning (обучении с небольшим количеством примеров), zero-shot learning (обучении с нулевым количеством примеров) и transfer learning (трансферном обучении), давайте сравним их, чтобы увидеть, чем они отличаются.

‍

Few-shot learning (Обучение с небольшим количеством примеров) полезно, когда у вас есть лишь небольшое количество размеченных данных. Оно позволяет AI-модели учиться всего на нескольких примерах. Zero-shot learning (Обучение с нулевым количеством примеров), с другой стороны, не требует никаких размеченных данных. Вместо этого оно использует описания или контекст, чтобы помочь системе справиться с новыми задачами. Между тем, transfer learning (трансферное обучение) использует другой подход, применяя знания из предварительно обученных моделей, что позволяет им быстро адаптироваться к новым задачам с минимальным количеством дополнительных данных. Каждый метод имеет свои сильные стороны в зависимости от типа данных и задачи, над которой вы работаете.

Применение различных парадигм обучения в реальном мире

Эти парадигмы обучения уже меняют ситуацию во многих секторах, решая сложные проблемы с помощью инновационных решений. Давайте подробнее рассмотрим, как их можно применять в реальном мире.

Диагностика редких заболеваний с помощью few-shot learning

Few-shot learning (Обучение с небольшим количеством примеров) меняет правила игры в сфере здравоохранения, особенно в медицинской визуализации. Оно может помочь врачам диагностировать редкие заболевания, используя всего несколько примеров или даже описаний, без необходимости в больших объемах данных. Это особенно полезно, когда данные ограничены, что часто бывает, поскольку сбор больших наборов данных для редких заболеваний может быть сложным.

Например, SHEPHERD использует few-shot learning (обучение с небольшим количеством примеров) и биомедицинские графы знаний для диагностики редких генетических заболеваний. Он сопоставляет информацию о пациенте, такую как симптомы и результаты анализов, с сетью известных генов и заболеваний. Это помогает точно определить вероятную генетическую причину и найти похожие случаи, даже когда данных мало.

‍

Улучшение обнаружения болезней растений с помощью zero-shot learning

В сельском хозяйстве быстрая идентификация болезней растений имеет важное значение, поскольку задержки в обнаружении могут привести к широко распространенному повреждению посевов, снижению урожайности и значительным финансовым потерям. Традиционные методы часто опираются на большие наборы данных и экспертные знания, которые не всегда могут быть доступны, особенно в отдаленных или ограниченных в ресурсах районах. Именно здесь вступают в игру достижения в области искусственного интеллекта, такие как zero-shot learning (обучение с нулевым количеством примеров).

Допустим, фермер выращивает помидоры и картофель и замечает такие симптомы, как пожелтение листьев или бурые пятна. Обучение на нулевых снимках может помочь выявить такие заболевания, как поздняя пятнистость, не требуя больших массивов данных. Используя описания симптомов, модель может classify заболевания, с которыми она раньше не сталкивалась. Этот подход быстро масштабируется и позволяет фермерам detect различные проблемы с растениями. Он помогает им более эффективно следить за состоянием посевов, своевременно принимать меры и сокращать потери.

‍

Автономные транспортные средства и трансферное обучение

Автономным транспортным средствам часто необходимо адаптироваться к различным условиям окружающей среды, чтобы безопасно перемещаться. Transfer learning (Трансферное обучение) помогает им использовать предварительные знания для быстрой адаптации к новым условиям, не начиная обучение с нуля. В сочетании с компьютерным зрением, которое помогает транспортным средствам интерпретировать визуальную информацию, эти технологии обеспечивают более плавную навигацию по различным местностям и погодным условиям, что делает автономное вождение более эффективным и надежным.

Хорошим примером этого является система управления парковкой, которая использует Ultralytics YOLO11 для мониторинга парковочных мест. YOLO11, предварительно обученная модель обнаружения объектов, может быть точно настроена с помощью трансферного обучения для определения пустых и занятых парковочных мест в режиме реального времени. Благодаря обучению модели на небольшом наборе данных изображений парковок, она учится точно detect свободные места, заполненные места и даже зарезервированные зоны.

‍

Интегрированная с другими технологиями, эта система может направлять водителей к ближайшему свободному месту, помогая сократить время поиска и уменьшить количество пробок на дорогах. Трансферное обучение делает это возможным, опираясь на существующие возможности YOLO11по обнаружению объектов, что позволяет ей адаптироваться к специфическим потребностям управления парковками без необходимости начинать работу с нуля. Такой подход позволяет экономить время и ресурсы, создавая высокоэффективное и масштабируемое решение, которое улучшает работу парковок и повышает общий уровень обслуживания пользователей.

Новые тенденции в парадигмах обучения

Будущее парадигм обучения в компьютерном зрении склоняется к разработке более интеллектуальных и устойчивых систем Vision AI. В частности, одной из растущих тенденций является использование гибридных подходов, которые сочетают в себе обучение с небольшим количеством примеров (few-shot learning), обучение с нулевым количеством примеров (zero-shot learning) и transfer learning. Объединяя сильные стороны этих методов, модели могут осваивать новые задачи с минимальным объемом данных и применять свои знания в различных областях.

Интересным примером является использование адаптированных глубоких вложений для точной настройки моделей с использованием знаний из предыдущих задач и небольшого количества новых данных, что упрощает работу с ограниченными наборами данных.

Аналогично, X-shot learning предназначен для обработки задач с разным объемом данных. Он использует слабое обучение (weak supervision), когда модели учатся на ограниченных или зашумленных метках, и четкие инструкции, чтобы помочь им быстро адаптироваться, даже при наличии небольшого количества или отсутствии предварительных примеров. Эти гибридные подходы показывают, как интеграция различных методов обучения может помочь системам искусственного интеллекта более эффективно решать задачи.

Основные выводы

Few-shot learning, zero-shot learning и transfer learning решают конкретные задачи в компьютерном зрении, что делает их подходящими для разных задач. Правильный подход зависит от конкретного приложения и объема доступных данных. Например, few-shot learning хорошо работает с ограниченными данными, а zero-shot learning отлично подходит для работы с невидимыми или незнакомыми классами.

Заглядывая в будущее, вероятно, основным направлением станет объединение этих методов для создания гибридных моделей, которые интегрируют зрение, язык и звук. Эти достижения направлены на то, чтобы сделать системы искусственного интеллекта более гибкими, эффективными и способными решать сложные проблемы, открывая новые возможности для инноваций в этой области.

Узнайте больше об искусственном интеллекте, присоединившись к нашему сообществу и ознакомившись с нашим репозиторием на GitHub. Узнайте, как ИИ в самоуправляемых автомобилях и компьютерное зрение в сельском хозяйстве меняют будущее. Ознакомьтесь с доступными вариантами лицензииYOLO , чтобы начать работу!

Понимание обучения с малым количеством примеров, обучением с нулевым количеством примеров и переноса обучения

Обзор парадигм обучения

Обучение с малым количеством примеров

Zero-shot learning (Обучение с нулевым количеством примеров)

Transfer learning (Трансферное обучение)

Сравнение парадигм обучения

Применение различных парадигм обучения в реальном мире

Диагностика редких заболеваний с помощью few-shot learning

Улучшение обнаружения болезней растений с помощью zero-shot learning

Автономные транспортные средства и трансферное обучение

Новые тенденции в парадигмах обучения

Основные выводы

Читать больше в этой категории

Что такое дистилляция наборов данных? Краткий обзор

Самостоятельное обучение для удаления шумов: пошаговое разъяснение

Что такое сопоставление изображений в Vision AI? Краткое введение

Давайте строить будущее
ИИ вместе!

Понимание обучения с малым количеством примеров, обучением с нулевым количеством примеров и переноса обучения

Обзор парадигм обучения

Обучение с малым количеством примеров

Zero-shot learning (Обучение с нулевым количеством примеров)

Transfer learning (Трансферное обучение)

Сравнение парадигм обучения

Применение различных парадигм обучения в реальном мире

Диагностика редких заболеваний с помощью few-shot learning

Улучшение обнаружения болезней растений с помощью zero-shot learning

Автономные транспортные средства и трансферное обучение

Новые тенденции в парадигмах обучения

Основные выводы

Читать больше в этой категории

Что такое дистилляция наборов данных? Краткий обзор

Самостоятельное обучение для удаления шумов: пошаговое разъяснение

Что такое сопоставление изображений в Vision AI? Краткое введение

Давайте строить будущее ИИ вместе!

Давайте строить будущее
ИИ вместе!