Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Активное обучение ускоряет разработку компьютерного зрения

Абирами Вина

3 мин чтения

23 января 2025 г.

Узнайте, как активное обучение используется в компьютерном зрении для минимизации усилий по аннотированию, и изучите его реальные приложения в различных отраслях.

Обучение модели компьютерного зрения очень похоже на обучение ребенка распознаванию цветов. Во-первых, вам понадобится коллекция цветных объектов. Затем вы должны будете научить ребенка правильно определять каждый цвет, что часто является трудоемкой и повторяющейся задачей.

Подобно тому, как ребенку нужно много примеров для обучения, модели машинного зрения нужен большой набор размеченных данных, чтобы распознавать закономерности и объекты на изображениях. Однако маркировка огромных объемов данных требует много времени, усилий и ресурсов. Такие методы, как активное обучение, могут помочь упростить этот процесс.

Активное обучение — это поэтапный процесс, при котором выбираются и маркируются наиболее важные данные из большого набора данных. Модель обучается на этих размеченных данных, что делает ее более точной и эффективной. Сосредоточение внимания только на наиболее ценных данных сокращает объем необходимой маркировки и ускоряет разработку модели.

В этой статье мы рассмотрим, как активное обучение помогает в обучении моделей, снижает затраты на маркировку и повышает общую точность модели.

Наборы данных изображений нелегко создать

Наборы данных являются основой для моделей компьютерного зрения и глубокого обучения. Такие популярные наборы данных, как ImageNet содержат миллионы изображений с различными категориями объектов. Однако создание и поддержка таких огромных объемов высококачественных наборов данных сопряжено с различными трудностями. 

Например, сбор и маркировка данных требуют времени, ресурсов и квалифицированных аннотаторов, что делает этот процесс сложным в зависимости от конкретного приложения. Необходимы инновационные и более эффективные решения, чтобы не отставать от растущего спроса на наборы изображений, и именно эту задачу решает активное обучение. 

Активное обучение предлагает идеальное решение, оптимизируя процесс разметки данных. Стратегически выбирая наиболее информативные точки данных для аннотации, активное обучение максимизирует производительность модели, минимизируя усилия по разметке. 

Что такое активное обучение?

Активное обучение — это итеративный метод машинного обучения, при котором модель выбирает наиболее важные точки данных для разметки из большого пула неразмеченных данных. Эти отобранные точки данных размечаются вручную и добавляются в обучающий набор данных. 

Затем модель переобучается на обновленном наборе данных и выбирает следующий набор точек данных для маркировки. Этот процесс повторяется, при этом модель постоянно совершенствуется, сосредотачиваясь на наиболее информативных точках данных. Цикл продолжается до тех пор, пока модель не достигнет желаемой точности или не выполнит критерии маркировки, установленные заранее.

__wf_reserved_inherit
Рис. 1. Обзор активного обучения.

Понимание принципов работы активного обучения

Вам может быть интересно, как метод активного обучения решает, какие точки данных нуждаются в ручной разметке и какие из них следует разметить следующими. Давайте разберемся, как работает активное обучение, сравнив его с подготовкой к тесту — вы сосредотачиваетесь на темах, в которых не уверены, а также обязательно охватываете различные предметы, чтобы быть хорошо подготовленным.

Для начального набора процессов выбора данных активное обучение использует такие стратегии, как выборка неопределенности и выборка на основе разнообразия. Выборка неопределенности отдает приоритет точкам данных, в которых модель наименее уверена в своих прогнозах, стремясь повысить точность в сложных случаях. Выборка на основе разнообразия выбирает точки данных, которые охватывают широкий спектр характеристик, гарантируя, что модель хорошо обобщается на невидимые данные, предоставляя ей разнообразные примеры.

__wf_reserved_inherit
Рис. 2. Выборка на основе неопределенности (слева) и выборка на основе разнообразия (справа).

После первоначального отбора данных активное обучение использует два основных подхода к разметке: выборку на основе пула и выборку на основе потока, которые аналогичны тому, как учитель помогает ученику сосредоточиться на самом важном. 

При выборке на основе пула модель сканирует большой пул немаркированных данных и выбирает наиболее сложные или информативные примеры для маркировки, подобно тому, как студент отдает приоритет карточкам, которые кажутся ему самыми сложными. Что касается выборки на основе потока, модель обрабатывает данные по мере их поступления, решая, маркировать их или пропустить, подобно тому, как студент просит о помощи только тогда, когда он застрял. В обоих случаях маркированные данные добавляются в набор данных для обучения, и модель переобучается, неуклонно улучшаясь с каждой итерацией.

Изучение применения активного обучения

Активное обучение играет ключевую роль в приложениях компьютерного зрения, таких как медицинская визуализация и автономное вождение, повышая точность моделей и оптимизируя процесс маркировки данных. Интересный пример - модели компьютерного зрения, используемые в самоуправляемых автомобилях для detect пешеходов или объектов в условиях недостаточной освещенности или тумана. Активное обучение может повысить точность моделирования, сосредоточившись на разнообразных и сложных сценариях вождения. 

В частности, активное обучение можно использовать для выявления ненадежных данных или кадров из таких сценариев для выборочной маркировки. Добавление этих маркированных примеров в набор данных для обучения позволяет модели лучше распознавать пешеходов и объекты в сложных условиях, например, во время неблагоприятной погоды или в ночное время.

Например, NVIDIA использовала активное обучение для улучшения обнаружения пешеходов в ночное время в своих моделях автономного вождения. Благодаря стратегическому выбору наиболее информативных данных для обучения, особенно в сложных сценариях, производительность модели значительно увеличивается.

__wf_reserved_inherit
Рис. 3. Обнаружение пешехода с зонтом с использованием активного обучения.

Активное обучение может снизить затраты на маркировку

Еще одним ключевым аспектом активного обучения является его потенциал снижения затрат на маркировку. Это достигается за счет сосредоточения внимания только на наиболее важных точках данных, вместо того чтобы требовать аннотации для всего набора данных. Такой целевой подход экономит время, усилия и деньги. Сосредоточиваясь на неопределенных или разнообразных образцах, активное обучение сокращает количество необходимых аннотаций, сохраняя при этом высокую точность модели.

Исследования показывают, что активное обучение может сократить расходы на маркировку на 40-60% без ущерба для производительности. Это особенно полезно в таких отраслях, как здравоохранение и производство, где маркировка данных обходится дорого. Упрощая процесс аннотирования, активное обучение помогает предприятиям быстрее разрабатывать модели и более эффективно развертывать их, сохраняя при этом точность.

Преимущества активного обучения

Вот некоторые другие ключевые преимущества, которые может предложить активное обучение:

  • Устранение дисбаланса классов: Активное обучение может помочь решить проблемы дисбаланса классов путем маркировки экземпляров из классов данных меньшинства. Модель может лучше работать в редких сценариях с ограниченными данными.
  • Более быстрые циклы разработки: Маркировка меньшего количества данных косвенно означает ускорение процесса разработки моделей машинного обучения и компьютерного зрения, что позволяет выделить больше времени и ресурсов для дополнительных итераций и экспериментов.
  • Адаптируемость: Он может непрерывно улучшать данные обучения, итеративно обрабатывая неопределенные или пограничные примеры, что делает его хорошо подходящим для динамических или развивающихся наборов данных.

Активное обучение и AutoML могут работать вместе

Автоматизированное машинное обучение (AutoML) фокусируется на автоматизации трудоемких и итеративных задач, связанных с созданием и развертыванием моделей машинного обучения. Оно упрощает рабочие процессы машинного обучения, автоматизируя такие задачи, как выбор модели и оценка производительности, чтобы уменьшить необходимость ручного труда. 

При интеграции с активным обучением, AutoML может ускорить и оптимизировать жизненный цикл разработки модели. Компонент активного обучения стратегически выбирает наиболее информативные точки данных для маркировки, в то время как AutoML уточняет модель, автоматизируя выбор архитектуры, параметров и настройки.

__wf_reserved_inherit
Рис. 4. Рабочий процесс AutoML.

Давайте разберемся в этой комбинации технологий на примере. 

Допустим, вы пытаетесь detect редкие заболевания в медицинской визуализации (случай использования, когда наборы данных с метками ограничены и дорогостоящи). Активное обучение может выявить и отобрать неопределенные данные, такие как тонкие изменения на рентгеновских снимках, которые модель не смогла classify. Затем эти неопределенные данные могут быть определены в качестве приоритетных для ручной аннотации, чтобы улучшить понимание модели. 

Получив аннотированные данные, AutoML может оптимизировать модель, исследуя различные архитектуры, гиперпараметры и другие методы дополнения данных. Итеративный процесс ускоряет разработку надежных моделей зрения, таких как Ultralytics YOLO11 которые помогают медицинским работникам ставить точные диагнозы.

Проблемы активного обучения

Активное обучение и его методы предлагают многочисленные преимущества, но есть несколько моментов, которые следует учитывать при реализации этих стратегий:

  • Выбор стратегии запроса: Активное обучение включает в себя множество методов, и выбор наилучшего метода значительно влияет на эффективность модели. Выбор неподходящей стратегии может снизить производительность модели для конкретного приложения.
  • Затраты на переобучение: Итеративный характер активного обучения требует дорогостоящих вычислительных ресурсов, особенно для больших наборов данных. Модель переобучается после каждого раунда маркировки, что увеличивает ее сложность.
  • Начальное качество модели: Эффективность активного обучения зависит от качества начальной модели. Плохо работающая начальная модель может неточно идентифицировать информативные точки данных, что приведет к некачественным запросам на маркировку и снижению общей производительности.

Перспективы активного обучения и AutoML

Благодаря последним достижениям в области AI и компьютерного зрения, активное обучение готово решать более сложные задачи и оптимизировать рабочие процессы машинного обучения. Объединение активного обучения с такими методами, как федеративное обучение и самообучение, может еще больше повысить эффективность и масштабируемость моделей зрения. 

Федеративное обучение позволяет обучать модель на нескольких устройствах или серверах с использованием распределенной структуры, не требуя, чтобы данные покидали свое первоначальное местоположение. В таких отраслях, как здравоохранение, где важна конфиденциальность данных, федеративное обучение позволяет обучать модель непосредственно на конфиденциальных локальных данных, сохраняя их в безопасности. Вместо обмена необработанными данными передаются только обновления модели или аналитические данные, что гарантирует защиту личной информации и в то же время способствует процессу обучения.

Между тем, самообучение помогает снизить потребность в размеченных данных путем предварительного обучения моделей на неразмеченных данных. Этот процесс создает прочную основу для модели. Затем активное обучение может развить это, выявляя и выбирая наиболее важные точки данных для ручной аннотации, что еще больше улучшает модель.

От активного обучения к активному воздействию

Активное обучение предоставляет практический способ решения основных задач в компьютерном зрении, таких как высокая стоимость аннотации данных и потребность в более точных моделях. Сосредоточившись на разметке только самых ценных точек данных, оно снижает усилия, требуемые от людей, и повышает производительность модели.

В сочетании с такими технологиями, как AutoML, активное обучение оптимизирует разработку моделей, автоматизируя трудоемкие задачи. По мере развития, активное обучение станет важным инструментом для создания более интеллектуальных и эффективных систем компьютерного зрения.

Посетите наш репозиторий GitHub и присоединяйтесь к нашему сообществу, чтобы узнать больше об ИИ и моделях компьютерного зрения. Узнайте больше о применении компьютерного зрения в производстве и здравоохранении на страницах наших решений. Вы также можете ознакомиться с нашими вариантами лицензирования, чтобы начать свой путь в Vision AI уже сегодня.

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно