Активное обучение ускоряет разработку компьютерного зрения

Абирами Вина

3 мин. чтения

23 января 2025 г.

Узнайте, как активное обучение используется в компьютерном зрении для минимизации усилий по аннотированию и изучите его реальное применение в различных отраслях.

Обучение модели компьютерного зрения во многом похоже на обучение ребенка распознаванию цветов. Сначала вам понадобится коллекция цветных объектов. Затем нужно научить ребенка правильно определять каждый цвет - задача, которая часто занимает много времени и повторяется.

Как ребенку для обучения необходимо множество примеров, так и модели зрения нужен большой набор помеченных данных для распознавания паттернов и объектов на изображениях. Однако маркировка огромного количества данных требует много времени и усилий, не говоря уже о ресурсах. Такие техники, как активное обучение, могут упростить этот процесс.

Активное обучение - это поэтапный процесс, в ходе которого из большого набора данных выбираются и маркируются наиболее важные данные. Модель учится на этих помеченных данных, что делает ее более точной и эффективной. Сосредоточение внимания только на наиболее ценных данных сокращает объем необходимых меток и ускоряет разработку модели.

В этой статье мы рассмотрим, как активное обучение помогает в обучении модели, снижает затраты на маркировку и повышает общую точность модели.

Наборы данных изображений нелегко создавать

Наборы данных являются основой для моделей компьютерного зрения и глубокого обучения. Такие популярные наборы данных, как ImageNet, содержат миллионы изображений с различными категориями объектов. Однако создание и поддержка таких огромных объемов высококачественных наборов данных сопряжено с различными трудностями. 

Например, сбор и маркировка данных требуют времени, ресурсов и квалифицированных аннотаторов, что делает процесс сложным в зависимости от конкретного приложения. Чтобы соответствовать растущему спросу на наборы данных изображений, необходимы инновационные и более эффективные решения, и именно на это нацелено активное обучение. 

Активное обучение предлагает идеальное решение, оптимизируя процесс маркировки данных. Стратегически выбирая наиболее информативные точки данных для аннотации, активное обучение максимизирует производительность модели, минимизируя усилия по маркировке. 

Что такое активное обучение?

Активное обучение - это итеративный метод машинного обучения, при котором модель выбирает наиболее важные точки данных для маркировки из большого набора немаркированных данных. Эти отобранные точки данных маркируются вручную и добавляются в обучающий набор данных. 

Затем модель переобучается на обновленном наборе данных и выбирает следующий набор точек данных для маркировки. Этот процесс повторяется, при этом модель постоянно совершенствуется, фокусируясь на наиболее информативных точках данных. Цикл продолжается до тех пор, пока модель не достигнет желаемой точности или не будет соответствовать заранее заданным критериям маркировки.

__wf_reserved_inherit
Рис. 1. Обзор активного обучения.

Понимание того, как работает активное обучение

Возможно, вам интересно, как метод активного обучения решает, какие точки данных нуждаются в ручной маркировке, а какие - в следующей. Давайте поймем, как работает активное обучение, сравнив его с подготовкой к тесту - вы сосредотачиваетесь на темах, в которых не уверены, а также стараетесь охватить множество предметов, чтобы быть хорошо подготовленным.

Для начального набора процессов отбора данных активное обучение использует такие стратегии, как выборка неопределенности и выборка на основе разнообразия. Выборка на основе неопределенности отдает предпочтение точкам данных, в которых модель наименее уверена в своих предсказаниях, стремясь повысить точность в сложных случаях. Выборка, основанная на разнообразии, выбирает точки данных, которые охватывают широкий диапазон характеристик, обеспечивая хорошее обобщение модели на невидимые данные за счет воздействия на нее различных примеров.

__wf_reserved_inherit
Рис. 2. Выборка на основе неопределенности (слева) и выборка на основе разнообразия (справа).

После первоначального отбора данных активное обучение использует два основных подхода к маркировке: выборка на основе пула и выборка на основе потока. Они похожи на то, как учитель помогает ученику сосредоточиться на самом важном. 

При выборке на основе пула модель сканирует большой пул неразмеченных данных и выбирает наиболее сложные или информативные примеры для маркировки, подобно тому, как студент расставляет приоритеты между наиболее трудными для него флеш-картами. Что касается выборки на основе потока, то модель обрабатывает данные по мере их поступления, решая, пометить их или пропустить, подобно тому, как студент обращается за помощью только в случае затруднения. В обоих случаях помеченные данные добавляются в обучающий набор, и модель переобучается, неуклонно совершенствуясь с каждой итерацией.

Изучение возможностей применения активного обучения

Активное обучение играет ключевую роль в приложениях компьютерного зрения, таких как медицинская визуализация и автономное вождение, повышая точность моделей и оптимизируя процесс маркировки данных. Интересный пример - модели компьютерного зрения, используемые в самоуправляемых автомобилях для обнаружения пешеходов или объектов в условиях недостаточной освещенности или тумана. Активное обучение может повысить точность моделирования, сосредоточившись на разнообразных и сложных сценариях вождения. 

В частности, активное обучение можно использовать для выявления неопределенных данных или кадров из таких сценариев для выборочной маркировки. Добавление таких помеченных примеров в обучающий набор позволяет модели лучше распознавать пешеходов и объекты в сложных условиях, например при неблагоприятной погоде или вождении в ночное время.

Например, NVIDIA использовала активное обучение для улучшения обнаружения пешеходов в ночное время в своих моделях автономного вождения. Благодаря стратегическому выбору наиболее информативных данных для обучения, особенно в сложных сценариях, производительность модели значительно увеличивается.

__wf_reserved_inherit
Рис. 3. Обнаружение пешехода с зонтиком с помощью активного обучения.

Активное обучение позволяет сократить расходы на маркировку

Еще один ключевой аспект активного обучения - его потенциал для снижения затрат на маркировку. Оно позволяет сосредоточиться только на наиболее важных точках данных, вместо того чтобы требовать аннотации для всего набора данных. Такой целенаправленный подход экономит время, усилия и деньги. Активное обучение позволяет сократить количество необходимых аннотаций, сохраняя при этом высокую точность модели.

Исследования показывают, что активное обучение позволяет сократить расходы на маркировку на 40-60 % без снижения производительности. Это особенно полезно в таких отраслях, как здравоохранение и производство, где маркировка данных требует больших затрат. Упрощая процесс аннотирования, активное обучение помогает предприятиям быстрее разрабатывать модели и эффективнее их внедрять, сохраняя при этом точность.

Преимущества активного обучения

Вот некоторые другие ключевые преимущества активного обучения:

  • Устранение дисбаланса классов: Активное обучение может помочь решить проблему дисбаланса классов путем маркировки экземпляров из меньшинства классов данных. Модель может работать лучше в редких сценариях с ограниченными данными.
  • Ускоренные циклы разработки: Маркировка меньшего количества данных косвенно означает ускорение процесса разработки моделей машинного обучения и компьютерного зрения, позволяя получить больше времени и ресурсов для дополнительных итераций и экспериментов.
  • Адаптивность: Он может непрерывно улучшать обучающие данные путем итераций на неопределенных или крайних примерах, что делает его хорошо подходящим для динамичных или развивающихся наборов данных.

Активное обучение и AutoML могут работать вместе

Автоматизированное машинное обучение (AutoML) направлено на автоматизацию трудоемких и итеративных задач, связанных с построением и развертыванием моделей машинного обучения. Он упрощает рабочие процессы машинного обучения, автоматизируя такие задачи, как выбор модели и оценка производительности, чтобы сократить необходимость в ручном труде. 

При интеграции с активным обучением AutoML позволяет ускорить и оптимизировать жизненный цикл разработки модели. Компонент активного обучения стратегически выбирает наиболее информативные точки данных для маркировки, а AutoML совершенствует модель, автоматизируя выбор архитектуры, параметров и настройку.

__wf_reserved_inherit
Рис. 4. Рабочий процесс AutoML.

Давайте разберемся в этом сочетании технологий на примере. 

Допустим, вы пытаетесь обнаружить редкие заболевания в медицинской визуализации (случай использования, когда наборы данных с метками ограничены и дорогостоящи). Активное обучение может выявить и отобрать неопределенные данные, такие как тонкие изменения на рентгеновских снимках, которые модель не смогла классифицировать. Затем эти неопределенные данные могут быть определены в качестве приоритетных для ручной аннотации, чтобы улучшить понимание модели. 

Получив аннотированные данные, AutoML может оптимизировать модель, исследуя различные архитектуры, гиперпараметры и другие методы дополнения данных. Итеративный процесс ускоряет разработку надежных моделей зрения, таких как Ultralytics YOLO11, которые помогают медицинским работникам ставить точные диагнозы.

Проблемы активного обучения

Активное обучение и его методы дают множество преимуществ, но есть несколько соображений, которые следует учитывать при внедрении этих стратегий:

  • Выбор стратегии запросов: Активное обучение включает в себя множество методов, и выбор наилучшего из них существенно влияет на эффективность модели. Выбор неподходящей стратегии может снизить эффективность модели для конкретного приложения.
  • Затраты на переобучение: Итерационный характер активного обучения требует дорогостоящих вычислительных ресурсов, особенно для больших наборов данных. Модель переобучается после каждого раунда маркировки, что увеличивает ее сложность.
  • Качество исходной модели: Эффективность активного обучения зависит от качества исходной модели. Плохо работающая начальная модель может неточно определить информативные точки данных, что приведет к некачественным запросам меток и снижению общей производительности.

Путь вперед для активного обучения и AutoML

С учетом последних достижений в области ИИ и компьютерного зрения активное обучение призвано решать все более сложные задачи и оптимизировать рабочие процессы машинного обучения. Сочетание активного обучения с такими техниками, как объединенное обучение и самоконтроль, может еще больше повысить эффективность и масштабируемость моделей технического зрения. 

Федеративное обучение позволяет обучать модель на нескольких устройствах или серверах с помощью распределенной структуры, не требуя, чтобы данные покидали свое исходное местоположение. Если рассматривать такие отрасли, как здравоохранение, где конфиденциальность данных имеет большое значение, то федеративное обучение позволяет проводить обучение непосредственно на конфиденциальных локальных данных, сохраняя их в безопасности. Вместо того чтобы делиться необработанными данными, передаются только обновления модели или ее выводы, что обеспечивает защиту частной информации и при этом способствует процессу обучения.

Самостоятельное обучение позволяет снизить потребность в меченых данных за счет предварительного обучения моделей на немеченых данных. Этот процесс создает прочную основу для модели. Активное обучение может опираться на нее, определяя и выбирая наиболее важные точки данных для аннотирования человеком, что способствует дальнейшему совершенствованию модели.

От активного обучения к активному воздействию

Активное обучение - это практический способ решения основных проблем компьютерного зрения, таких как высокая стоимость аннотирования данных и необходимость создания более точных моделей. Сосредоточившись на маркировке только наиболее ценных точек данных, оно позволяет сократить усилия, требуемые от человека, и одновременно повысить производительность модели.

В сочетании с такими технологиями, как AutoML, активное обучение упрощает разработку моделей, автоматизируя трудоемкие задачи. По мере дальнейшего развития активное обучение станет важным инструментом для создания более умных и эффективных систем компьютерного зрения.

Изучите наш репозиторий GitHub и присоединяйтесь к нашему сообществу, чтобы узнать больше об искусственном интеллекте и моделях компьютерного зрения. На страницах наших решений вы найдете другие области применения компьютерного зрения в производстве и здравоохранении. Вы также можете ознакомиться с нашими вариантами лицензирования, чтобы начать свой путь к ИИ в области компьютерного зрения уже сегодня.

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена