Vision AI

Активное обучение ускоряет разработку компьютерного зрения

Узнай, как активное обучение используется в компьютерном зрении для минимизации усилий по аннотированию, и изучи его реальные применения в различных отраслях.

АБАбирами Вина

3 min readJanuary 23, 2025

Активное обучение ускоряет разработку компьютерного зрения

Обучение модели компьютерного зрения во многом похоже на обучение ребенка распознаванию цветов. Сначала тебе понадобится коллекция цветных объектов. Затем ты будешь направлять ребенка, чтобы он правильно определял каждый цвет — задача, которая часто требует много времени и повторяющихся действий.

Точно так же, как ребенку нужно много примеров для обучения, модели машинного зрения требуется большой набор размеченных данных, чтобы распознавать закономерности и объекты на изображениях. Однако разметка огромных объемов данных отнимает много времени, сил и ресурсов. Такие методы, как активное обучение, помогают упростить этот процесс.

Активное обучение — это пошаговый процесс, при котором из большого набора данных выбираются и размечаются самые важные элементы. Модель учится на этих размеченных данных, становясь более точной и эффективной. Фокус только на самых ценных данных снижает объем необходимой разметки и ускоряет разработку модели.

В этой статье мы рассмотрим, как активное обучение помогает в процессе тренировки модели, снижает расходы на разметку и повышает общую точность модели.

Link to this sectionСоздавать наборы данных для изображений непросто#

Наборы данных являются основой для моделей компьютерного зрения и глубокого обучения. Популярные наборы данных, такие как ImageNet, предлагают миллионы изображений с разнообразными категориями объектов. Однако создание и поддержка таких огромных объемов высококачественных наборов данных сопряжены с различными проблемами.

Например, сбор и разметка данных требуют времени, ресурсов и квалифицированных аннотаторов, что делает этот процесс сложным в зависимости от конкретного приложения. Необходимы инновационные и более эффективные решения, чтобы успевать за растущим спросом на image datasets, и именно это призвано решить активное обучение.

Активное обучение предлагает идеальное решение, оптимизируя процесс разметки данных. Стратегически отбирая наиболее информативные точки данных для аннотирования, активное обучение максимизирует производительность модели при минимальных затратах на разметку.

Link to this sectionЧто такое активное обучение?#

Активное обучение — это итеративная техника машинного обучения, при которой модель выбирает из большого пула неразмеченных данных наиболее важные точки для разметки. Эти выбранные точки вручную размечаются и добавляются в тренировочный набор данных.

Затем модель дообучается на обновленном наборе и выбирает следующий комплект данных для разметки. Этот процесс повторяется, при этом модель постоянно улучшается, концентрируясь на самых информативных данных. Цикл продолжается до тех пор, пока модель не достигнет желаемой точности или не выполнит критерии разметки, заданные заранее.

Обзор активного обучения

Рис. 1. Обзор активного обучения.

Link to this sectionПонимание того, как работает активное обучение#

Возможно, тебе интересно, как техника активного обучения решает, какие данные нужно разметить вручную и что делать дальше. Давай разберемся, как работает активное обучение, сравнив его с подготовкой к экзамену: ты концентрируешься на темах, в которых не уверен, и в то же время стараешься охватить разнообразие предметов, чтобы быть готовым ко всему.

Для начальных процессов выбора данных активное обучение использует такие стратегии, как сэмплирование по неопределенности (uncertainty sampling) и сэмплирование на основе разнообразия (diversity-based sampling). Сэмплирование по неопределенности отдает приоритет тем данным, в которых модель наименее уверена, что направлено на улучшение точности в сложных случаях. Сэмплирование на основе разнообразия выбирает данные, охватывающие широкий спектр характеристик, что гарантирует хорошую обобщающую способность модели на невидимых данных благодаря воздействию разнообразных примеров.

Выборка на основе неопределенности слева и выборка на основе разнообразия данных справа

Рис. 2. Сэмплирование по неопределенности (слева) и сэмплирование на основе разнообразия (справа).

После первичного отбора данных активное обучение использует два основных подхода к разметке: пуловое сэмплирование (pool-based sampling) и потоковое сэмплирование (stream-based sampling). Они похожи на то, как учитель помогает ученику сфокусироваться на самом важном.

При пуловом сэмплировании модель сканирует большой массив неразмеченных данных и выбирает самые сложные или информативные примеры для разметки, подобно ученику, который уделяет внимание самым трудным карточкам для запоминания. В случае с потоковым сэмплированием модель обрабатывает данные по мере их поступления, решая, размечать их или пропустить, что похоже на ученика, который просит помощи только тогда, когда застрял. В обоих случаях размеченные данные добавляются в обучающий набор, и модель дообучается, стабильно улучшаясь с каждой итерацией.

Link to this sectionИсследование применения активного обучения#

Активное обучение играет ключевую роль в приложениях компьютерного зрения, таких как медицинская визуализация и автономное вождение, за счет повышения точности модели и оптимизации процесса разметки данных. Интересным примером являются модели компьютерного зрения, используемые в беспилотных автомобилях для обнаружения пешеходов или объектов в условиях плохой освещенности или тумана. Активное обучение может повысить точность, фокусируясь на разнообразных и сложных сценариях вождения.

В частности, активное обучение можно использовать для идентификации неопределенных данных или кадров из таких сценариев для выборочной разметки. Добавление этих размеченных примеров в тренировочный набор помогает модели лучше распознавать пешеходов и объекты в сложных условиях, например, в плохую погоду или при ночном вождении.

Например, NVIDIA использовала активное обучение для улучшения обнаружения пешеходов ночью в своих моделях автономного вождения. Благодаря стратегическому отбору наиболее информативных данных для обучения, особенно в сложных сценариях, производительность модели существенно возрастает.

Обнаружение пешехода с зонтом с помощью активного обучения

Рис. 3. Обнаружение пешехода с зонтом с помощью активного обучения.

Link to this sectionАктивное обучение может снизить затраты на разметку#

Еще один ключевой аспект активного обучения — это его потенциал для снижения затрат на разметку. Оно делает это, фокусируясь только на самых важных точках данных, вместо того чтобы требовать аннотаций для всего набора. Такой целевой подход экономит время, силы и деньги. Сосредоточиваясь на неопределенных или разнообразных образцах, активное обучение уменьшает количество необходимых аннотаций, сохраняя при этом высокую точность модели.

Исследования показывают, что активное обучение может сократить расходы на разметку на 40-60% без потери производительности. Это особенно полезно в таких отраслях, как здравоохранение и производство, где разметка данных стоит дорого. Упрощая процесс аннотирования, активное обучение помогает компаниям быстрее разрабатывать модели и эффективнее их развертывать, поддерживая при этом точность.

Link to this sectionПреимущества активного обучения#

Вот некоторые другие ключевые преимущества, которые может предложить активное обучение:

Устранение дисбаланса классов: активное обучение может помочь решить проблемы дисбаланса классов путем разметки примеров из миноритарных классов данных. Модель может лучше работать со сценариями, где мало примеров.
Более быстрые циклы разработки: разметка меньшего объема данных косвенно означает ускорение процесса разработки моделей машинного и компьютерного зрения, что высвобождает время и ресурсы для дополнительных итераций и экспериментов.
Адаптивность: оно может постоянно улучшать обучающие данные, итерируясь на неопределенных или пограничных примерах, что делает его хорошо подходящим для динамичных или развивающихся наборов данных.

Link to this sectionАктивное обучение и AutoML могут работать вместе#

Автоматизированное машинное обучение (AutoML) фокусируется на автоматизации трудоемких и итеративных задач, связанных с созданием и развертыванием моделей машинного обучения. Оно упрощает рабочие процессы машинного обучения за счет автоматизации таких задач, как выбор модели и оценка производительности, чтобы снизить необходимость в ручном труде.

При интеграции с активным обучением AutoML может ускорить и оптимизировать жизненный цикл разработки модели. Компонент активного обучения стратегически выбирает наиболее информативные точки данных для разметки, в то время как AutoML совершенствует модель за счет автоматизации выбора архитектуры, параметров и настройки.

Рабочий процесс AutoML

Рис. 4. Рабочий процесс AutoML.

Давай разберемся с этим сочетанием технологий на примере.

Представь, что ты пытаешься обнаружить редкие заболевания в медицинской визуализации (случай, когда размеченных наборов данных мало и их получение обходится дорого). Активное обучение может идентифицировать и выбрать неопределенные данные, например, едва заметные изменения на рентгеновских снимках, которые модель не может классифицировать. Затем неопределенные данные можно отдать в приоритете для ручной аннотации, чтобы улучшить понимание модели.

Имея размеченные данные, AutoML может оптимизировать модель, изучая различные архитектуры, гиперпараметры и другие методы дополнения данных. Итеративный процесс ускоряет создание надежных моделей машинного зрения, таких как Ultralytics YOLO11, которые помогают специалистам здравоохранения ставить точные диагнозы.

Link to this sectionПроблемы активного обучения#

Активное обучение и его методы предлагают многочисленные преимущества, но при реализации этих стратегий следует учитывать несколько моментов:

Выбор стратегии запроса: активное обучение включает множество методов, и выбор лучшего из них существенно влияет на эффективность модели. Выбор неподходящей стратегии может снизить производительность модели для конкретного приложения.
Затраты на дообучение: итеративная природа активного обучения требует значительных вычислительных ресурсов, особенно для больших наборов данных. Модель дообучается после каждого раунда разметки, что увеличивает сложность.
Качество начальной модели: эффективность активного обучения зависит от качества начальной модели. Плохо работающая исходная модель может неточно определять информативные точки данных, что приведет к некачественным запросам на разметку и снижению общей производительности.

Link to this sectionПуть вперед для активного обучения и AutoML#

Благодаря недавним достижениям в области ИИ и компьютерного зрения, активное обучение готово справиться с более сложными задачами и оптимизировать рабочие процессы машинного обучения. Объединение активного обучения с такими методами, как федеративное обучение и самообучение, может еще больше повысить эффективность и масштабируемость моделей машинного зрения.

Федеративное обучение позволяет тренировать модель на нескольких устройствах или серверах с помощью распределенной структуры, не требуя перемещения данных из исходного места. Рассмотри такие отрасли, как здравоохранение, где важна конфиденциальность данных: федеративное обучение позволяет тренировать модель непосредственно на конфиденциальных локальных данных, сохраняя их безопасность. Вместо того чтобы делиться «сырыми» данными, передаются только обновления модели или выводы, что гарантирует защиту частной информации при одновременном вкладе в процесс обучения.

В то же время самообучение помогает снизить потребность в размеченных данных за счет предварительного обучения моделей на неразмеченных данных. Этот процесс создает сильную базу для модели. Активное обучение затем может развить этот успех, идентифицируя и выбирая самые важные точки данных для аннотирования человеком, дополнительно совершенствуя модель.

Link to this sectionОт активного обучения к активному результату#

Активное обучение предоставляет практический способ решения главных проблем компьютерного зрения, таких как высокая стоимость аннотирования данных и потребность в более точных моделях. Фокусируясь на разметке только самых ценных точек данных, оно уменьшает усилия, требуемые от людей, при этом повышая производительность модели.

В сочетании с такими технологиями, как AutoML, активное обучение оптимизирует разработку моделей за счет автоматизации трудоемких задач. По мере появления новых достижений активное обучение станет важным инструментом для создания более умных и эффективных систем компьютерного зрения.

Изучи наш репозиторий GitHub и присоединяйся к нашему сообществу, чтобы узнать больше о моделях ИИ и компьютерного зрения. Узнай больше о применении компьютерного зрения в производстве и здравоохранении на наших страницах решений. Ты также можешь ознакомиться с нашими вариантами лицензирования, чтобы начать свой путь в Vision AI уже сегодня.

Explore solutions

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Активное обучение ускоряет разработку компьютерного зрения

Link to this sectionСоздавать наборы данных для изображений непросто#

Link to this sectionЧто такое активное обучение?#

Link to this sectionПонимание того, как работает активное обучение#

Link to this sectionИсследование применения активного обучения#

Link to this sectionАктивное обучение может снизить затраты на разметку#

Link to this sectionПреимущества активного обучения#

Link to this sectionАктивное обучение и AutoML могут работать вместе#

Link to this sectionПроблемы активного обучения#

Link to this sectionПуть вперед для активного обучения и AutoML#

Link to this sectionОт активного обучения к активному результату#

Explore solutions

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

Давай строить будущее ИИ вместе!