Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Активное обучение

Откройте для себя активное обучение — экономичный метод машинного обучения, повышающий точность при меньшем количестве размеченных данных. Узнайте, как он преобразует обучение ИИ!

Активное обучение - это динамический подход в машинном обучении (ML), направленный на оптимизацию процесса обучения путем выборочного выбора наиболее информативных точек данных для аннотации. В стандартном контролируемом обучения модель пассивно получает большой, предварительно помеченный набор данных, что может быть неэффективным и дорогостоящим, если данные если данные содержат избыточные или неинформативные примеры. Активное обучение меняет эту парадигму, позволяя модели интерактивно обращаться к источнику информации - часто к эксперту или "оракулу" - с просьбой выдать метки для определенных, неоднозначных примеров. Эта целенаправленная стратегия значительно сокращает объем обучающих данных, необходимых для достижения высокой что делает ее идеальной для проектов с ограниченным бюджетом или жесткими временными ограничениями. Бюджет или жесткие временные ограничения.

Цикл активного обучения

Процесс активного обучения функционирует как итерационный цикл, который часто описывается как рабочий процесс "человек в цикле". Этот Этот цикл обеспечивает сосредоточение усилий человека исключительно на данных, которые вносят наибольший вклад в улучшение модели. На сайте Типичный рабочий процесс включает в себя:

  1. Инициализация: Модель, например Ultralytics YOLO11обучается на небольшом, изначально первоначально помеченном наборе данных.
  2. Запрос: Модель выполняет предсказания на большом пуле немаркированных данных. Используя стратегию запросов, она определяет образцы, в которых ее уверенность низка или где предсказания неопределенны.
  3. Аннотация: Эти высокоприоритетные "неопределенные" образцы отправляются человеку-аннотатору для маркировки.
  4. Обновление: Вновь помеченные образцы добавляются в обучающий набор, и процесс обучения модели повторяется. процесс обучения модели повторяется для уточнения алгоритма.

Эффективность этого метода во многом зависит от стратегии выборки. Выборка по неопределенности является наиболее распространенная техника, при которой алгоритм выбирает экземпляры, наиболее близкие к границе принятия решения. Исчерпывающая информация об этих стратегиях можно найти в различных литературе по активному обучению.

Пример на Python : Выборка неопределенности с помощью YOLO11

Следующий фрагмент кода демонстрирует, как реализовать базовый цикл выборки неопределенности. Он загружает модель, прогнозирует на изображениях и выявляет изображения с низким уровнем достоверности обнаружения, помечая их для ручной проверки.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on a list or directory of unlabeled images
results = model.predict(["image1.jpg", "image2.jpg"])

# Identify images where the model is uncertain
uncertain_samples = []
for result in results:
    # Check if detections exist and if the maximum confidence is below a threshold
    if result.boxes.conf.numel() > 0 and result.boxes.conf.max() < 0.6:
        uncertain_samples.append(result.path)
        print(f"Flagging {result.path} for manual labeling.")

print(f"Total uncertain images found: {len(uncertain_samples)}")

Применение в реальном мире

Активное обучение особенно ценно в тех областях, где маркировка данных является дорогостоящей или требует специальных опыта.

  • Анализ медицинских изображений: В здравоохранении получение меченых данных для таких задач, как обнаружение опухоли мозга, часто требует времени высококвалифицированных радиологов. Вместо того чтобы маркировать тысячи рутинных снимков, системы активного обучения могут выявлять редкие или неоднозначные аномалии для экспертной оценки. Исследования в области сегментации биомедицинских изображений показали, что этот подход может значительно сократить усилия по аннотированию, сохраняя при этом точность диагностики.
  • Автономные транспортные средства: Самоуправляемые автомобили собирают огромное количество видеоданных. Маркировка каждого кадра нецелесообразна. Активное обучение помогает инженерам находить "крайние случаи" - например, необычные погодные условия или пешеходов в костюмах, - с которыми не справляется текущая модель обнаружения объектов. с которыми не справляется текущая модель обнаружения объектов classify. Отдавая предпочтение этим сложным сценариям, такие компании, как NVIDIA повышают безопасность и надежность свои системы восприятия.

Отличие от смежных понятий

Хотя активное обучение предполагает использование немаркированных данных, оно отличается от других парадигм машинного обучения:

  • Полууправляемое обучение: Этот метод использует как помеченные, так и непомеченные данные во время обучения, но обычно делает это пассивно. Он часто полагается на предположения о распределении данных для распространения меток, в то время как активное обучение явно запрашивает новую информацию. информацию.
  • Самоуправляемое обучение: В этом подходе модель создает собственные сигналы наблюдения из структуры данных (например, предсказание недостающей части изображения). При этом не требуется вмешательство человека для создания меток для немаркированной части, что является ключевой область исследований в таких лабораториях, как Google AI.
  • Обучение с применением подкрепления: При этом агент учится принимать решения, получая вознаграждение или наказание из окружающей среды. В отличие от активного обучения, которое ищет статические метки для точек данных, обучение с подкреплением фокусируется на оптимизации последовательности действий.

Интеграция в MLOps

Реализация активного обучения требует надежного Операции машинного обучения (MLOps) для управления потоком данных между моделью, набором данных и интерфейсом аннотаций. Инструменты, поддерживающие версионность и управление данными Средства, поддерживающие версионирование и управление данными, необходимы для отслеживания того, какие образцы были запрошены. Хотя библиотеки общего назначения такие как scikit-learn предлагают некоторые полезные возможности, рабочие процессы компьютерного зрения часто требуют индивидуальной интеграции с для визуализации и аннотирования выбранных изображений эффективно. Продвинутые пользователи могут изучить репозиторийUltralytics на GitHub, чтобы увидеть, как результаты предсказаний могут быть структурированы для использования в этих циклах обработки данных.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас