Глоссарий

Извлечение признаков

Откройте для себя возможности извлечения признаков в машинном обучении с помощью Ultralytics YOLO11. Изучите методы эффективного обнаружения и анализа.

Извлечение признаков - важный процесс в машинном обучении (ML) и компьютерном зрении (CV), который является важнейшим этапом преобразования необработанных, часто сложных данных в формат, который алгоритмы могут эффективно обрабатывать. Он включает в себя преобразование неструктурированных или высокоразмерных данных, таких как изображения, аудио или текст, в структурированный набор числовых признаков, обычно представленных в виде вектора признаков. Эти признаки призваны отразить основные характеристики исходных данных, отбросив при этом шум и избыточность. Основные задачи включают снижение сложности данных за счет уменьшения размерности, выделение значимых закономерностей и повышение пригодности данных для ML-моделей. Это часто приводит к повышению точности моделей, ускорению их обучения и лучшему обобщению на неизвестные данные.

Как работает извлечение признаков

Конкретные методы извлечения признаков во многом зависят от типа обрабатываемых данных.

  • Данные изображения: В традиционном компьютерном зрении методы предполагали ручную разработку алгоритмов для обнаружения специфических особенностей, таких как края, углы, текстуры (с использованием таких методов, как фильтры Габора) или цветовые гистограммы. Библиотеки, такие как OpenCV, предоставляют инструменты для реализации многих из этих классических методов(официальный сайт OpenCV). Однако в современном глубоком обучении (ГОО), в частности в конволюционных нейронных сетях (КНС), используемых в таких моделях, как Ultralytics YOLO, извлечение признаков часто происходит автоматически. Сверточные слои сети применяют фильтры к входному изображению, генерируя карты признаков, которые отражают все более сложные паттерны в иерархическом порядке - от простых линий и текстур в ранних слоях до частей объектов и целых объектов в более глубоких слоях. Вы можете изучить различные задачи компьютерного зрения, в которых применяется эта технология.

  • Текстовые данные: Для задач обработки естественного языка (NLP) извлечение признаков может включать такие методы, как вычисление частоты терминов и обратной частоты документов (TF-IDF) для представления важности слов или генерация вкраплений слов с помощью таких моделей, как Word2Vec или GloVe. Эти вкрапления представляют собой плотные векторы, отражающие семантические связи между словами. Более продвинутые модели, такие как BERT и Transformers, изучают контекстные представления непосредственно из текста.

  • Общие методы: Такие методы, как анализ главных компонент (PCA) и t-распределенное стохастическое встраивание соседей (t-SNE), являются методами общего назначения для уменьшения размерности, применимыми к различным типам данных. Они преобразуют высокоразмерные данные в более низкоразмерное пространство, стремясь сохранить важную дисперсию или структуру соседства, что можно считать формой извлечения признаков. Scikit-learn предоставляет реализацию этих методов.

Извлечение признаков и разработка признаков

Извлечение признаков часто путают с разработкой признаков, но это разные понятия.

  • Извлечение признаков: Фокусируется на преобразовании исходных данных в набор производных признаков, часто с помощью автоматизированных алгоритмов (например, слоев CNN) или известных математических методов (например, PCA или преобразования Фурье). Целью обычно является снижение размерности и создание более удобного представления.
  • Инжиниринг признаков: Более широкая практика, включающая извлечение признаков, а также создание новых признаков из существующих (например, вычисление отношения двух измерений), выбор наиболее релевантных признаков для модели, обработку пропущенных значений и преобразование признаков на основе знаний о домене и конкретных требований к модели(например, предварительная обработка данных). Это часто требует больших ручных усилий и опыта.

Хотя модели глубокого обучения автоматизируют большую часть процесса извлечения признаков для таких задач, как распознавание изображений и обнаружение объектов, принципы разработки признаков, такие как соответствующее расширение данных или нормализация входных данных, по-прежнему имеют решающее значение для достижения оптимальной производительности.

Применение в реальном мире

Извлечение признаков является основополагающим для множества приложений ИИ и ОД:

  1. Анализ медицинских изображений: При анализе медицинских снимков, таких как рентгеновские, компьютерные или магнитно-резонансные томографы, для выявления таких заболеваний, как рак, из изображений извлекаются специфические признаки. К ним могут относиться текстурные особенности тканей, форма и размер потенциальных аномалий (например, опухолей, обнаруженных в наборе данных Brain Tumor) или изменения интенсивности. Эти извлеченные признаки затем поступают в классификатор (например, SVM или нейронную сеть), чтобы предсказать наличие или стадию заболевания. Это помогает радиологам в диагностике, о чем говорится в таких публикациях, как Radiology: Искусственный интеллект". Современные системы могут использовать Ultralytics YOLO11, который неявно извлекает признаки для таких задач, как анализ медицинских изображений.

  2. Анализ настроения: Для определения настроения (положительного, отрицательного, нейтрального), выраженного в текстовых данных, таких как отзывы покупателей или сообщения в социальных сетях, необходимо извлечь характеристики из исходного текста. Это может быть подсчет частоты встречаемости положительных и отрицательных слов(Bag-of-Words), использование оценок TF-IDF или создание сложных вкраплений предложений с помощью предварительно обученных языковых моделей, таких как те, что доступны на Hugging Face. Эти характеристики количественно определяют эмоциональный тон текста, позволяя модели ML классифицировать общее настроение, что очень важно для понимания отзывов клиентов.

Извлечение характеристик в моделях YOLO от Ultralytics

Современные модели обнаружения объектов, такие как Ultralytics YOLOv8 и YOLO11, выполняют извлечение признаков неявно в архитектуре своей нейронной сети (НС). Начальные слои (часто являющиеся частью костяка) выступают в роли мощных, обучаемых экстракторов признаков. По мере прохождения входных данных через эти слои иерархические признаки автоматически определяются и представляются в картах признаков. Хотя этот процесс в значительной степени автоматизирован, понимание извлечения признаков помогает разработать эффективные шаги предварительной обработки данных, выполнить настройку гиперпараметров и интерпретировать поведение модели, используя инструменты, доступные в документации Ultralytics, или платформы, такие как Ultralytics HUB, для управления наборами данных и экспериментами. Методы также используются в последующих задачах, таких как отслеживание объектов, где могут быть извлечены особенности внешнего вида для сохранения идентичности объектов в разных кадрах. Такие фреймворки, как PyTorch и TensorFlow, предоставляют базовую инфраструктуру для построения и обучения этих моделей.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена