Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Dimensionality Reduction

Узнай, как снижение размерности оптимизирует рабочие процессы машинного обучения. Исследуй методы вроде PCA и t-SNE, чтобы повысить производительность Ultralytics YOLO26 и улучшить визуализацию данных.

Снижение размерности — это метод преобразования в машинном обучении (ML) и анализе данных, используемый для уменьшения количества входных переменных (часто называемых признаками или измерениями) в наборе данных при сохранении наиболее важной информации. В эпоху больших данных наборы данных часто содержат тысячи переменных, что приводит к явлению, известному как проклятие размерности. Это явление может сделать обучение моделей вычислительно затратным, подверженным переобучению и трудным для интерпретации. Проецируя высокоразмерные данные в пространство с меньшей размерностью, ты сможешь повысить эффективность, визуализацию и прогностическую способность.

Link to this sectionОсновные преимущества в разработке ИИ#

Уменьшение сложности данных — это фундаментальный этап в конвейерах предварительной обработки данных. Это дает несколько ощутимых преимуществ для создания надежных систем искусственного интеллекта (ИИ):

  • Повышенная вычислительная эффективность: меньше признаков означает меньше данных для обработки. Это ускоряет время обучения алгоритмов, таких как YOLO26, делая их более пригодными для вывода в реальном времени и развертывания на устройствах Edge AI с ограниченными ресурсами.
  • Улучшенная визуализация данных: человеческая интуиция с трудом воспринимает данные за пределами трех измерений. Снижение размерности сжимает сложные наборы данных до 2D или 3D пространств, позволяя эффективно выполнять визуализацию данных для обнаружения кластеров, закономерностей и выбросов с помощью таких инструментов, как TensorFlow Embedding Projector.
  • Уменьшение шума: фокусируясь на наиболее значимой дисперсии в данных, этот метод отфильтровывает шум и избыточные признаки. Это приводит к получению более чистых обучающих данных, помогая моделям лучше обобщать данные на ранее не виденных примерах.
  • Оптимизация хранилища: хранение огромных наборов данных в облаке, например, тех, что управляются через Ultralytics Platform, может быть дорогостоящим. Сжатие пространства признаков значительно снижает требования к хранилищу без ущерба для целостности данных.

Link to this sectionОсновные методы: линейные и нелинейные#

Методы снижения размерности обычно классифицируются в зависимости от того, сохраняют ли они глобальную линейную структуру или локальное нелинейное многообразие данных.

Link to this sectionЛинейные методы#

Самым известным линейным методом является метод главных компонент (PCA). PCA работает путем определения "главных компонент" — ортогональных осей, которые улавливают максимальную дисперсию в данных. Он проецирует исходные данные на эти новые оси, эффективно отбрасывая измерения, которые вносят мало информации. Это основной инструмент в рабочих процессах обучения без учителя.

Link to this sectionНелинейные методы#

Для сложных структур данных, таких как изображения или эмбеддинги текста, часто требуются нелинейные методы. Такие техники, как t-SNE (t-распределенное стохастическое вложение соседей) и UMAP (равномерная аппроксимация и проекция многообразий), превосходно справляются с сохранением локальных окрестностей, что делает их идеальными для визуализации высокоразмерных кластеров. Кроме того, автокодировщики представляют собой нейронные сети, обученные сжимать входные данные в представление латентного пространства и восстанавливать их, эффективно изучая компактное кодирование данных.

Link to this sectionРеальные приложения#

Снижение размерности критически важно в различных областях глубинного обучения (DL):

  1. Компьютерное зрение: современные детекторы объектов, такие как YOLO26, обрабатывают изображения, содержащие тысячи пикселей. Внутренние слои используют методы пулинга и сверток со страйдом, чтобы постепенно уменьшать пространственные размеры карт признаков, превращая сырые пиксели в высокоуровневые семантические концепции (например, "край", "глаз", "автомобиль").

  2. Геномика и здравоохранение: в анализе медицинских изображений и биоинформатике исследователи анализируют данные об экспрессии генов с десятками тысяч переменных. Снижение размерности помогает идентифицировать ключевые биомаркеры для классификации заболеваний, как это показано в исследованиях по геномике рака.

  3. Рекомендательные системы: платформы вроде Netflix или Spotify используют матричную факторизацию (метод снижения) для предсказания предпочтений пользователей. Уменьшая разреженную матрицу взаимодействий пользователей и объектов, они могут эффективно рекомендовать контент на основе латентных признаков.

Link to this sectionСнижение размерности против отбора признаков#

Важно отличать это понятие от отбора признаков, поскольку они достигают схожих целей с помощью разных механизмов:

  • Отбор признаков предполагает выбор подмножества исходных признаков (например, сохранение "Возраста" и удаление "Имени"). Он не изменяет значения выбранных признаков.
  • Снижение размерности (в частности, извлечение признаков) создает новые признаки, которые являются комбинациями исходных. Например, PCA может объединить "Рост" и "Вес" в одну новую компоненту, представляющую "Размер тела".

Link to this sectionПример на Python: снижение размерности эмбеддингов изображений#

Следующий пример иллюстрирует, как взять высокоразмерный выход (имитирующий вектор эмбеддинга изображения) и уменьшить его с помощью PCA. Это распространенный рабочий процесс при визуализации того, как модель вроде YOLO26 группирует похожие классы.

import numpy as np
from sklearn.decomposition import PCA

# Simulate high-dimensional embeddings (e.g., 10 images, 512 features each)
# In a real workflow, these would come from a model like YOLO26n
embeddings = np.random.rand(10, 512)

# Initialize PCA to reduce from 512 dimensions to 2
pca = PCA(n_components=2)
reduced_data = pca.fit_transform(embeddings)

# Output shape is now (10, 2), ready for 2D plotting
print(f"Original shape: {embeddings.shape}")  # (10, 512)
print(f"Reduced shape: {reduced_data.shape}")  # (10, 2)

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения