Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Векторные представления (embeddings)

Узнайте, что такое embeddings и как они поддерживают AI, фиксируя семантические связи в данных для NLP, рекомендаций и компьютерного зрения.

Вложения — это плотные, низкоразмерные, непрерывные векторные представления дискретных переменных, служащие основой для преобразования данных человека в логику машины. В сфере искусственного интеллекта (ИИ) компьютеры не могут интуитивно понимать беспорядочные, неструктурированные данные, такие как текст, изображения или аудио. Внедрения решают эту проблему, преобразуя эти входные данные в списки действительных чисел, известных как векторы, которые существуют в высокоразмерном математическом пространстве. В отличие от традиционных кодировок, которые могут просто присваивать объекту случайный идентификатор, внедрения обучаются посредством тренировки, обеспечивая, чтобы семантически схожие элементы — такие как слова «король» и «королева» или изображения двух разных кошек — располагались близко друг к другу в векторном пространстве.

Как работают вкрапления

Создание встраивания включает в себя подачу необработанных данных в нейронную сеть, предназначенную для извлечения признаков. Во время обучения модель учится сжимать основные характеристики ввода в компактную числовую форму. Например, модель компьютерного зрения (CV), анализирующая фотографию, не просто видит пиксели; она отображает формы, текстуры и цвета в виде определенных координат на многомерном графике. При измерении схожести системы вычисляют расстояние между этими координатами, используя такие метрики, как косинусная схожесть или евклидово расстояние. Эта математическая близость позволяет алгоритмам с высокой эффективностью выполнять сложные задачи, такие как классификация и кластеризация.

Применение в реальном мире

Встраиваемые модули служат двигателем для многих интеллектуальных функций, используемых в современных программных продуктах.

  • Семантический поиск: Традиционные поисковые системы часто полагаются на точное соответствие ключевых слов, что не работает, если пользователь вводит запрос «авто», а в документе содержится «машина». Внедрения улавливают смысл, стоящий за словами. Представляя поисковый запрос и документы базы данных в виде векторов, система может извлекать результаты, которые соответствуют намерениям пользователя, даже если конкретные слова различаются.
  • Рекомендательные системы: потоковые сервисы и сайты электронной коммерции используют вложения для персонализации пользовательского опыта. Если пользователь смотрит научно-фантастический фильм, система идентифицирует вектор вложения этого фильма и ищет в базе данных другие фильмы с похожими векторами . Это позволяет давать точные рекомендации на основе схожести контента, а не только ручных тегов или категорий.
  • Обучение без примеров: В продвинутых моделях используются совместные вложения для связи различных модальностей, таких как текст и изображения. Это позволяет системе распознавать объекты, которые она никогда явно не видела во время обучения, путем ассоциирования вложения изображения с текстовым вложением названия объекта

Генерация вложений с помощью Python

Современные модели, такие как YOLO26 может использоваться для эффективного создания надежных встраиваний изображений. Следующий пример демонстрирует, как извлечь вектор признаков из изображения с помощью ultralytics Пакет Python .

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")

Эмбеддинги в сравнении со смежными концепциями

Для эффективного внедрения решений на основе искусственного интеллекта полезно различать вложения и близкие по значению технические термины.

  • Внедрения против векторного поиска: внедрение — это само представление данных (список чисел). Векторный поиск — это последующий процесс запроса базы данных для поиска ближайших соседей к этому внедрению. Специализированные инструменты, известные как векторные базы данных, часто используются для хранения и поиска этих внедрений в большом масштабе.
  • Внедрения против токенизации: в обработке естественного языка (NLP) токенизация является предварительным этапом разбиения текста на более мелкие фрагменты (токены). Затем эти токены сопоставляются с внедрениями. Таким образом, токенизация подготавливает данные, а внедрения представляют их значение.
  • Внедрения против глубокого обучения: Глубокое обучение — это более широкая область машинного обучения, основанная на нейронных сетях. Внедрения — это конкретный результат или слой в архитектуре глубокого обучения, часто служащий мостом между исходными данными и слоями принятия решений модели.

Разработчики, которые хотят управлять жизненным циклом своих наборов данных, включая аннотирование и обучение моделей для генерации пользовательских встраиваний, могут использовать Ultralytics . Этот комплексный инструмент упрощает рабочий процесс от управления данными до развертывания, гарантируя, что встраивания, питающие ваши приложения, получены из высококачественных, тщательно отобранных данных. Независимо от того, используете ли вы такие фреймворки, как PyTorch или TensorFlow, освоение встраиваний является важным шагом в создании сложных систем распознавания образов.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас