Узнайте, как векторный поиск использует вложения для нахождения похожих данных. Научитесь генерировать высококачественные векторы с помощью Ultralytics для точного поиска информации.
Векторный поиск — это сложный метод поиска информации, который идентифицирует похожие элементы в наборе данных на основе их математических характеристик, а не точного совпадения ключевых слов. В отличие от традиционного поиска по ключевым словам, который основан на поиске определенных символьных строк, векторный поиск анализирует семантическое значение данных. Эта техника имеет основополагающее значение для современных приложений искусственного интеллекта (ИИ) , поскольку позволяет компьютерам понимать взаимосвязи между абстрактными концепциями, обрабатывая неструктурированные данные, такие как изображения, аудиофайлы и текст на естественном языке, с поразительной точностью.
Суть векторного поиска заключается в преобразовании исходных данных в высокоразмерные числовые векторы, известные как вложения. Этот процесс отображает элементы в точки в многомерном пространстве, где концептуально схожие элементы расположены близко друг к другу.
Для реализации векторного поиска необходимо сначала преобразовать данные в векторы. Следующий фрагмент кода демонстрирует, как
генерировать карты характеристик и вложения из изображения
с использованием ultralytics пакет и предварительно обученная модель YOLO26.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
Векторный поиск — это движок, стоящий за многими интуитивными функциями в современной программной экосистеме, который устраняет разрыв между компьютерным зрением (CV) и намерениями пользователя.
Чтобы понять весь процесс машинного обучения (ML), полезно отличать векторный поиск от похожих терминов.
Для команд, занимающихся созданием систем поиска по схожести, управление наборами данных и обучение встраиваемых моделей является важным первым шагом. Ultralytics упрощает этот рабочий процесс, предоставляя инструменты для управления данными, обучения в облаке и развертывания моделей. Обеспечивая высокую производительность базовых моделей — будь то для обнаружения объектов или классификации — вы гарантируете, что результирующие векторы будут предоставлять точные и значимые результаты поиска.