Глоссарий

Векторный поиск

Узнайте, как векторный поиск революционизирует ИИ, обеспечивая семантическое сходство при поиске данных для НЛП, визуального поиска, рекомендательных систем и многого другого!

Векторный поиск - это метод поиска похожих элементов в большом наборе данных путем представления данных в виде числовых векторов, называемых вкраплениями. Вместо того чтобы искать точные ключевые слова, он определяет элементы, которые похожи семантически или контекстуально. Этот подход является основополагающим для современных систем искусственного интеллекта (ИИ), обеспечивая более интуитивный и точный поиск информации для сложных типов данных, таких как изображения, текст и аудио. Он позволяет не ограничиваться буквальными запросами, а понимать их смысл или намерение, что делает его мощным инструментом для создания сложных поисковых и рекомендательных систем.

Как работает векторный поиск?

Процесс векторного поиска включает в себя несколько ключевых этапов, которые преобразуют необработанные данные в формат, пригодный для поиска по смыслу. Для этого используются модели глубокого обучения и эффективные алгоритмы.

  1. Генерирование вкраплений: Сначала модель машинного обучения, такая как трансформатор или сверточная нейронная сеть (CNN), преобразует элементы данных (например, предложения, изображения, профили пользователей) в высокоразмерные числовые векторы, называемые вкраплениями. Каждый вектор отражает семантическую сущность элемента.
  2. Индексирование: Сгенерированные векторы хранятся и индексируются в специализированной базе данных векторов. Эти базы данных, такие как Pinecone или Milvus, оптимизированы для эффективного управления и запроса огромных объемов векторных данных.
  3. Запрос: Когда пользователь отправляет запрос (например, текстовую фразу или изображение), он преобразуется в вектор с помощью той же модели.
  4. Вычисление сходства: Затем система использует алгоритмы для поиска векторов в базе данных, которые "ближе всего" к вектору запроса. Для этого часто используются метрики расстояния, такие как косинусоидальное сходство или евклидово расстояние. Для работы с огромными массивами данных системы обычно используют алгоритмы приближенных ближайших соседей (ANN), такие как ScaNN или Faiss, которые обеспечивают быстрый и масштабируемый поиск, находя если не точные, то очень релевантные совпадения.

Применение в реальном мире

Векторный поиск - это технология, лежащая в основе многих передовых функций искусственного интеллекта. Она позволяет системам выходить за рамки простого сопоставления и выдавать результаты с учетом контекста в различных отраслях.

  • Семантический поиск изображений: Вместо того чтобы полагаться на теги или имена файлов, созданные вручную, пользователи могут искать изображения с помощью описательных фраз на естественном языке. Например, пользователь может задать поиск "машина едет по горной дороге на закате", и система найдет визуально похожие изображения, понимая понятия "машина", "гора" и "закат" в контексте. Вы можете изучить, как это работает, воспользовавшись руководством по поиску сходства от Ultralytics.
  • Рекомендательные системы: Платформы электронной коммерции и потокового вещания используют векторный поиск для рекомендации продуктов или контента. Если вы смотрите научно-фантастический фильм, сервис может найти и предложить другие фильмы, похожие по жанру, тону и сюжету, сравнив их векторные вложения. Это одна из основных функций ИИ в розничной торговле, позволяющая повысить удобство и вовлеченность пользователей.

Векторный поиск по сравнению со смежными понятиями

Полезно отличать векторный поиск от других смежных терминов, чтобы понять его особую роль в экосистеме ИИ.

  • Поиск по ключевым словам: Традиционный поиск по ключевым словам основан на точном подборе слов или фраз. Он не справляется с синонимами, контекстом и лингвистическими нюансами. Векторный поиск, напротив, понимает семантические связи, что позволяет ему находить релевантные результаты даже при неполном совпадении ключевых слов.
  • Семантический поиск: Семантический поиск - это широкая концепция понимания намерений и контекстного значения запроса. Векторный поиск - это основной метод, используемый для реализации семантического поиска. Если семантический поиск - это "что" (понимание смысла), то векторный поиск - это "как" (механизм поиска, основанный на векторной близости).
  • Эмбеддинги: Эмбеддинги - это векторные представления данных. Векторный поиск - это процесс запроса к коллекции эмбеддингов для поиска наиболее похожих из них. Эмбеддинги - это данные, а векторный поиск - действия, выполняемые над этими данными.
  • Векторная база данных: Векторная база данных - это специализированная инфраструктура для хранения, индексирования и эффективного запроса эмбеддингов. Платформы, подобные Ultralytics HUB, помогают управлять наборами данных и моделями, которые создают эти вкрапления для использования в системах векторного поиска.

Используя возможности вкраплений и сложных алгоритмов поиска, векторный поиск преодолевает разрыв между человеческими намерениями и цифровыми данными, что делает его важным компонентом для многих интеллектуальных приложений, от обработки естественного языка (NLP) до продвинутых задач компьютерного зрения.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена