Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Семантический поиск

Откройте для себя возможности семантического поиска! Узнайте, как ИИ, NLP и ML повышают точность поиска, понимая намерения и контекст пользователя.

Семантический поиск выходит за рамки буквального подбора ключевых слов и позволяет понимания намерений и контекстуального смысла, стоящего за запросом пользователя. Благодаря использованию передовых технологий обработки естественного языка (NLP) и сложные алгоритмов машинного обучения (ML), эта Технология преодолевает разрыв между человеческим языком и машинным пониманием. Она является важнейшим компонентом современных систем искусственного интеллекта (ИИ), позволяя им получать высоко релевантные результаты даже при отсутствии точных терминов в исходных данных.

Как работает семантический поиск

Основной механизм семантического поиска заключается в преобразовании неструктурированных данных - таких как текст, изображения или аудио - в высокоразмерные числовые векторы, называемые эмбеддингами. Эти векторы помещаются в многомерное семантическое пространство, где элементы с похожими значениями представляют собой тесные пространственные отношения.

Например, в семантической системе поиск "кошачий компаньон" будет сопоставлен с "кошкой" или "котенок", потому что модель глубокого обучения понимает концептуальную связь, в то время как традиционная лексическая поисковая система может потерпеть неудачу, если конкретное слово "кошка" не встречается в целевых документах. Этот процесс часто опирается на векторные базы данных, такие как Milvus или Pinecone для эффективного хранения и извлечения этих для эффективного хранения и извлечения этих вкраплений.

Следующий код Python демонстрирует, как генерировать вкрапления признаков из изображения, используя ultralytics пакет. Это первый шаг в создании системы визуального семантического поиска.

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Generate embeddings for an image (returns a list of tensors)
# This converts visual content into a numerical vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the embedding vector to verify output
print(f"Embedding vector shape: {results[0].shape}")

Применение в реальном мире

Семантический поиск изменил различные отрасли, сделав поиск информации более интуитивным и эффективным.

  • Электронная коммерция и визуальное обнаружение: Интернет-магазины используют семантический поиск для улучшения покупательского опыта. Покупатель может искать "летнее цветочное платье", и система может вернуть соответствующие визуальные совпадения, даже если в описании товара даже если в описании товара нет точных ключевых слов. При этом часто используются Мультимодальные модели, которые могут обрабатывать как текстовые и изображения одновременно.
  • Управление знаниями и RAG: В корпоративной среде сотрудники часто ищут документы на основе на основе концепций, а не имен файлов. Семантический поиск позволяет RAG (Retrieval-Augmented Generation), когда ИИ извлекает контекстно-значимую информацию для ответа на сложные вопросы, расширяя возможности Большие языковые модели (LLM).
  • Рекомендация контента: Потоковые сервисы и контент-платформы используют семантическое понимание для создания рекомендательных систем. Анализируя семантические особенности контента, который нравится пользователю, система может предложить концептуально похожие фильмы или статьи, тем самым поддерживая интерес пользователей.

Semantic Search vs. Related Concepts (Семантический поиск в сравнении со смежными концепциями)

Важно отличать семантический поиск от других информационно-поисковых терминов, чтобы понять его особую роль в ландшафте ИИ.

  • Векторный поиск: Векторный поиск - это математический метод, используемый для выполнения семантического поиска. Он включает в себя вычисление расстояние между векторами (с использованием таких метрик, как косинусоидальное сходство), чтобы найти ближайших соседей. Семантический поиск - это более широкое применение, которое включает в себя понимание намерений.
  • Поиск по ключевым словам: Это традиционный подход, основанный на поиске точных символьных строк. Он дешевле в вычислительном отношении, но не позволяет понять синонимы или полисемию (слова с несколькими значениями). значениями).
  • Обучение с нуля: Это способность модели распознавать или классифицировать объекты, которые она никогда не видела во время обучения. Семантические поисковые системы часто демонстрируют способность к "нулевому обучению", поскольку они могут сопоставлять новые запросы с существующими семантическими кластерам без явного переобучения.
  • Понимание естественного языка (NLU): NLU - это подмножество NLP, ориентированное на машинное понимание прочитанного. NLU предоставляет интеллектуальные возможности для интерпретации запрос, а семантический поиск - это процесс поиска, основанный на этой интерпретации.

Выходя за рамки жесткого сопоставления ключевых слов, семантический поиск позволяет компьютерное зрение и текстовые системы взаимодействовать с людьми более естественным и "человекоподобным" образом. Для разработчиков, желающих реализовать эти функции, изучите Руководство по поиску сходстваUltralytics предлагает практические шаги по применению этих концепций с помощью YOLO11.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас