深圳Yolo 视觉
深圳
立即加入
词汇表

语义搜索

探索语义搜索如何利用AI和嵌入来理解用户意图。学习如何使用Ultralytics YOLO26和我们的平台构建视觉搜索系统。

语义搜索是一种复杂的信息检索技术,旨在理解用户查询的意图和上下文含义,而不仅仅是匹配特定词语。通过利用自然语言处理 (NLP)机器学习 (ML)的进步,这项技术使系统能够更细致地解释人类语言。它是现代人工智能 (AI)应用的基石,通过弥合模糊的用户查询与相关数据之间的鸿沟,实现人机之间更直观的交互。

语义搜索如何工作

其核心在于,语义搜索超越了字面字符匹配,以分析概念之间的关系。如果用户搜索“feline”但文档只包含“cat”一词,传统搜索引擎可能会失败。语义搜索通过将非结构化数据——例如文本、图像或音频——转换为称为嵌入(embeddings)的数学表示来解决这个问题。

这些嵌入是高维向量,位于“语义空间”中。在这个空间中,含义相似的项彼此靠近。例如,“car”的向量在数学上会比“banana”更接近“automobile”和“road”。当用户提交查询时,系统将该查询转换为一个向量,并在向量数据库中找到最近的数据点。此过程依赖于深度学习模型来执行特征提取,识别数据的基本特征。

以下Python代码演示了如何使用Ultralytics YOLO26模型生成这些嵌入,这是实现视觉语义搜索的基础步骤。

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image
# This converts the visual content into a numerical vector
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Output the shape of the embedding vector (e.g., length 1280)
print(f"Embedding vector shape: {results[0].shape}")

实际应用

语义搜索彻底改变了用户在各个领域发现信息的方式,使系统更智能、更高效。

  • 电子商务与视觉发现:零售AI 领域,语义搜索驱动着“搭配购物”功能。顾客可以上传运动鞋的照片或搜索“复古夏日风情”。系统使用 计算机视觉 来理解视觉风格并检索符合美学的产品,即使产品描述中不包含这些确切的关键词。这通常涉及能够理解文本和图像输入的 多模态模型
  • 知识管理与 RAG:大型组织使用语义搜索来帮助员工查找内部文档。员工无需记住确切的文件名,可以提出诸如“如何重置服务器?”之类的问题。系统使用 检索增强生成 (RAG) 根据含义查找最相关的政策文档,并将其输入到 大型语言模型 (LLM) 以生成精确的答案。
  • 内容推荐:流媒体平台利用语义理解来改进其 推荐系统。通过分析用户喜爱的电影的剧情摘要和视觉特征图,平台可以推荐具有相似主题或情绪的其他影片,从而延长用户参与时间。

语义搜索与相关概念

为了充分理解语义搜索的实用性,将其与数据科学领域中的相关术语区分开来会很有帮助。

  • 向量搜索: 尽管经常互换使用,但它们之间存在技术区别。向量搜索是计算向量之间距离的数学方法(通常使用余弦相似度)。语义搜索是更广泛的应用,它利用向量搜索来实现理解用户意图的目标。
  • 关键词搜索:这是一种依赖精确字符串匹配的传统方法。它的计算成本较低但脆弱;它难以处理 同义词 和多义词(具有多个含义的词)。语义搜索需要更多的计算能力,但能提供显著更高的相关性。
  • 零样本学习: 这指的是模型在训练期间从未见过的数据进行分类的能力。语义搜索引擎通常展现零样本能力,因为它们无需重新训练即可将新的、未见的查询映射到嵌入空间中已知概念的现有集群。

实现语义搜索通常需要一个强大的管道来管理数据集和模型训练。Ultralytics平台通过提供标注数据、训练模型并高效部署它们的工具来简化这一点。对于希望构建这些系统的开发者,查阅Ultralytics相似性搜索指南提供了将这些强大功能集成到应用程序中的实用步骤。

让我们一起共建AI的未来!

开启您的机器学习未来之旅