语义搜索
探索语义搜索的强大功能!了解 AI、NLP 和 ML 如何通过理解用户意图和上下文来提高搜索准确性。
语义搜索是一种先进的信息检索技术,旨在理解用户查询背后的意图和上下文含义,而不仅仅是匹配关键词。与依赖字面术语匹配的传统搜索引擎不同,语义搜索使用自然语言处理 (NLP)和机器学习 (ML)来提供更相关和准确的结果。其目标是弥合人类语言和计算机可以轻松处理的结构化数据之间的差距,从而带来更直观和有效的搜索体验。
这项技术通过将文本或图像等非结构化数据转换为称为嵌入的数值表示形式来实现。诸如 OpenAI 的 CLIP (Contrastive Language-Image Pre-Training) 或 Google 的 BERT 等模型经过训练以生成这些嵌入,这些嵌入捕获了内容的语义本质。一旦数据表示为向量,诸如 Milvus 或 Weaviate 等向量数据库就会使用诸如 Meta 的 FAISS 等专用算法来执行快速高效的相似性搜索。
实际应用
语义搜索已经改变了我们在各个领域与数字信息交互的方式。两个突出的例子包括:
- 语义图像搜索: 在创意领域或管理大型图像数据集时,用户通常需要根据抽象概念查找图像。例如,平面设计师可能会搜索“日落时分宁静而僻静的海滩”。传统的系统很难处理此查询,除非图像经过精心标记。像Ultralytics提供的语义搜索系统会分析图像本身的内容,返回与所描述的情绪和元素相匹配的视觉效果,而无需依赖文件名或标签。您可以在我们的相似性搜索指南中了解有关实现此功能的更多信息。
 - 电子商务产品发现: 在线零售商利用语义搜索来改善购物体验。客户可能会搜索“适合下雪冬天的保暖靴子”,而不是特定的产品名称。搜索引擎可以理解“保暖”和“下雪”的概念,并推荐隔热防水靴等产品,即使产品描述中没有这些确切的关键词。正如 Forbes 的行业专家所解释的那样,这可以提高客户满意度并带来更好的销售额。
 
语义搜索与相关概念
区分语义搜索与人工智能和数据科学中的几个相关术语非常重要:
- 关键词搜索: 这是将查询中的字面词与文档进行匹配的传统方法。它无法理解同义词、上下文或用户意图,而这些是语义搜索的核心优势。
 - 向量搜索: 指的是通过计算向量嵌入的邻近度来查找相似项的方法。虽然向量搜索是大多数现代语义搜索系统中的关键组成部分,但语义搜索是一个更广泛的概念,它还包括通过来自 Cohere 等公司的复杂 NLP 模型来理解含义的初始步骤。
 - 知识图谱: 知识图谱将信息构建为实体及其关系。通过提供结构化上下文,它可以显著增强语义搜索,正如Google 知识图谱所见。但是,语义搜索也可以仅使用嵌入直接对非结构化数据进行操作,从而使这两种技术互补。
 - 命名实体识别 (NER): NER 是 NLP 的一个子任务,用于识别文本中的特定实体,如名称、地点和组织。它可以作为 NLP 管道中的一个预处理步骤,将关键概念输入到语义搜索系统中,但它本身不是搜索过程。
 
语义搜索是现代AI 解决方案的基石,它支持更智能和用户友好的系统。这项技术为从日常网络搜索到专门的AI 应用提供支持,包括使用 Ultralytics YOLO 模型构建并通过 Ultralytics HUB 等平台管理的视觉搜索。