知识图谱
了解知识图谱如何通过建模复杂关系来革新 AI,从而实现语义搜索、个性化推荐等。
知识图谱是一种模型,它组织和连接来自各种来源的信息,以结构化的、类似人类的方式表示关于某个领域的知识。与将数据存储在表中的传统数据库不同,知识图谱将信息捕获为实体(真实世界的对象、事件、情况或抽象概念)及其之间关系的网络。这种结构允许人工智能系统比简单地匹配关键词更有效地理解上下文、进行推断和回答复杂问题。这个概念是语义网的核心组成部分,旨在使互联网数据可供机器读取。
知识图的结构包括节点(实体)、边(关系)和属性(描述实体的特征)。例如,在关于电影的图中,“莱昂纳多·迪卡普里奥”将是一个实体节点,“出演”将是一条关系边,“泰坦尼克号”将是另一个实体节点。“莱昂纳多·迪卡普里奥”节点也可能具有诸如“出生日期”之类的属性。著名的公共知识图包括Google 的知识图谱和DBpedia等开源项目。
在 AI 和机器学习中的应用
知识图谱是众多智能应用不可或缺的一部分:
真实世界的例子
- 电子商务个性化: 一家在线零售商使用知识图谱连接客户、产品、品牌、类别、浏览历史和购买数据。当用户搜索“跑鞋”时,该图谱可帮助系统理解相关概念(例如,“马拉松”、“越野跑”)和用户偏好,从而提供高度个性化的结果和补充产品推荐。这提升了整体客户体验。
 - 医疗保健领域的人工智能解决方案: 一家医学研究机构构建了一个知识图谱,将来自PubMed等来源的疾病、症状、基因、药物和研究出版物联系起来。这使研究人员能够查询复杂的关系,例如“查找靶向蛋白X并用于治疗疾病Y的药物”,从而加速药物发现并改善对医学图像分析的诊断支持。
 
知识图谱与相关概念
- 数据库: 传统的关联式数据库将数据存储在预定义的、刚性的表格中,包含行和列。知识图使用灵活的图结构(节点和边),更适合表示复杂、不断演变的关系并推断新的连接。像 Neo4j 这样的现代图形数据库专门用于管理这种结构。
 - 向量搜索: 这是一种基于向量嵌入的接近程度查找相似项的方法。虽然向量数据库对于相似性搜索非常有效,但它们不会像知识图谱那样显式地存储关系。知识图谱定义了显式连接,而向量搜索则根据学习到的特征找到隐式连接。
 - 大型语言模型 (LLM): LLM 在经过大量文本训练后,将其知识隐式地存储在其参数中。知识图谱显式且可验证地存储知识。它们可以一起使用;LLM 可能会通过首先从知识图谱中检索事实信息来回答查询,以减少幻觉并确保准确性,这是检索增强生成 (RAG)的核心技术。