探索向量搜索如何通过在 NLP、视觉搜索、推荐系统等的数据检索中实现语义相似性来革新 AI!
矢量搜索是一种复杂的信息检索技术,它能根据数学特征而不是精确的关键字匹配,在数据集中识别类似的项目。 而不是精确的关键字匹配。通过将文本、图像或音频等数据 通过将数据(如文本、图像或音频)表示为高维数字向量(称为 嵌入,这种方法能让计算机理解数据背后的上下文和语义。 查询背后的上下文和语义。与传统的 关键词搜索依赖于特定词语的匹配、 矢量搜索计算的是多维空间中项目之间的接近度,因此即使在措辞不同的情况下,也能返回相关结果。 结果。这种能力是现代 人工智能(AI)和 机器学习(ML)系统的基础,尤其是在 处理视频和自然语言等非结构化数据时尤其如此。 自然语言。
矢量搜索的核心机制是将原始数据转换成可搜索的数字格式。这一过程 依赖于深度学习模型来执行 特征提取,将输入转换为 向量嵌入。
矢量搜索驱动着许多用户日常互动的智能功能,涵盖了从电子商务到安全等各个行业。 从电子商务到安全。
任何向量搜索管道的第一步都是生成嵌入。以下代码片段演示了如何 从图像中生成特征向量。 Ultralytics Python软件包和预训练模型,从图像中生成特征向量。
from ultralytics import YOLO
# Load the official YOLO11 model
model = YOLO("yolo11n.pt")
# Generate embeddings for an image file or URL
# The 'embed' method returns the high-dimensional feature vector
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
为了有效地实施这些系统,将向量搜索与数据科学领域中密切相关的术语区分开来是很有帮助的。 数据科学领域中密切相关的术语。
通过利用 实时推理的速度和深度学习特征提取的深度 学习特征提取的深度,矢量搜索允许应用程序超越僵化的数据库,提供直观的、类似于人类的发现体验、 人性化的发现体验。无论是实现 库存的对象检测,还是构建一个 聊天机器人,矢量搜索都是现代人工智能工具中的基础工具。 是现代人工智能开发人员工具包中的基础工具。