探索向量搜索如何利用嵌入来查找相似数据。学习如何使用Ultralytics YOLO26生成高质量向量以实现精确信息检索。
向量搜索是一种复杂的信息检索方法,它根据数据集中的数学特征而非精确的关键词匹配来识别相似项。与依赖查找特定字符的传统关键词搜索不同,向量搜索分析数据的底层语义含义。这种技术是现代人工智能 (AI)应用的基础,因为它允许计算机理解抽象概念之间的关系,以惊人的准确性处理图像、音频文件和自然语言文本等非结构化数据。
向量搜索的核心是将原始数据转换为高维数值向量,即嵌入。这个过程将项目映射到多维空间中的点,在这个空间中,概念上相似的项目彼此靠近。
为了实现向量搜索,您必须首先将数据转换为向量。以下代码片段演示了如何生成 特征图 和嵌入,通过 ultralytics 包和预训练的YOLO26模型。
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
向量搜索是当今软件生态系统中许多直观功能背后的引擎,弥合了计算机视觉 (CV)与用户意图之间的鸿沟。
区分向量搜索与类似术语有助于理解完整的机器学习 (ML)流程。
对于构建相似性搜索系统的团队而言,管理数据集和训练嵌入模型是至关重要的第一步。Ultralytics 平台通过提供数据管理、云训练和模型部署工具来简化此工作流。通过确保您的基础模型(无论是用于目标检测还是分类)具有高性能,您可以确保生成的向量提供准确且有意义的搜索结果。

开启您的机器学习未来之旅