深圳Yolo 视觉
深圳
立即加入
词汇表

嵌入

探索嵌入技术如何连接人类数据与机器逻辑。学习使用Ultralytics 生成AI任务的向量表示,并深入探索Ultralytics 。

嵌入是离散变量的密集、低维、连续向量表示,充当人类数据与机器逻辑之间的基础转换器。在人工智能领域,计算机无法直观理解文本、图像或音频等杂乱无章的非结构化数据。 嵌入技术通过将这些输入转换为实数列表(即存在于高维数学空间中的向量)来解决此问题。与传统编码仅为对象分配随机ID不同,嵌入技术通过训练实现学习,确保语义相似的元素——如"国王"与"女王"等词汇,或两只不同猫的图像——在向量空间中紧密邻接。

嵌入式如何工作

嵌入的创建过程涉及将原始数据输入到 专门用于特征提取 的神经网络中。在训练期间,模型 学会将输入数据的核心特征压缩为紧凑的数值形式。例如, 分析照片的计算机视觉(CV)模型不仅识别像素, 还会将形状、纹理和颜色映射到多维图中的特定坐标。 在相似性测算中,系统通过余弦相似度 或欧几里得距离等度量标准计算坐标间距离。这种数学上的邻近性使算法能够高效执行分类、聚类等复杂任务。

实际应用

嵌入技术作为现代软件产品中众多智能功能的核心引擎。

  • 语义搜索传统搜索引擎通常依赖精确关键词匹配,当用户查询"auto"而文档包含"car"时就会失效。嵌入技术能捕捉词语背后的语义。通过将搜索查询和数据库文档表示为向量,系统即使遇到词汇差异也能检索出符合用户意图的结果。
  • 推荐系统流媒体服务和电商网站利用嵌入技术实现用户体验个性化。当用户观看一部科幻电影时,系统会识别该影片的嵌入向量,并在数据库中搜索具有相似向量的其他影片。这使得推荐系统能够基于内容相似性进行精准推荐,而非仅依赖人工标签或分类。
  • 零样本学习:先进模型通过联合嵌入技术将不同模态(如文本与图像)进行关联。这使得系统能够通过将图像嵌入与物体名称的文本嵌入建立关联,从而识别训练过程中从未明确见过的物体。

使用Python生成嵌入向量

诸如...之类的尖端模型 YOLO26 可用于高效生成 鲁棒图像嵌入。以下示例演示了如何使用 从图像中提取特征向量。 ultralytics Python 软件包。

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")

嵌入与相关概念

要有效实施人工智能解决方案,区分嵌入与相关技术术语很有帮助。

  • 嵌入与向量搜索嵌入本身即为数据表示形式(即数值列表)。向量搜索则是后续通过查询数据库来寻找该嵌入最近邻的过程。通常采用称为向量数据库的专用工具来大规模存储和检索这些嵌入。
  • 嵌入与分词 在自然语言处理(NLP)中,分词是将文本拆解为更小单元(词元)的初步步骤。这些词元随后会被映射到嵌入向量。因此,分词负责数据准备,而嵌入则承载数据的语义信息。
  • 嵌入与深度学习:深度学习是基于神经网络的更广泛机器学习领域。嵌入是深度学习架构中的特定输出层或中间层,通常充当原始输入与模型决策层之间的桥梁。

开发者若需管理数据集的生命周期——包括为生成定制嵌入向量而进行的标注和模型训练——可Ultralytics 。这一综合性工具简化了从数据管理到部署的整个工作流程,确保应用程序所依赖的嵌入向量源自高质量、精心整理的数据。无论使用PyTorch等框架 PyTorchTensorFlow,掌握嵌入技术都是构建复杂模式识别系统的重要环节。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入