了解什么是嵌入 (embeddings),以及它们如何通过捕获 NLP、推荐系统和计算机视觉中数据的语义关系来驱动 AI。
嵌入是离散变量的稠密、低维和连续向量表示,是现代 的基本数据格式。 人工智能(AI).与单次编码等稀疏表示不同,单次编码会产生大量低效向量、 嵌入通过将高维输入(如文字、图像或音频)映射到数据中,从而捕捉数据的语义关系和潜在含义。 输入(如文字、图像或音频)映射到一个紧凑的数字空间。在这个学习到的向量空间中,具有相似特征或语境的项目 在这个学习到的向量空间中,具有相似特征或上下文的条目被定位在彼此相近的位置,这样就能 机器学习 (ML)模型 直观地理解和处理复杂的模式。
嵌入背后的核心概念是将原始数据转换成计算机可以高效处理的数学形式。 高效处理的数学形式。这一过程通常涉及 神经网络 (NN)学习 将输入映射到实数向量。在 模型训练在模型训练阶段,网络会调整 这些向量,使它们之间的距离与它们所代表项目的相似性相对应。
例如,在 自然语言处理(NLP)中,"king"(国王)和 "queen"(王后)这两个词的嵌入在数学上会比 "apple"(苹果)更接近。 而不是 "苹果",这反映了它们之间的语义关系。这种转换是 降维的一种形式,它在保留基本信息的同时剔除了噪音,使分类或聚类等下游任务的效率大大提高。 聚类等下游任务。
嵌入通常是作为训练的副产品生成的 深度学习(DL)模型 的副产品。诸如 PyTorch和 TensorFlow提供了专门用于 设计来学习这些表征。
您可以使用标准的 计算机视觉 (CV)工作流程为图像生成嵌入词。 下面的Python 代码段演示了如何使用预先训练好的嵌入式算法从图像中提取嵌入信息。 Ultralytics YOLO11分类模型从图像中提取嵌入词。
from ultralytics import YOLO
# Load a YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Generate embeddings for an image from a URL
# The embed() method specifically returns the feature vector
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")
# Output the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")
嵌入式技术彻底改变了系统处理非结构化数据的方式,为以前不可能实现的功能提供了动力。 不可能实现的功能。
了解嵌入式和相关术语之间的区别对于驾驭人工智能领域至关重要。
通过将抽象概念转换为数学向量,嵌入技术弥补了人类直觉与机器逻辑之间的差距。 通过将抽象概念转化为数学矢量,嵌入 模式识别功能 在当今最先进的人工智能应用中都能看到。

