了解嵌入如何连接人类数据与机器逻辑。学习如何结合 Ultralytics YOLO26 生成用于AI任务的向量表示,并探索 Ultralytics 平台。
嵌入是离散变量的密集、低维、连续向量表示,是人类数据和机器逻辑之间的基本转换器。在 人工智能 (AI) 领域,计算机无法直观地理解杂乱的 非结构化数据,例如文本、图像或音频。嵌入通过将这些输入转换为实数列表(称为向量)来解决此问题,这些向量存在于高维数学空间中。与可能仅为对象分配随机 ID 的传统编码不同,嵌入是通过训练学习的,确保语义相似的项(例如“国王”和“女王”等词,或两只不同猫的图像)在 向量空间 中彼此靠近。
嵌入的创建涉及将原始数据输入到旨在进行 特征提取 的 神经网络 中。在训练期间,模型学习将输入的本质特征压缩成紧凑的数值形式。例如,分析照片的 计算机视觉 (CV) 模型不仅仅看到像素;它将形状、纹理和颜色映射到多维图中的特定坐标。在衡量相似性时,系统使用 余弦相似度 或 欧几里得距离 等指标计算这些坐标之间的距离。这种数学上的接近性使得算法能够高效地执行分类和聚类等复杂任务。
嵌入是现代软件产品中许多智能功能的引擎。
诸如 YOLO26 之类的最先进模型可以有效地生成鲁棒的图像嵌入。以下示例展示了如何使用 ultralytics Python 软件包。
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")
为了有效实施AI解决方案,区分嵌入与密切相关的技术术语是很有帮助的。
希望管理数据集生命周期(包括用于生成自定义嵌入的标注和模型训练)的开发者可以使用 Ultralytics Platform。这个综合工具简化了从数据管理到部署的工作流程,确保为您的应用程序提供支持的嵌入来自高质量、精心整理的数据。无论是使用 PyTorch 还是 TensorFlow 等框架,掌握嵌入都是构建复杂 模式识别 系统的关键一步。

开启您的机器学习未来之旅