Yolo 深圳
深セン
今すぐ参加
用語集

埋め込み

埋め込みとは何か、また、NLP、レコメンデーション、およびコンピュータビジョンのためにデータ内のセマンティックな関係をキャプチャすることにより、それらがAIをどのように強化するかを学びます。

埋め込みは、離散変数を密で低次元の連続ベクトル表現に変換するものであり、 人間のデータと機械の論理の間の基本的な変換装置として機能する。 人工知能(AI)の領域において、コンピュータは テキスト、画像、音声などの雑然とした非構造化データを 直感的に理解することはできない。 埋め込みは、こうした入力を高次元の数学的空間に存在する実数のリスト(ベクトル)に変換することでこの問題を解決する。従来の符号化がオブジェクトにランダムなIDを割り当てるだけなのに対し、埋め込みは学習を通じて習得されるため、「王」と「女王」といった語や、異なる2匹の猫の画像など、意味的に類似した項目がベクトル空間内で近接して配置されることが保証される。

エンベッディングの仕組み

埋め込みの作成には、特徴抽出用に設計されたニューラルネットワークに生データを入力する工程が含まれます。学習過程において、モデルは入力の重要な特性をコンパクトな数値形式に圧縮することを学びます。例えば、写真を分析するコンピュータビジョン(CV)モデルは、単にピクセルを見るだけでなく、形状、テクスチャ、色を多次元グラフ内の特定の座標にマッピングします。 類似性を測定する際、システムはコサイン類似度や ユークリッド距離といった指標を用いてこれらの座標間の距離を計算する。この数学的な近接性により、アルゴリズムは分類やクラスタリングといった複雑なタスクを高い効率で実行できる。

実際のアプリケーション

埋め込みは、現代のソフトウェア製品で使用される多くの知能的機能のエンジンとして機能する。

  • 意味検索: 従来の検索エンジンはしばしば完全なキーワード一致に依存しており、ユーザーが「auto」と検索しても文書に「car」が含まれる場合には失敗します。埋め込みは単語の背後にある意味を捉えます。検索クエリとデータベース文書をベクトルとして表現することで、システムは特定の単語が異なっていてもユーザーの意図に合致する結果を取得できます。
  • レコメンデーションシステムストリーミングサービスやECサイトは、ユーザー体験をパーソナライズするために埋め込み表現を利用しています。ユーザーがSF映画を視聴すると、システムはその映画の埋め込みベクトルを特定し、データベース内で類似したベクトルを持つ他の映画を検索します。これにより、手動タグやカテゴリだけでなく、コンテンツの類似性に基づいた正確な提案が可能になります。
  • ゼロショット学習: 高度なモデルは、テキストと画像など異なるモダリティを連結するために共同埋め込みを用いる。これにより、システムは 画像埋め込みを物体の名称のテキスト埋め込みと関連付けることで、訓練中に明示的に見たことのない物体を認識することが可能となる。

Pythonによる埋め込み生成

最先端のモデルのような YOLO26 効率的に頑健な画像埋め込みを生成するために使用できます。以下の例は、画像から特徴ベクトルを抽出する方法を示しています。 ultralytics Python パッケージ。

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")

埋め込み vs. 関連概念

AIソリューションを効果的に実装するには、エンベディングを密接に関連する技術用語と区別することが有用である。

  • 埋め込みとベクトル検索埋め込みとはデータ表現そのもの(数値のリスト)を指します。ベクトル検索は、その埋め込みに最も近い近傍を見つけるためにデータベースをクエリする後続のプロセスです。ベクトルデータベースと呼ばれる専用ツールは、こうした埋め込みを大規模に保存・検索するために頻繁に利用されます。
  • 埋め込みとトークン化 自然言語処理(NLP)において、トークン化はテキストを小さな単位(トークン)に分割する予備的なステップである。これらのトークンはその後、埋め込みに変換される。したがって、トークン化はデータを準備する役割を担い、埋め込みはデータの意味を表す役割を担う。
  • 埋め込みと深層学習:深層学習はニューラルネットワークに基づく機械学習のより広範な分野である埋め込みは深層学習アーキテクチャ内の特定の出力または層であり、生の入力とモデルの意思決定層との間の橋渡しとして機能することが多い。

データセットのライフサイクル管理(カスタム埋め込み生成のためのアノテーションやモデルトレーニングを含む)を目指す開発者は、Ultralytics を活用できます。この包括的なツールは、データ管理からデプロイまでのワークフローを簡素化し、アプリケーションを支える埋め込みが高品質で適切に管理されたデータから導出されることを保証します。PyTorchやTensorFlowなどのフレームワークを使用する場合でも、 PyTorchTensorFlowを使用する場合でも、高度なパターン認識システムを構築する上で、埋め込みを習得することは重要なステップです。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加