用語集

トークン化

NLPとMLにおけるトークン化のパワーをご覧ください。テキストをトークンに分割することで、感情分析やテキスト生成のようなAIタスクがどのように強化されるかを学びます。

トークン化とは、テキスト、コード、画像などの生データのストリームを、トークンと呼ばれるより小さな個別の単位に変換する基本的なプロセスです、トークンとして知られる個別の単位に変換する基本的なプロセスです。この変換はデータ前処理パイプラインの重要な橋渡し役として機能する。構造化されていない人間の情報を、以下のような数値フォーマットに変換する。人工知能（AI）システムが解釈できる解釈する。複雑なデータを管理可能な断片に分解することで、トークン化は以下を可能にします。機械学習モデルがパターンを識別し、意味的関係を学習し意味的関係を学習し、高度な推論タスクを実行できるようになります。この最初のステップがなければ現代のテクノロジーを支えるニューラルネットワークはトレーニングに必要な膨大なデータセットを処理できなくなります。

トークン化 vs トークン

この2つの用語は近接して使われることが多いが、方法と結果を区別することが重要である。

トークン化はデータに適用されるアクションまたはアルゴリズムである。文字列の分割や画像のセグメンテーションなどを含む。spaCyや NLTKのようなツールは、テキストのこのプロセスを容易にする。
トークンは、プロセスによって生成される出力単位である。これらのユニットの性質の詳細についてはトークンの用語解説ページを参照してください。

AIにおけるトークン化の仕組み

トークン化の用途は、処理されるデータの種類によって大きく異なります。データのベクトル表現である埋め込みを生成するという最終的な目的は変わりません。を生成するという最終的な目的は変わりません。

自然言語処理におけるテキストのトークン化

自然言語処理自然言語処理（NLP）、このプロセスでは、文章を単語、サブワード、または文字に分割する。初期の方法では、単にテキストをでテキストを分割するだけだったが、最近の最近の大規模言語モデル（LLM）ではバイトペアエンコーディング（BPE）のような高度なアルゴリズムを利用することでのような高度なアルゴリズムを利用している。これにより GPT-4のようなモデルは、無限の辞書を必要とすることなく、複雑な語彙を処理することができます。無限の辞書を必要としません。

コンピュータ・ビジョンにおける視覚的トークン化

従来、コンピュータ・ビジョン（CV）はピクセル・アレイを使用していた。しかしヴィジョン・トランスフォーマー（ViT）の台頭により画像を固定サイズのパッチ（例えば16x16ピクセル）に分割するという概念を導入した。これらのパッチは平坦化され、視覚的トークンとして扱われる。視覚的トークンとして扱われる。自己注意を用いて、異なる画像領域の重要性を評価することができる。文章がどのように処理されるかに似ている。

実際のアプリケーション

トークン化は単なる理論的概念ではなく、日常的に使用されるAIアプリケーションの多くを支えている。

マルチモーダル検出：YOLO-Worldのような先進モデル YOLOテキストと視覚のギャップを埋める。例えばユーザー入力（例：「赤い車」）をトークン化し、視覚的特徴と照合することで、これらのモデルは、テキストと視覚のギャップを埋める。オープン・ボキャブラリーの物体検出を行う。新しいクラスに対して明示的に再学習する必要がありません。
言語翻訳：Google翻訳のようなサービスは Google 翻訳のようなサービスは、入力されたテキストをトークンに分割し、トークンを介して翻訳することに依存しています。それらをそして出力トークンをターゲット言語に再構築します。
ジェネレーティブ・アート：以下のような例えば安定拡散のような、テキストから画像への生成が可能なモデルは、テキストをトークン化し、ノイズ除去プロセスをガイドする。入力トークンの意味と一致するビジュアルを作成する。

例YOLOトークン化

次の例では、次の方法を示します。 ultralytics の中で暗黙のトークン化を利用している。 YOLOモデルワークフローその .set_classes() メソッドは、モデルの検出フォーカスを動的に導くためにテキストリストをトークン化します。

from ultralytics import YOLO

# Load a pre-trained YOLO-World model
model = YOLO("yolov8s-world.pt")

# Define custom classes; the model tokenizes these strings to search for specific objects
model.set_classes(["backpack", "person"])

# Run prediction on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Show results (only detects the tokenized classes defined above)
results[0].show()

モデル性能における重要性

トークン化戦略の選択は精度と計算効率に直接影響する。非効率的ななトークン化は、自然言語処理における「語彙不足」のエラーや、画像セグメンテーションにおける画像セグメンテーションでは詳細が失われる。次のようなフレームワークがあります。 PyTorchや TensorFlowのようなフレームワークは、このステップを最適化する柔軟なツールを提供している。最新の YOLO11-効率的なデータ処理により、モデルはリアルタイム推論を実行することができる。クラウドGPUからエッジ・デバイスまで、さまざまなハードウェア上でリアルタイム推論を実行することができます。

トークン化

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

トークン化 vs トークン

AIにおけるトークン化の仕組み

自然言語処理におけるテキストのトークン化

コンピュータ・ビジョンにおける視覚的トークン化

実際のアプリケーション

例YOLOトークン化

モデル性能における重要性

このカテゴリの関連記事

未来の物体検出トレンド：注目すべき7つのポイント

Ultralytics YOLO モデルによる車両再識別の強化

Ultralytics YOLO モデルによる衝突予測の向上

Ultralytics コミュニティに参加する