用語集

BERT（Bidirectional Encoder Representations from Transformers：双方向Transformerエンコーダー表現）

Google の革新的な NLP モデル、BERT をご覧ください。双方向のコンテキスト理解により、検索やチャットボットなどのAIタスクがどのように変化するかをご紹介します。

基本的な機械学習の概念に精通したユーザーへ BERT（Bidirectional Encoder Representations from Transformers：トランスフォーマーからの双方向エンコーダ表現）は、以下の進化における重要なマイルストーンとなる。自然言語処理自然言語処理開発者 Google 研究者 2018年にグーグルの研究者たちによって開発されたこのモデルは、テキストを逐次的（左から右、または右から左）に処理することから、シーケンス全体を同時に分析することへとパラダイムをシフトさせた。シーケンス全体を同時に分析する。双方向のアプローチを活用することで、BERTはより深く、より微妙な言語コンテキストの理解を実現する。言語文脈をより深く、よりニュアンス豊かに理解することができる。の重要な基盤モデルとなっている。

BERTのアーキテクチャ

BERTはその中核で、トランスフォーマー・アーキテクチャーのエンコーダー・メカニズムを利用している。 Transformerアーキテクチャを利用している。その前身とは異なる、とは異なりリカレント・ニューラル・ネットワーク（RNN）に依存することが多かった先行技術とは異なり、BERT は、文中の異なる単語の重要性を相対的に評価するために、自己注意を採用している。文中の異なる単語の相対的な重要度を量るために、自己注意を採用している。これにより、単語間の距離に関係なく、複雑な依存関係を捉えることができる。を捉えることができる。この機能を実現するために、BERTは、以下の2つの革新的な教師なし戦略を使用して、膨大なテキストコーパス上で事前訓練される。革新的な教師なし戦略

マスク言語モデリング（MLM）： このプロセスでは、文中のランダムな単語は隠されるか「マスク」され、モデルは周囲の文脈に基づいて元の単語を予測しようとする。モデルは、周囲の文脈に基づいて元の単語の予測を試みる。これにより、BERT は単語間の双方向関係を理解させる。
次文予測（NSP）： このタスクは、2つ目の文が論理的に1つ目の文に続くかどうかを予測するようモデルを訓練する。これをマスターすることは BERTは、段落構造と一貫性を理解するのに役立ちます。質問応答などのタスクに不可欠です。

一旦事前訓練された BERT は、微調整を通じて特定の下流タスクに適合させることができる。ファインチューニングにより、特定のタスクに適応させることができる。この場合、モデルは、性能を最適化するために、より小さなタスク固有のデータセットでさらに訓練されます。

BERTと他のモデルの比較

BERTを他の著名なAIモデルと区別することは重要である。 AIモデルと区別することが重要である：

対 GPT (Generative Pre-trained Transformer)： どちらもTransformerベースのラージ・ランゲージ・モデル（LLM）であるのに対し、GPTモデルは、テキスト生成に最適化されたデコーダのみのアーキテクチャを利用する。テキスト生成に最適化されたデコーダのみのアーキテクチャを使用しています。対照的に、BERT は既存のテキストを理解し分類するために設計されたエンコーダのみのモデルである。
対コンピュータビジョンモデル： BERT がテキスト・データを処理するのに対して、以下のようなビジョン・モデル YOLO11のような視覚モデルは、ピクセル上で動作し、次のようなタスクを実行する。オブジェクト検出やインスタンスのセグメンテーションなどのタスクを実行する。しかし BERTによって普及した注意メカニズムはビジョン・アーキテクチャに大きな影響を及ぼした。ヴィジョン・トランスフォーマー（ViT）の開発につながった。

実際のアプリケーション

コンテキストを把握するBERTの能力は、さまざまな業界で広く採用されている：

検索エンジンの強化： Google 検索はBERT を統合し、複雑なユーザーのクエリをより適切に解釈できるようにした。たとえば、"大人のための数学練習帳 "というクエリでは BERTは、エンジンが特定の意図を理解するのを助け、結果が一般的な教科書ではなく、大人レベルのリソースに焦点を当てることを保証します。一般的な教科書ではありません。
高度なセンチメント分析：企業は BERT 顧客からのフィードバックを処理するためにを使用しています。皮肉や二重否定のようなニュアンスを理解することで、これらのモデルは、レビューを次のように正確にclassify ことができます。顧客体験を改善するための実用的な洞察を提供します。顧客体験を改善します。

トランスフォーマー・エンコーダーの実装

BERT モデルには通常、事前に訓練された重みが搭載されているが、基本的なアーキテクチャはトランスフォーマ・エンコーダー。以下はその例である。 PyTorchの例は、BERT のビルディングブロックとして機能する基本的なエンコーダレイヤーを初期化する方法を示しています。

import torch
import torch.nn as nn

# Initialize a Transformer Encoder Layer similar to BERT's building blocks
# d_model: number of expected features in the input
# nhead: number of heads in the multiheadattention models
encoder_layer = nn.TransformerEncoderLayer(d_model=512, nhead=8)

# Stack multiple layers to create the full Encoder
transformer_encoder = nn.TransformerEncoder(encoder_layer, num_layers=6)

# Create a dummy input tensor: (sequence_length, batch_size, feature_dim)
src = torch.rand(10, 32, 512)

# Forward pass through the encoder
output = transformer_encoder(src)

print(f"Input shape: {src.shape}")
print(f"Output shape: {output.shape}")
# Output maintains the same shape, containing context-aware representations

BERT（Bidirectional Encoder Representations from Transformers：双方向Transformerエンコーダー表現）

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

BERTのアーキテクチャ

BERTと他のモデルの比較

実際のアプリケーション

トランスフォーマー・エンコーダーの実装

このカテゴリの関連記事

未来の物体検出トレンド：注目すべき7つのポイント

Ultralytics YOLO モデルによる車両再識別の強化

Ultralytics YOLO モデルによる衝突予測の向上

Ultralytics コミュニティに参加する