Yolo 深圳
深セン
今すぐ参加
用語集

固有表現認識(NER)

固有表現認識(NER)で洞察を解き放つ。AIが非構造化テキストを多様なアプリケーション向けの実用的なデータに変換する方法をご覧ください。

固有表現認識(NER)は、自然言語処理(NLP)の中でも重要なサブタスクである。 自然言語処理(NLP) の重要なサブタスクであり、構造化されていないテキスト内の特定のエンティティの識別と分類に焦点を当てている。単語のシーケンスを分析することで NER アルゴリズムは、単語のシーケンスを分析することで、個人名、組織名、場所、医療コード、時間表現、時刻表現など、あらかじめ定義されたグループに項目を特定し、分類する、 場所、医療コード、時間表現、金銭的価値などである。このプロセスは生テキストを構造化された情報 情報へと変換する。 人工知能(AI)システムは ドキュメントの「誰が、何を、どこで」を理解できるようになります。組織がますます膨大な量の NERは、非構造化データを実用的な洞察に変換するための基本的なステップである。 非構造化データを実用的な洞察に変換する アナリティクスと自動化

名前固有表現認識の仕組み

NERの核心は、統計モデルと機械学習(ML)技術に依存している。 機械学習(ML)技術に依存している。 言語パターンを発見する。初期のシステムはルールベースのアプローチと辞書を使用していたが、最近の実装では ディープラーニング(DL)やニューラルネットワーク(NN) ニューラルネットワーク(NN)を利用する。これらの高度なモデルは これらの高度なモデルは、膨大な注釈付きテキスト・コーパスで学習されるため、文脈の手がかりや言語的特徴を学習することができる。

最先端のNERシステムは、しばしば以下を活用している。 トランスフォーマ・アーキテクチャを利用することが多い。 大規模言語モデル(LLM)に見られるようなトランスフォーマーアーキテクチャを利用している。自己注意のような これらのモデルは、自己注意のようなメカニズムを採用することで 文全体の単語間の関係を分析し、旧来の方法よりも精度を大幅に向上させる。NERシステムの性能は NERシステムの性能は、その学習データの品質と初期設定の精度に大きく依存する。 大きく依存する。 大きく依存する。

実際のアプリケーション

NERは、多様な産業にわたる多くのインテリジェント・アプリケーションのバックボーンとして機能している。

  • ヘルスケアとバイオメディカル分析医療分野では、NERは臨床記録や研究論文から症状、薬品名、用法・用量などの重要なデータを抽出します。 を抽出する。この機能は この機能は患者記録管理を合理化し を合理化し、大規模な疫学研究を促進することで 疫学研究を促進する。
  • 検索と推薦の強化:検索エンジンは、ユーザーのクエリの背後にある意図を理解するためにNERを利用する。 ユーザーのクエリの背後にある意図を理解する。ナイキ」(ブランド)や「ランニングシューズ」(商品カテゴリー)のようなエンティティを識別することで、プラットフォームは的確な検索結果を提供することができる。 製品カテゴリー)のようなエンティティを特定することで、プラットフォームは正確な セマンティックな検索結果を提供することができる。同様に 推薦システムは、抽出された ユーザーの興味に沿ったコンテンツや製品を提案する。
  • 自動化されたカスタマーサポート:カスタマーサービス・プラットフォームは、NERを使用してサポート・チケットを自動的にルーティングする。 を自動的にルーティングします。製品モデルや保証日などのエンティティを認識することで、以下のことが可能になります。 チャットボットは、ユーザーの問題に即座に対処したり、適切な人間のエージェント 適切な人間のエージェントにエスカレーションし、全体的なカスタマーエクスペリエンスを向上させます。 カスタマー・エクスペリエンスを向上させます。

PythonNERの実装

Ultralytics コンピュータ・ビジョンに特化しているが、MLモデルを展開するワークフローは、ドメイン間で一貫している。 ドメインで一貫している。テキストベースのNERタスクでは、開発者はしばしば spaCyのような確立されたライブラリを使用することが多い。次の例では、事前に訓練されたモデルをロードし、文からエンティティを抽出する方法を示します。 エンティティを抽出する方法を示します。

import spacy

# Load the pre-trained English pipeline (requires: python -m spacy download en_core_web_sm)
nlp = spacy.load("en_core_web_sm")

# Process a text string containing entities
text = "Ultralytics launched YOLO11 in Madrid during 2024."
doc = nlp(text)

# Iterate over identified entities and print their labels
for ent in doc.ents:
    print(f"Entity: {ent.text} | Label: {ent.label_}")
# Output examples: 'Ultralytics' (ORG), 'Madrid' (GPE), '2024' (DATE)

NERと関連概念

特に複雑なパイプラインを設計する際には、NERを他のAIによるデータの解釈と区別することが重要である。 パイプライン

  • 物体検出NER がテキスト内のエンティティを識別するのに対し、オブジェクト検出は画像やビデオ内のエンティティ(オブジェクト)を識別する。 以下のようなモデルがある。 YOLO11のようなモデルは 車や人のような物体の周囲にバウンディング・ボックスを描く に相当する。どちらのタスクも非構造化データを構造化することを目的としており、一方はピクセルを使用し、もう一方はトークンを使用する。
  • センチメント分析このタスクは テキストの感情的なトーン(肯定的、否定的、中立的)を分類する。NERは何が議論されているかを抽出 (例:「iPhone」)を抽出し、センチメント分析は書き手がそれについてどう感じているかを判断する。
  • 自然言語理解(NLU) NLUは、機械による読解を包含する、より広い包括的な用語である。NERはNLUの特定のコンポーネントである、 NERはNLUの特定の構成要素であり、意図分類や関係抽出などのタスクと並んでいる。
  • キーワード抽出:単語を意味カテゴリに分類するNERとは異なり(例:Person、 日付など)に分類するNERとは異なり、キーワード抽出は単に文書中の最も関連性の高い用語を特定するだけである。 を特定するだけである。

ツールとプラットフォーム

強固なエコシステムがNERモデルの開発と展開を支えている。

  • ライブラリ: NLTKStanfordのCoreNLPスイートなどのオープンソースライブラリ 提供する。商用API Google Cloud Natural LanguageAmazon Comprehendのような商用APIは、エンティティ抽出のためのマネージドサービスを提供している。
  • モデルのライフサイクル:AIモデルのトレーニングとデプロイを管理するには、効率的な運用が必要です。 Ultralytics Platformは、これらの MLOpsプロセスを簡素化し ツールを提供し、データセットの管理、モデルのトレーニング、ソリューションの効果的な展開を実現します。 マルチモーダルモデルを生産可能な状態にします。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加