ナレッジグラフ
複雑な関係性をモデル化し、セマンティック検索やパーソナライズされたレコメンデーションなどを可能にするナレッジグラフが、AIにどのような革命をもたらすかをご覧ください。
ナレッジグラフは、様々なソースからの情報を整理し接続することで、ドメインに関する知識を構造化された人間のような方法で表現するモデルである。テーブルにデータを格納する従来のデータベースとは異なり、ナレッジグラフは情報をエンティティ(現実世界のオブジェクト、イベント、状況、抽象概念)とそれらの間の関係のネットワークとして捉える。この構造により、AIシステムは文脈を理解し、推論を導き、複雑な質問に対して、単にキーワードをマッチングさせるよりも効果的に回答することができる。この概念はセマンティックウェブの中核をなすもので、インターネットデータを機械可読にすることを目的としている。
知識グラフの構造は、ノード(実体)、エッジ(関係)、プロパティ(実体を記述する属性)で構成される。例えば、映画に関するグラフでは、"Leonardo DiCaprio" はエンティティ・ノード、"acted in" は関係エッジ、"Titanic" は別のエンティティ・ノードになります。レオナルド・ディカプリオ "ノードは、"生年月日 "のようなプロパティを持つかもしれない。著名なパブリックナレッジグラフには、Googleのナレッジグラフや DBpediaのようなオープンソースプロジェクトがある。
AIと機械学習における応用
知識グラフは、数多くのインテリジェント・アプリケーションに不可欠である:
- セマンティック検索:検索エンジンはナレッジグラフを使ってクエリの背後にある意図を理解し、単純なキーワードマッチングを超えた、より関連性の高い、文脈に沿った結果を提供する。これにより、「アップルのCEOは誰か」というような直接的な質問にも、グラフをたどることで答えることができる。
- レコメンデーションシステム:ユーザー、アイテム、それらの属性間の関係をモデル化することで、ナレッジグラフは、小売業におけるAIやコンテンツストリーミングなどの分野において、より洗練されたパーソナライズされたレコメンデーションを可能にする。
- 質問応答と チャットボットナレッジグラフは、AIシステムがエンティティの関係をナビゲートすることによって複雑な質問に答えることを可能にする構造化された知識を提供し、会話型AIの能力を向上させる。
- データ統合:ナレッジグラフは、異なるソースからのデータを統合し、組織全体の情報の一貫した相互接続されたビューを作成することができます。これはビッグデータ分析に不可欠であり、SPARQLのような言語を使用してクエリされることが多い。
- 他のAIモデルを強化する:知識グラフは、他のAIタスクに文脈的な背景知識を提供することができる。例えば、コンピュータビジョン(CV)では、グラフはUltralytics YOLO11のようなモデルによって識別されたオブジェクトを、その特性や機能に関する情報にリンクさせることができ、より豊かなシーン理解につながります。Ultralytics HUBのようなプラットフォームは、この構造化された知識を活用できるデータセットとモデルを管理します。
実例
- Eコマースのパーソナライゼーション:あるオンライン小売業者は、顧客、商品、ブランド、カテゴリー、閲覧履歴、購入データを結びつけるナレッジグラフを使用している。ユーザーが「ランニングシューズ」を検索すると、グラフは関連する概念(例:「マラソン」、「トレイルランニング」)やユーザーの嗜好を理解し、高度にパーソナライズされた結果と補完的な商品の推奨を提供します。これにより、全体的な顧客体験が向上する。
- ヘルスケアにおけるAIソリューション:ある医療研究機関では、PubMedなどの情報源から、病気、症状、遺伝子、薬、研究論文を関連付けたナレッジグラフを構築している。これにより、研究者は「タンパク質Xを標的とし、疾患Yの治療に使用される薬剤を検索する」といった複雑な関係をクエリできるようになり、創薬が加速し、医療画像解析の診断サポートが向上する。
ナレッジグラフと関連概念
- データベース:従来のリレーショナル・データベースは、行と列を持つ、あらかじめ定義された硬直したテーブルにデータを格納する。ナレッジグラフは柔軟なグラフ構造(ノードとエッジ)を使用し、複雑で進化する関係を表現し、新しいつながりを推測するのに適している。Neo4jのような最新のグラフデータベースは、この構造を管理するために特別に設計されています。
- ベクトル検索:これは、ベクトル埋込みの近さに基づいて類似アイテムを見つける方法である。ベクトル・データベースは類似検索の効率が高いが、知識グラフのように関係を明示的に保存しているわけではない。知識グラフは明示的なつながりを定義するが、ベクトル検索は学習された特徴に基づいて暗黙的なつながりを見つける。
- 大規模言語モデル(LLM):LLMは膨大な量のテキストで学習された後、暗黙的に知識をパラメータに格納する。ナレッジグラフは、明示的かつ検証可能な知識を格納する。LLMは、幻覚を減らし、正確さを保証するために、まず知識グラフから事実情報を検索することによってクエリに答えるかもしれない。