用語集

質問応答

AIと自然言語処理（NLP）における質問応答（QA）を探求しましょう。システムがデータから事実に基づく回答を抽出する仕組みを学び、Ultralytics ビジュアルQAタスクをどのように実現しているかを発見してください。

質問応答（QA）は、人工知能（AI）および自然言語処理（NLP）における専門分野であり、人間が自然言語で投げかける質問に自動的に回答するシステムの構築に焦点を当てています。従来の検索エンジンが関連文書やウェブページのリストを抽出するのとは異なり、QAシステムはユーザーのクエリの意図を理解し、正確で事実に基づいた回答を提供しようと試みます。この能力は、膨大な非構造化データリポジトリとユーザーの具体的な情報ニーズとの間のギャップを埋めるものであり、現代のAIエージェントや仮想アシスタントにとって不可欠な構成要素となっています。

質問応答の仕組み

質問応答システムの中核には、主に3つの段階がある：質問処理、文書検索、回答抽出である。まずシステムは入力クエリを分析し、何が問われているか（例：「誰」「どこ」「どのように」といった質問）を判断し、主要なエンティティを特定する。次に、クエリに関連する記述を見つけるため、知識ベース（閉じたマニュアル群やオープンなインターネットなど）を検索します。最後に、機械読解理解などの高度な技術を用いて、テキスト内の正確な回答を特定するか、統合された情報に基づいて応答を生成します。

現代のQAシステムは、高い精度を達成するために大規模言語モデル（LLM）や BERT（Bidirectional Encoder Representations from Transformers）のようなトランスフォーマーを活用することが多い。これらのモデルは膨大な量のテキストで事前学習されており、キーワードベースの手法よりも文脈やニュアンス、意味的関係性を把握できる。

質問応答システムの種類

QAシステムは、一般的にアクセスするデータの領域とサポートするモダリティによって分類される。

オープンドメインQA：これらのシステムは、通常は膨大なデータセットやオープンインターネットにアクセスすることで、ほぼあらゆるトピックに関する質問に答えます。例としては、Amazon Alexa やApple Siriのような音声アシスタントに投げかけられる一般的な質問が挙げられます。
クローズドドメインQA：特定の主題（法律文書や医療記録など）に限定される。範囲を制限することで、これらのシステムは高い精度を達成し、LLMにおける幻覚のリスクを低減することが多い。
ビジュアル質問応答（VQA）：この高度なバリエーションでは、システムが画像に基づいて質問に答えることが求められます（例：「その車はどんな色ですか？」）。VQAには、テキスト処理とコンピュータビジョン（CV）を組み合わせたマルチモーダルAIが必要であり、これにより「見る」ことと「読む」ことを同時に行うことが可能となります。

実際のアプリケーション

QA技術の展開は、産業が膨大な非構造化データと関わる方法を変革している。

医療と臨床支援： 医療分野におけるAIでは、QAシステムがPubMedなどのリポジトリから薬物相互作用、症状、治療プロトコルを迅速に特定することで医療専門家を支援する。アレン人工知能研究所などの機関は、より優れたQAを通じて科学的発見を加速させるため、セマンティック・スカラーの開発を積極的に進めている。
エンタープライズナレッジマネジメント：大企業ではQA機能を備えた社内ボットを活用し、従業員が社内ポリシー情報や技術文書を即座に検索できるように支援。手動検索と比較して生産性を大幅に向上させている。
自動化されたカスタマーサポート： 小売業にAIを統合することで、企業はQAボットを導入し、注文状況や返品ポリシーに関する特定のユーザー問い合わせを解決します。これにより、人間の介入なしに24時間365日のサポートを提供します。

視覚的要素：視覚とテキストの架け橋

ビジュアル質問応答（VQA）では、システムはまずシーン内の物体とその関係を識別する必要があります。高性能な物体検出モデルはQAシステムの「目」として機能します。Ultralytics 最適であり、シーン要素を迅速かつ正確に検出します。検出された要素は推論のために言語モデルへ入力されます。

Python 、Ultralytics モデルを使用して画像から視覚的コンテキスト（オブジェクト）を抽出する方法を示しています。これはVQAパイプラインの基礎となるステップです：

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (latest generation)
model = YOLO("yolo26n.pt")

# Perform inference to identify objects in the image
# This provides the "visual facts" for a QA system
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected objects and their labels
results[0].show()

質問応答

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

質問応答の仕組み

質問応答システムの種類

実際のアプリケーション

視覚的要素：視覚とテキストの架け橋

関連概念

このカテゴリの関連記事

コンピュータービジョンを活用した12の航空写真活用事例

単眼深度推定とは何か？概要

Ultralytics YOLO を用いたAI脅威検知の活用事例

Ultralytics コミュニティに参加する

質問応答

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

質問応答の仕組み

質問応答システムの種類

実際のアプリケーション

視覚的要素：視覚とテキストの架け橋

関連概念

このカテゴリの関連記事

コンピュータービジョンを活用した12の航空写真活用事例

単眼深度推定とは何か？ 概要

Ultralytics YOLO を用いたAI脅威検知の活用事例

Ultralytics コミュニティに参加する

単眼深度推定とは何か？概要