用語集

バーチャルアシスタント

AIを搭載したバーチャルアシスタントが、NLP、ML、TTSを利用してどのようにタスクを自動化し、生産性を向上させ、業界を変革するかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

バーチャル・アシスタント(VA)とは、自然言語のコマンド(音声またはテキスト)を理解し、ユーザーのためにタスクを実行するように設計された人工知能(AI)を搭載したソフトウェア・エージェントである。これらのタスクは、リマインダーの設定や音楽の再生といった単純な動作から、スケジュールの管理、スマートホームデバイスの制御、さまざまなソースから取得した情報の提供といった複雑な操作まで多岐にわたる。VAは、自然言語処理(NLP)音声認識機械学習(ML)のような技術に大きく依存し、ユーザーの要求を解釈し、好みを学習し、時間の経過とともに応答を改善する。人気のある例としては、Amazon AlexaAppleのSiriGoogle Assistantなどがある。

コアテクノロジー

バーチャル・アシスタントは、いくつかの主要なAI技術を統合して機能する:

  • 自然言語処理(NLP):VAがユーザーのテキストや話し言葉の背後にある意味(意図やエンティティなど)を理解できるようにする。これには、基本的なトークン化から複雑な言語モデリングまでの技術が含まれる。
  • 音声認識:話し言葉を機械が読み取り可能なテキストに変換し、NLPコンポーネントの入力を形成する。ディープラーニング(DL)の進歩により、これらのシステムの精度は大幅に向上している。
  • ダイアログ・マネジメント:会話の流れを管理し、順番が変わっても文脈を維持し、明確な質問をし、適切な行動や応答を決定する。最近のシステムでは、洗練されたシーケンスツーシーケンスモデルを活用することが多い。
  • 機械学習(ML):NLPの精度向上、過去のインタラクションに基づくユーザー体験のパーソナライズ(レコメンデーションシステム)、新しいスキルやタスク実行戦略の学習など、さまざまな局面で使用される。

AIとMLにおける関連性

バーチャルアシスタントは、会話AI、大規模言語モデル(LLM)ヒューマンコンピュータインタラクション(HCI)の研究開発を推進する主要な応用分野である。バーチャル・アシスタントが効果的に機能するには、複数のAI機能と膨大な量のトレーニング・データを高度に統合する必要があります。より自然で、文脈を認識し、積極的なアシスタントを求める動きは、パーソナライゼーションや、より高い精度で ユーザーの意図を理解するような分野でのイノベーションを促進する。主に言語ベースではあるが、将来のVAはコンピュータビジョン(CV)を統合し、以下のようなモデルを使用する可能性がある。 Ultralytics YOLOのようなモデルを使用して、視覚的なコンテキストを理解し、デジタルアシスタントと物理的な世界の間のギャップをさらに埋め、おそらくヘルスケア設定や 自動車アプリケーションの AIを支援するかもしれません。Ultralytics HUBのようなプラットフォームは、クラウドトレーニングオプションを含むAIモデルのトレーニングとデプロイメントを容易にし、そのような高度なシステムのコンポーネントとなり得る。データ・プライバシーや アルゴリズム・バイアスなどAIの倫理的懸念に対処することも、AIの発展において極めて重要であり、AIのより一層の透明性が求められる。

実世界での応用

バーチャルアシスタントは、数多くのデバイスやプラットフォームに組み込まれている:

  • スマートフォンとスマートスピーカー:ハンズフリーで操作したり、質問に答えたり、メディアを再生したりできる(例:iPhoneのSiri、EchoデバイスのAlexa)。
  • カスタマーサービス自動化:顧客からの最初の問い合わせに対応し、電話をルーティングし、ウェブサイトやアプリを介してサポートを提供し、時には予約などのタスクにGoogle Duplexのような高度なシステムを使用する。
  • 生産性の向上:カレンダーの管理、リマインダーの設定、電子メールやメッセージの送信、職場のソフトウェアとの統合。Microsoft コパイロットのようなツールは、さまざまな仕事作業を支援することを目的としている。
  • アクセシビリティ:音声による技術や情報との対話を提供することで、障害のあるユーザーを支援すること。

バーチャルアシスタントとチャットボット

バーチャルアシスタントもチャットボットも会話はするが、その範囲と能力は異なる:

  • 範囲:VAは通常、より幅広い機能を持ち、多くの場合、オペレーティング・システム(iOS, Android)やハードウェアのエコシステムに統合されていることが多く、異なるアプリケーション間でアクションを実行したり、デバイスの設定を制御したりすることができる。チャットボットは通常より専門的で、カスタマー・サポート・ウェブサイトやメッセージング・アプリのような特定のコンテキストにおける特定の会話タスクのために設計されている。
  • タスクの実行:VAは一般的に、スマートホームデバイスの制御、個人情報の管理、他のソフトウェアとの対話など、会話以外のタスクを実行するように設計されている。チャットボットは主に会話によるインタラクションに重点を置き、情報を提供したり、特定のワークフロー(FAQへの回答や簡単なトラブルシューティングなど)を通じてユーザーを誘導したりします。
  • 統合:VAは多くの場合、様々なサービスやデバイスと対話するための中心的なハブとして機能するが、チャットボットは通常、単一のアプリケーションやウェブサイト内に組み込まれる。

特にLLMのようなテクノロジーを使ってチャットボットがより洗練されるにつれて、その境界線は曖昧になる可能性がありますが、中核となる違いは、一般的にVAに関連するタスクと統合機能の幅にあります。両方の開発は、Ultralytics 包括的なチュートリアルで説明されている進歩に依存しています。

すべて読む