Glossaire

Assistant(e) virtuel(le)

Découvre comment les assistants virtuels alimentés par l'IA utilisent le NLP, le ML et le TTS pour automatiser les tâches, améliorer la productivité et transformer les industries.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

Un assistant virtuel (AV) est un agent logiciel alimenté par l'intelligence artificielle (IA) conçu pour comprendre les commandes en langage naturel (voix ou texte) et effectuer des tâches pour un utilisateur. Ces tâches peuvent aller d'actions simples comme programmer des rappels ou jouer de la musique à des opérations plus complexes comme la gestion des horaires, le contrôle des appareils domestiques intelligents ou la fourniture d'informations récupérées auprès de diverses sources. Les AV s'appuient fortement sur des technologies telles que le traitement du langage naturel (NLP), la reconnaissance vocale et l'apprentissage automatique (ML) pour interpréter les demandes des utilisateurs, apprendre leurs préférences et améliorer leurs réponses au fil du temps. Parmi les exemples populaires, on peut citer Amazon Alexa, Siri d'Apple et Google Assistant.

Technologies de base

Les assistants virtuels intègrent plusieurs technologies clés de l'IA pour fonctionner :

  • Traitement du langage naturel (NLP) : Permet à l'AV de comprendre le sens du texte de l'utilisateur ou des mots prononcés, y compris l'intention et les entités. Cela implique des techniques allant de la tokenisation de base à la modélisation complexe du langage.
  • Reconnaissance de la parole : Convertit le langage parlé en texte lisible par une machine, formant l'entrée des composants NLP. Les avancées en matière d'apprentissage profond (DL) ont considérablement amélioré la précision de ces systèmes.
  • Gestion du dialogue : Gère le flux de la conversation, maintient le contexte à travers les tours, pose des questions de clarification et détermine l'action ou la réponse appropriée. Les systèmes modernes s'appuient souvent sur des modèles sophistiqués de séquence à séquence.
  • Apprentissage machine (ML) : Utilisé pour divers aspects, notamment l'amélioration de la précision du NLP, la personnalisation des expériences des utilisateurs en fonction de leurs interactions passées(système de recommandation) et l'apprentissage de nouvelles compétences ou de stratégies d'exécution des tâches.

Pertinence dans l'IA et la ML

Les assistants virtuels constituent un domaine d'application majeur qui stimule la recherche et le développement en matière d'IA conversationnelle, de grands modèles de langage (LLM) et d'interaction homme-machine (IHM). Ils nécessitent une intégration sophistiquée de multiples capacités d'IA et de vastes quantités de données de formation pour fonctionner efficacement. La volonté d'avoir des assistants plus naturels, conscients du contexte et proactifs alimente l'innovation dans des domaines tels que la personnalisation et la compréhension de l'intention de l'utilisateur avec une plus grande précision. Bien qu'ils soient principalement basés sur le langage, les futurs assistants virtuels pourraient intégrer la vision par ordinateur (VA), en utilisant potentiellement des modèles tels que Ultralytics YOLO pour des tâches telles que la détection d'objets afin de comprendre le contexte visuel, comblant ainsi le fossé entre les assistants numériques et le monde physique, et aidant peut-être l'IA dans les environnements de soins de santé ou les applications automobiles. Des plateformes comme Ultralytics HUB facilitent la formation et le déploiement de modèles d'IA, y compris les options de formation dans le cloud, qui pourraient devenir des composants de ces systèmes avancés. Répondre aux préoccupations éthiques de l'IA, telles que la confidentialité des données et les biais algorithmiques, est également crucial pour leur développement, en exigeant plus de Transparence dans l'IA.

Applications dans le monde réel

Les assistants virtuels sont intégrés dans de nombreux appareils et plateformes :

  • Smartphones et haut-parleurs intelligents : Fournir un contrôle mains libres, répondre aux questions, lire des médias (par exemple, Siri sur iPhone, Alexa sur les appareils Echo).
  • Automatisation du service à la clientèle : Traiter les demandes initiales des clients, acheminer les appels, fournir une assistance via des sites Web ou des applis, parfois en utilisant des systèmes avancés comme Google Duplex pour des tâches telles que la prise de rendez-vous.
  • Amélioration de la productivité : Gestion des calendriers, établissement de rappels, envoi de courriels ou de messages, et intégration avec les logiciels du lieu de travail. Des outils comme Microsoft Copilot ont pour but d'aider à effectuer diverses tâches professionnelles.
  • Accessibilité : Aider les utilisateurs handicapés en leur offrant une interaction vocale avec la technologie et l'information.

Assistant virtuel ou chatbot

Bien que les assistants virtuels et les Chatbots engagent tous deux une conversation, ils diffèrent en termes de portée et de capacité :

  • Portée : Les AV ont généralement un éventail de fonctions plus large, souvent intégré aux systèmes d'exploitation (iOS, Android) ou à des écosystèmes matériels, ce qui leur permet d'effectuer des actions dans différentes applications et de contrôler les paramètres de l'appareil. Les chatbots sont généralement plus spécialisés, conçus pour des tâches conversationnelles spécifiques dans un contexte particulier, comme un site web d'assistance à la clientèle ou une appli de messagerie.
  • Exécution des tâches : Les AV sont généralement conçus pour exécuter des tâches allant au-delà de la conversation, comme le contrôle des appareils domestiques intelligents, la gestion des informations personnelles ou l'interaction avec d'autres logiciels. Les chatbots se concentrent principalement sur les interactions conversationnelles, en fournissant des informations ou en guidant les utilisateurs à travers des flux de travail spécifiques (par exemple, répondre à des FAQ, effectuer un dépannage simple).
  • Intégration : Les AV servent souvent de plaques tournantes centrales pour interagir avec divers services et appareils, alors que les chatbots sont généralement intégrés à une seule application ou à un seul site web.

Les lignes peuvent s'estomper, en particulier lorsque les chatbots deviennent plus sophistiqués grâce à des technologies comme les LLM, mais la distinction essentielle réside dans l'étendue des tâches et des capacités d'intégration généralement associées aux AV. Le développement des deux s'appuie sur les avancées discutées dans les tutoriels complets d'Ultralytics .

Tout lire