Glossaire

LangChain

Simplifiez le développement d'applications d'IA avec LangChain ! Créez sans effort de puissantes solutions basées sur les LLM, telles que des chatbots et des outils de synthèse.

LangChain est un cadre open-source conçu pour simplifier la création d'applications utilisant de grands modèles de langage (LLM). Il fournit une interface standard pour les "chaînes", qui sont des séquences d'appels pouvant inclure des invites LLM, d'autres chaînes ou des outils externes. L'idée de base est de permettre aux développeurs de créer des applications plus puissantes, plus sensibles au contexte et plus axées sur les données en connectant des LLM tels que GPT-4 à des sources de données externes et à des modules de calcul. Cela permet aux modèles d'aller au-delà de leurs connaissances pré-entraînées et d'interagir avec le monde d'une manière plus dynamique. Vous pouvez explorer davantage ses capacités en consultant la documentation officielle de LangChain et le dépôt LangChain GitHub.

Fonctionnement de LangChain : Chaînes et agents

L'architecture modulaire de LangChain s'articule autour de deux concepts clés : les chaînes et les agents. Cette structure permet de gérer la complexité des interactions entre les LLM, les sources de données et les autres outils.

  • Chaînes: Il s'agit des éléments fondamentaux de LangChain. Une chaîne représente une séquence d'opérations, où la sortie d'une étape devient l'entrée de la suivante. Une chaîne simple peut prendre l'entrée de l'utilisateur, la formater à l'aide d'un modèle d'invite, puis l'envoyer à un LLM. Des chaînes plus complexes peuvent relier plusieurs LLM ou d'autres outils afin d'effectuer des tâches sophistiquées telles que le résumé de documents suivi d'une analyse des sentiments. Le cadre facilite l'enchaînement d'invites pour ces flux de travail en plusieurs étapes.
  • Agents: Les agents sont un type de chaîne plus avancé qui utilise un LLM comme moteur de raisonnement. Un agent peut décider quels outils utiliser et dans quel ordre pour atteindre un objectif. Par exemple, si on lui demande "Quel temps faisait-il à Paris hier et quelle est la capitale de la France ?", un agent pourrait d'abord utiliser un outil de recherche pour trouver le temps qu'il fait, puis accéder à ses connaissances internes pour répondre à la deuxième partie de la question. Cela permet une résolution dynamique et flexible des problèmes, ce qui fait des agents un élément central de l'IA agentique.

Applications dans le monde réel

LangChain permet le développement d'une large gamme d'applications d'intelligence artificielle sophistiquées en comblant le fossé entre les LLM et les systèmes externes.

  1. Réponse à des questions sur des documents privés: L'un des cas d'utilisation les plus courants est la construction d'un système capable de répondre à des questions basées sur un ensemble spécifique de documents, tels que la base de connaissances interne d'une entreprise ou une collection d'articles de recherche. LangChain met cela en œuvre en utilisant une technique appelée Retrieval-Augmented Generation (RAG). Il récupère d'abord les morceaux de texte pertinents dans une base de données vectorielle, puis transmet ce contexte à un LLM, qui génère une réponse précise sur la base des informations fournies. Cette technique permet de surmonter les limites des données d'apprentissage statiques d'un LLM.
  2. Agents autonomes d'IA: LangChain est utilisé pour créer des agents autonomes capables d'effectuer des tâches en interagissant avec divers outils logiciels et API. Par exemple, un agent assistant personnel pourrait être conçu pour gérer un calendrier, prendre des rendez-vous et envoyer des courriels en utilisant des outils tels que l'API Google Calendar et un client de messagerie. Ces agents démontrent une forme d'intelligence artificielle étroite (ANI) axée sur des tâches spécifiques et déléguées.

LangChain et concepts connexes

Il est utile de distinguer LangChain des termes apparentés dans l'écosystème de l'IA :

  • LLM et LangChain: Les LLM (par exemple, Gemini de Google, Llama de Meta) sont les modèles de base qui comprennent et génèrent du texte. LangChain est un cadre qui utilise ces LLM comme composants pour construire des applications. Il orchestre l'interaction entre les LLM et d'autres outils ou sources de données.
  • Prompt Engineering vs. LangChain: L'ingénierie des invites est l'art de concevoir des entrées efficaces pour les LLM. LangChain fournit des outils tels que des modèles d'invites pour rendre l'ingénierie des invites plus systématique et évolutive au sein d'une application, mais son champ d'application est beaucoup plus large, incluant la gestion de l'état, l'intégration des outils et la mémoire.
  • Hugging Face Transformers vs. LangChain: La bibliothèque Hugging Face Transformers donne accès à des milliers de modèles pré-entraînés et à des outils permettant de les affiner et de les exécuter. LangChain s'intègre souvent aux modèles Hugging Face mais se concentre sur la tâche de haut niveau consistant à composer ces modèles en applications complexes plutôt que sur la mise en œuvre du modèle lui-même.

Pertinence dans le domaine de la vision par ordinateur

Bien que LangChain soit principalement associé au traitement du langage naturel (NLP), sa capacité à orchestrer différents outils le rend très pertinent pour les modèles multimodaux qui combinent le texte avec d'autres types de données, comme les images. Dans le contexte de la vision par ordinateur, LangChain peut être utilisé pour créer des flux de travail sophistiqués.

Par exemple, une application pourrait utiliser un modèle YOLO d'Ultralytics pour la détection d'objets en temps réel, puis transmettre les étiquettes des objets détectés à un agent LangChain. Cet agent pourrait alors utiliser un LLM pour générer une description riche de la scène, effectuer une recherche sémantique d'images similaires ou même déclencher une autre action basée sur l'entrée visuelle. Au fur et à mesure que les modèles de langage de vision se répandent, des cadres comme LangChain seront essentiels pour construire des applications qui peuvent à la fois voir et raisonner sur le monde. L'intégration dans ces chaînes de modèles de vision formés sur des plateformes comme Ultralytics HUB peut ouvrir de nouvelles possibilités dans des domaines allant de la robotique à la surveillance intelligente.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers