¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glosario

LangChain

¡Simplifique el desarrollo de aplicaciones de IA con LangChain! Cree soluciones potentes basadas en LLM, como chatbots y herramientas de resumen, sin esfuerzo.

LangChain es un framework de código abierto diseñado para simplificar la creación de aplicaciones que utilizan Modelos de Lenguaje Grandes (LLM). Proporciona una interfaz estándar para las "cadenas", que son secuencias de llamadas que pueden incluir prompts de LLM, otras cadenas o herramientas externas. La idea principal es permitir a los desarrolladores construir aplicaciones más potentes, conscientes del contexto y basadas en datos conectando LLM como GPT-4 a fuentes de datos externas y módulos computacionales. Esto permite a los modelos ir más allá de su conocimiento pre-entrenado e interactuar con el mundo de una manera más dinámica. Puede explorar sus capacidades más a fondo a través de la documentación oficial de LangChain y el repositorio de LangChain en GitHub.

¿Cómo funciona LangChain: Cadenas y Agentes?

La arquitectura modular de LangChain se basa en dos conceptos clave: Cadenas y Agentes. Esta estructura ayuda a gestionar la complejidad de las interacciones entre los LLM, las fuentes de datos y otras herramientas.

  • Cadenas: Estos son los bloques de construcción fundamentales en LangChain. Una cadena representa una secuencia de operaciones, donde la salida de un paso se convierte en la entrada para el siguiente. Una cadena simple podría tomar la entrada del usuario, formatearla utilizando una plantilla de mensaje y luego enviarla a un LLM. Las cadenas más complejas pueden vincular múltiples LLM u otras herramientas para realizar tareas sofisticadas como el resumen de documentos seguido del análisis de sentimientos. El marco facilita el encadenamiento de prompts para estos flujos de trabajo de varios pasos.
  • Agentes: Los agentes son un tipo más avanzado de cadena que utiliza un LLM como motor de razonamiento. Un agente puede decidir qué herramientas utilizar y en qué orden para lograr un objetivo. Por ejemplo, si se le pregunta "¿Qué tiempo hizo ayer en París y cuál es la capital de Francia?", un agente podría primero utilizar una herramienta de búsqueda para encontrar el tiempo y luego acceder a su conocimiento interno para responder a la segunda parte de la pregunta. Esto permite una resolución de problemas dinámica y flexible, lo que convierte a los agentes en un componente central de la IA agentic.

Aplicaciones en el mundo real

LangChain permite el desarrollo de una amplia gama de aplicaciones de IA sofisticadas al cerrar la brecha entre los LLM y los sistemas externos.

  1. Preguntas y respuestas sobre documentos privados: Uno de los casos de uso más comunes es la creación de un sistema que pueda responder preguntas basadas en un conjunto específico de documentos, como la base de conocimiento interna de una empresa o una colección de artículos de investigación. LangChain implementa esto utilizando una técnica llamada Generación Aumentada por Recuperación (RAG). Primero, recupera fragmentos de texto relevantes de una base de datos vectorial y luego alimenta este contexto a un LLM, que genera una respuesta precisa basada en la información proporcionada. Esto supera la limitación de los datos de entrenamiento estáticos de un LLM.
  2. Agentes de IA Autónomos: LangChain se utiliza para crear agentes autónomos que pueden realizar tareas interactuando con varias herramientas de software y APIs. Por ejemplo, se podría construir un agente asistente personal para gestionar un calendario, reservar citas y enviar correos electrónicos utilizando herramientas como la API de Google Calendar y un cliente de correo. Estos agentes demuestran una forma de Inteligencia Artificial Estrecha (ANI) centrada en tareas específicas y delegadas.

LangChain y conceptos relacionados

Es útil distinguir LangChain de términos relacionados en el ecosistema de la IA:

  • LLMs vs. LangChain: Los LLMs (por ejemplo, Gemini de Google, Llama de Meta) son los modelos centrales que comprenden y generan texto. LangChain es un framework que utiliza estos LLMs como componentes para construir aplicaciones. Orquesta la interacción entre los LLMs y otras herramientas o fuentes de datos.
  • Ingeniería de Prompts (Prompt Engineering) vs. LangChain: La ingeniería de prompts es el arte de crear entradas efectivas para LLMs. LangChain proporciona herramientas como plantillas de prompts para hacer que la ingeniería de prompts sea más sistemática y escalable dentro de una aplicación, pero su alcance es mucho más amplio, incluyendo la gestión del estado, la integración de herramientas y la memoria.
  • Hugging Face Transformers vs. LangChain: La biblioteca Hugging Face Transformers proporciona acceso a miles de modelos pre-entrenados y herramientas para el ajuste fino y la ejecución de los mismos. LangChain a menudo se integra con los modelos de Hugging Face, pero se centra en la tarea de más alto nivel de componer estos modelos en aplicaciones complejas en lugar de la implementación del modelo en sí.

Relevancia en la visión artificial

Si bien LangChain se asocia principalmente con el Procesamiento del Lenguaje Natural (PNL), su capacidad para orquestar diferentes herramientas lo hace muy relevante para los modelos multimodales que combinan texto con otros tipos de datos, como imágenes. En el contexto de la visión artificial (CV), LangChain se puede utilizar para crear flujos de trabajo sofisticados.

Por ejemplo, una aplicación podría usar un modelo Ultralytics YOLO para la detección de objetos en tiempo real y luego pasar las etiquetas de los objetos detectados a un agente LangChain. Este agente podría entonces usar un LLM para generar una descripción detallada de la escena, realizar una búsqueda semántica de imágenes similares, o incluso desencadenar otra acción basada en la entrada visual. A medida que los Modelos de Lenguaje de Visión se vuelven más frecuentes, los frameworks como LangChain serán cruciales para construir aplicaciones que puedan tanto ver como razonar sobre el mundo. La integración de modelos de visión entrenados en plataformas como Ultralytics HUB en estas cadenas puede desbloquear nuevas posibilidades en campos desde la robótica hasta la vigilancia inteligente.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles