Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

LangChain

¡Simplifique el desarrollo de aplicaciones de IA con LangChain! Cree soluciones potentes basadas en LLM, como chatbots y herramientas de resumen, sin esfuerzo.

LangChain es un framework de código abierto diseñado para simplificar la creación de aplicaciones basadas en grandes modelos lingüísticos (LLM). Actúa como de razonamiento de modelos como GPT-4 o Llama con fuentes externas de cálculo y datos. de computación y datos. Al ofrecer una interfaz estandarizada para "cadenas" -secuencias de operaciones que LLM con otras herramientas, LangChain permite el desarrollo de sistemas conscientes del contexto que pueden interactuar dinámicamente con su entorno. dinámicamente con su entorno. Este marco es esencial para crear herramientas sofisticadas, desde chatbots desde chatbots inteligentes hasta complejos agentes de toma de decisiones. de la simple generación de texto a flujos de trabajo procesables.

Conceptos básicos y arquitectura

La arquitectura de LangChain gira en torno a componentes modulares que pueden encadenarse para resolver problemas específicos. específicos, un aspecto central de las operaciones de aprendizaje automático (MLOps).

  • Cadenas: Una cadena es el elemento fundamental que conecta varios componentes en un orden determinado. Por ejemplo, una cadena puede realizar primero preprocesamiento de datos en la entrada del usuario, introducirla en un LLM y, a continuación, formatear la salida. Esto permite técnicas como encadenamiento de avisos, en el que el resultado de un paso sirve de guía para el siguiente.
  • Agentes: Mientras que las cadenas siguen una secuencia codificada, los agentes de IA utilizan un LLM como motor de razonamiento para determinar qué acciones realizar y en qué orden. Un agente puede decidir buscar en Internet, consultar una una base de datos vectorial o realizar un cálculo la petición del usuario.
  • Memoria: Los LLM estándar no retienen información entre interacciones. LangChain proporciona componentes de memoria que permiten a las aplicaciones mantener una ventana de contexto, permitiendo al sistema referenciar interacciones pasadas en una conversación.

Aplicaciones en el mundo real

LangChain desempeña un papel decisivo en el despliegue de versátiles soluciones de Inteligencia Artificial (IA) en diversos sectores.

  1. Generación mejorada por recuperación (RAG): Uno de los casos de uso más populares es la construcción de sistemas que puedan "chatear" con sus datos. Conectando un LLM a documentos privados mediante RAG (Retrieval-Augmented Generation), las organizaciones pueden crear asistentes que respondan a preguntas basadas en wikis internas, contratos legales o manuales técnicos. técnicos. Esto implica indexar el texto en un motor de búsqueda vectorial, lo que permite al LLM citar fuentes concretas en lugar de alucinar con las respuestas.
  2. Análisis multimodal: LangChain puede orquestar flujos de trabajo que combinen texto con otras modalidades. Por ejemplo, en visión por ordenador (CV), una aplicación aplicación podría utilizar un modelo de detección de objetos para identificar elementos en una imagen y luego pasar esos datos estructurados a un LLM para generar una descripción creativa o un informe de seguridad. informe de seguridad.

Integración con la visión por ordenador

La combinación de LangChain con modelos de visión abre poderosas posibilidades para la Inteligencia Artificial. Los desarrolladores pueden utilizar la salida estructurada de las herramientas de inspección visual como contexto para los modelos lingüísticos. El siguiente Python muestra cómo preparar los resultados de detección del último Ultralytics YOLO11 para su uso en una cadena lógica posterior o LLM.

from ultralytics import YOLO

# Load the YOLO11 model for efficient object detection
model = YOLO("yolo11n.pt")

# Run inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Extract class names to feed into a language chain
detected_items = [model.names[int(c)] for c in results[0].boxes.cls]

# Simulate a prompt context for a LangChain input
context = f" The image contains: {', '.join(detected_items)}. Please describe the scene."
print(context)

LangChain frente a términos relacionados

Es útil distinguir LangChain de las tecnologías subyacentes que orquesta:

  • LangChain frente a LLM: El LLM (por ejemplo, el GPT-4 de OpenAI o el Claude de Anthropic) es el "cerebro" que procesa el texto. LangChain es el "marco" que conecta este cerebro con las manos (herramientas) y los oídos (fuentes de datos).
  • LangChain vs. Ingeniería Prompt: La ingeniería de prompt se centra en la elaboración de la entrada de texto óptima para obtener una buena respuesta. LangChain automatiza la gestión de estos avisos, permitiendo plantillas de avisos que pueden ser rellenarse dinámicamente con datos de API o bases de datos externas.

Para aquellos que deseen profundizar sus conocimientos, la documentación oficial de LangChain ofrece guías completas, mientras que el repositorio repositorio GitHub de LangChain ofrece código fuente y ejemplos de la comunidad. La integración de estos flujos de trabajo con herramientas de visión robustas como las que se encuentran en la documentación de Ultralytics puede dar lugar a sistemas multimodales de gran capacidad.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora