Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

LangChain

Đơn giản hóa việc phát triển ứng dụng AI với LangChain! Xây dựng các giải pháp mạnh mẽ dựa trên LLM như chatbot và công cụ tóm tắt một cách dễ dàng.

LangChain là một nền tảng mã nguồn mở được thiết kế để đơn giản hóa việc tạo ứng dụng dựa trên Mô hình Ngôn ngữ Lớn (LLM) . Nó hoạt động như một cầu nối, cho phép các nhà phát triển kết hợp khả năng suy luận của các mô hình như GPT-4 hoặc Llama với các nguồn tính toán và dữ liệu bên ngoài. Bằng cách cung cấp một giao diện chuẩn hóa cho các "chuỗi" - chuỗi các thao tác liên kết LLM với các công cụ khác - LangChain cho phép phát triển các hệ thống nhận thức ngữ cảnh có khả năng tương tác động với môi trường của chúng. Nền tảng này rất cần thiết để xây dựng các công cụ tinh vi, từ chatbot thông minh đến các tác nhân ra quyết định phức tạp, vượt ra ngoài việc tạo văn bản đơn giản để tạo ra các quy trình làm việc có thể thực hiện được.

Khái niệm cốt lõi và kiến trúc

Kiến trúc của LangChain xoay quanh các thành phần mô-đun có thể được kết nối với nhau để giải quyết các vấn đề cụ thể, một khía cạnh cốt lõi của Hoạt động học máy (MLOps) hiện đại.

  • Chuỗi : Khối xây dựng cơ bản, một chuỗi kết nối nhiều thành phần theo một thứ tự cụ thể. Ví dụ, một chuỗi có thể thực hiện tiền xử lý dữ liệu đầu vào của người dùng, đưa vào LLM, rồi định dạng đầu ra. Điều này hỗ trợ các kỹ thuật như chuỗi nhắc nhở (prompt chaining ), trong đó đầu ra của một bước đóng vai trò là lời nhắc cho bước tiếp theo.
  • Tác nhân : Trong khi các chuỗi tuân theo một trình tự được mã hóa cứng, tác nhân AI sử dụng LLM như một công cụ suy luận để xác định hành động nào cần thực hiện và theo thứ tự nào. Tác nhân có thể quyết định tìm kiếm trên web, truy vấn cơ sở dữ liệu vector hoặc chạy phép tính dựa trên yêu cầu của người dùng.
  • Bộ nhớ : Các LLM tiêu chuẩn không lưu giữ thông tin giữa các tương tác. LangChain cung cấp các thành phần bộ nhớ cho phép các ứng dụng duy trì một cửa sổ ngữ cảnh , cho phép hệ thống tham chiếu các tương tác trước đó trong một cuộc hội thoại.

Các Ứng dụng Thực tế

LangChain đóng vai trò quan trọng trong việc triển khai các giải pháp Trí tuệ nhân tạo (AI) đa năng trên nhiều ngành công nghiệp khác nhau.

  1. Thế hệ Tăng cường Truy xuất (RAG) : Một trong những trường hợp sử dụng phổ biến nhất là xây dựng các hệ thống có thể "trò chuyện" với dữ liệu của bạn. Bằng cách kết nối một LLM với các tài liệu riêng tư thông qua Thế hệ Tăng cường Truy xuất (RAG) , các tổ chức có thể tạo ra các trợ lý trả lời các câu hỏi dựa trên wiki nội bộ, hợp đồng pháp lý hoặc hướng dẫn kỹ thuật. Điều này bao gồm việc lập chỉ mục văn bản vào một công cụ tìm kiếm vector , cho phép LLM trích dẫn các nguồn cụ thể thay vì đưa ra câu trả lời ảo.
  2. Phân tích Đa phương thức : LangChain có thể điều phối các quy trình làm việc kết hợp văn bản với các phương thức khác. Ví dụ: trong thị giác máy tính (CV) , một ứng dụng có thể sử dụng mô hình phát hiện đối tượng để xác định các mục trong hình ảnh, sau đó chuyển dữ liệu có cấu trúc đó đến LLM để tạo mô tả sáng tạo hoặc báo cáo an toàn.

Tích hợp với Thị giác máy tính

Việc kết hợp LangChain với các mô hình thị giác mở ra những khả năng mạnh mẽ cho Agentic AI . Các nhà phát triển có thể sử dụng kết quả đầu ra có cấu trúc từ các công cụ kiểm tra trực quan làm bối cảnh cho các mô hình ngôn ngữ. Sau đây là Python đoạn trích minh họa cách chuẩn bị kết quả phát hiện từ mô hình Ultralytics YOLO11 mới nhất để sử dụng trong chuỗi logic hạ lưu hoặc dấu nhắc LLM.

from ultralytics import YOLO

# Load the YOLO11 model for efficient object detection
model = YOLO("yolo11n.pt")

# Run inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Extract class names to feed into a language chain
detected_items = [model.names[int(c)] for c in results[0].boxes.cls]

# Simulate a prompt context for a LangChain input
context = f" The image contains: {', '.join(detected_items)}. Please describe the scene."
print(context)

LangChain so với các thuật ngữ liên quan

Sẽ rất hữu ích nếu phân biệt LangChain với các công nghệ cơ bản mà nó điều phối:

  • LangChain so với LLM : LLM (ví dụ: GPT-4 của OpenAI hoặc Anthropic (Claude) là "bộ não" xử lý văn bản. LangChain là "khung" kết nối bộ não này với bàn tay (công cụ) và tai (nguồn dữ liệu).
  • LangChain so với Kỹ thuật Nhắc nhở : Kỹ thuật nhắc nhở tập trung vào việc tạo ra văn bản đầu vào tối ưu để có được phản hồi tốt. LangChain tự động hóa việc quản lý các lời nhắc này, cho phép tạo ra các mẫu lời nhắc có thể được điền động bằng dữ liệu từ API hoặc cơ sở dữ liệu bên ngoài.

Đối với những ai muốn tìm hiểu sâu hơn, tài liệu chính thức của LangChain cung cấp hướng dẫn toàn diện, trong khi kho lưu trữ GitHub của LangChain cung cấp mã nguồn và các ví dụ cộng đồng. Việc tích hợp các quy trình làm việc này với các công cụ thị giác mạnh mẽ như trong tài liệu Ultralytics có thể tạo ra các hệ thống đa phương thức có khả năng cao.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay