Thuật ngữ

LangChain

Đơn giản hóa quá trình phát triển ứng dụng AI với LangChain! Xây dựng các giải pháp mạnh mẽ do LLM điều khiển như chatbot và công cụ tóm tắt một cách dễ dàng.

LangChain là một framework mã nguồn mở được thiết kế để đơn giản hóa việc tạo ứng dụng sử dụng Mô hình Ngôn ngữ Lớn (LLM) . Nó cung cấp một giao diện chuẩn cho các "chuỗi", là chuỗi các lệnh gọi có thể bao gồm các lời nhắc LLM, các chuỗi khác hoặc các công cụ bên ngoài. Ý tưởng cốt lõi là cho phép các nhà phát triển xây dựng các ứng dụng mạnh mẽ hơn, nhận biết ngữ cảnh và dựa trên dữ liệu bằng cách kết nối các LLM như GPT-4 với các nguồn dữ liệu bên ngoài và các mô-đun tính toán. Điều này cho phép các mô hình vượt ra ngoài kiến thức đã được đào tạo sẵn và tương tác với thế giới một cách năng động hơn. Bạn có thể khám phá thêm các tính năng của nó thông qua tài liệu chính thức của LangChainkho lưu trữ GitHub của LangChain .

Cách thức hoạt động của LangChain: Chuỗi và Đại lý

Kiến trúc mô-đun của LangChain được xây dựng xung quanh hai khái niệm chính: Chuỗi và Tác nhân. Cấu trúc này giúp quản lý sự phức tạp của các tương tác giữa các LLM, nguồn dữ liệu và các công cụ khác.

  • Chuỗi : Đây là những khối xây dựng cơ bản trong LangChain. Chuỗi đại diện cho một chuỗi các thao tác, trong đó đầu ra của một bước trở thành đầu vào cho bước tiếp theo. Một chuỗi đơn giản có thể lấy dữ liệu đầu vào của người dùng, định dạng bằng mẫu nhắc nhở, rồi gửi đến LLM. Các chuỗi phức tạp hơn có thể liên kết nhiều LLM hoặc các công cụ khác lại với nhau để thực hiện các tác vụ phức tạp như tóm tắt tài liệu, sau đó là phân tích cảm xúc . Khung này hỗ trợ việc tạo chuỗi nhắc nhở cho các quy trình làm việc nhiều bước này.
  • Agent : Agent là một loại chuỗi nâng cao hơn, sử dụng LLM làm công cụ suy luận. Agent có thể quyết định sử dụng công cụ nào và theo thứ tự nào để đạt được mục tiêu. Ví dụ: nếu được hỏi "Thời tiết ở Paris hôm qua thế nào và thủ đô của Pháp là gì?", trước tiên, agent có thể sử dụng công cụ tìm kiếm để tìm thông tin thời tiết, sau đó truy cập kiến thức nội bộ của nó để trả lời phần thứ hai của câu hỏi. Điều này cho phép giải quyết vấn đề một cách linh hoạt và năng động, biến agent thành một thành phần cốt lõi của Agentic AI .

Ứng dụng trong thế giới thực

LangChain cho phép phát triển nhiều ứng dụng AI phức tạp bằng cách thu hẹp khoảng cách giữa LLM và các hệ thống bên ngoài.

  1. Trả lời câu hỏi trên tài liệu riêng tư : Một trong những trường hợp sử dụng phổ biến nhất là xây dựng một hệ thống có thể trả lời câu hỏi dựa trên một tập hợp tài liệu cụ thể, chẳng hạn như cơ sở kiến thức nội bộ của công ty hoặc một tập hợp các bài nghiên cứu. LangChain triển khai điều này bằng một kỹ thuật gọi là Retrieval-Augmented Generation (RAG) . Đầu tiên, nó sẽ trích xuất các đoạn văn bản có liên quan từ cơ sở dữ liệu vector , sau đó cung cấp ngữ cảnh này cho một LLM, hệ thống này sẽ tạo ra một câu trả lời chính xác dựa trên thông tin được cung cấp. Điều này khắc phục được hạn chế của dữ liệu huấn luyện tĩnh của LLM.
  2. Tác nhân AI tự động : LangChain được sử dụng để tạo ra các tác nhân tự động có thể thực hiện các tác vụ bằng cách tương tác với nhiều công cụ phần mềm và API khác nhau. Ví dụ, một tác nhân trợ lý cá nhân có thể được xây dựng để quản lý lịch, đặt lịch hẹn và gửi email bằng các công cụ như API Lịch Google và ứng dụng email. Các tác nhân này thể hiện một dạng Trí tuệ Nhân tạo Hẹp (ANI) tập trung vào các tác vụ cụ thể, được ủy quyền.

LangChain và các khái niệm liên quan

Sẽ rất hữu ích nếu phân biệt LangChain với các thuật ngữ liên quan trong hệ sinh thái AI:

  • LLM so với LangChain : LLM (ví dụ: Gemini của Google, Llama của Meta) là các mô hình cốt lõi giúp hiểu và tạo văn bản. LangChain là một khung sử dụng các LLM này làm thành phần để xây dựng ứng dụng. Nó điều phối sự tương tác giữa LLM và các công cụ hoặc nguồn dữ liệu khác.
  • Kỹ thuật Prompt so với LangChain : Kỹ thuật Prompt là nghệ thuật tạo ra các đầu vào hiệu quả cho các chương trình LLM. LangChain cung cấp các công cụ như mẫu Prompt để giúp kỹ thuật Prompt trở nên có hệ thống và có khả năng mở rộng hơn trong ứng dụng, nhưng phạm vi của nó rộng hơn nhiều, bao gồm quản lý trạng thái, tích hợp công cụ và bộ nhớ.
  • Hugging Face Transformers so với LangChain : Thư viện Hugging Face Transformers cung cấp quyền truy cập vào hàng ngàn mô hình và công cụ được đào tạo sẵn để tinh chỉnh và vận hành chúng. LangChain thường tích hợp với các mô hình Hugging Face nhưng tập trung vào nhiệm vụ cấp cao hơn là kết hợp các mô hình này thành các ứng dụng phức tạp hơn là việc triển khai mô hình.

Sự liên quan trong tầm nhìn máy tính

Mặc dù LangChain chủ yếu liên quan đến Xử lý Ngôn ngữ Tự nhiên (NLP) , khả năng phối hợp các công cụ khác nhau của nó khiến nó rất phù hợp với các mô hình đa phương thức kết hợp văn bản với các loại dữ liệu khác, chẳng hạn như hình ảnh. Trong bối cảnh thị giác máy tính (CV) , LangChain có thể được sử dụng để tạo ra các quy trình làm việc phức tạp.

Ví dụ, một ứng dụng có thể sử dụng mô hình Ultralytics YOLO để phát hiện đối tượng theo thời gian thực, sau đó chuyển nhãn đối tượng đã phát hiện đến tác nhân LangChain. Tác nhân này sau đó có thể sử dụng LLM để tạo mô tả chi tiết về cảnh, thực hiện tìm kiếm ngữ nghĩa cho các hình ảnh tương tự, hoặc thậm chí kích hoạt một hành động khác dựa trên dữ liệu đầu vào trực quan. Khi Mô hình Ngôn ngữ Thị giác (Vision Language Models) trở nên phổ biến hơn, các nền tảng như LangChain sẽ đóng vai trò quan trọng trong việc xây dựng các ứng dụng vừa có thể nhìn thấy vừa có thể suy luận về thế giới. Việc tích hợp các mô hình thị giác được đào tạo trên các nền tảng như Ultralytics HUB vào các chuỗi này có thể mở ra những khả năng mới trong các lĩnh vực từ robot đến giám sát thông minh .

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard