Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

LangChain

Tìm hiểu cách LangChain đơn giản hóa việc phát triển ứng dụng LLM. Khám phá cách kết nối các mô hình AI với dữ liệu thời gian thực và tích hợp chúng. Ultralytics YOLO26 dành cho các tác vụ thị giác.

LangChain là một framework mã nguồn mở được thiết kế để đơn giản hóa việc phát triển các ứng dụng dựa trên các mô hình ngôn ngữ lớn (LLM) . Mặc dù các LLM như GPT-4 rất mạnh mẽ, nhưng chúng thường hoạt động độc lập, thiếu khả năng nhận biết dữ liệu thời gian thực hoặc bối cảnh kinh doanh cụ thể. LangChain đóng vai trò như một cầu nối, cho phép các nhà phát triển kết nối các thành phần khác nhau—chẳng hạn như lời nhắc, mô hình và nguồn dữ liệu bên ngoài—để tạo ra các ứng dụng phức tạp, có khả năng nhận biết ngữ cảnh. Bằng cách quản lý sự phức tạp của các tương tác này, LangChain cho phép các hệ thống trí tuệ nhân tạo (AI) suy luận về các vấn đề và thực hiện hành động dựa trên các đầu vào động.

Các thành phần cốt lõi của LangChain

Khung này được xây dựng dựa trên một số khái niệm mô-đun hoạt động cùng nhau để nâng cao quy trình xử lý ngôn ngữ tự nhiên (NLP) .

  • Chuỗi: Khối xây dựng cơ bản, một chuỗi là một trình tự các lệnh gọi đến một LLM hoặc các tiện ích khác. Ví dụ, một chuỗi đơn giản có thể nhận đầu vào của người dùng, định dạng nó bằng cách sử dụng mẫu kỹ thuật lời nhắc và chuyển nó đến một mô hình để tạo ra phản hồi. Các chuỗi phức tạp hơn có thể sắp xếp nhiều lệnh gọi, trong đó đầu ra của một bước trở thành đầu vào cho bước tiếp theo.
  • Các tác nhân: Không giống như các chuỗi tuân theo một trình tự được lập trình sẵn, tác nhân AI sử dụng LLM (Learning Learning Learning) làm công cụ suy luận để xác định hành động nào cần thực hiện và theo thứ tự nào. Các tác nhân có thể truy vấn API, tìm kiếm trên web hoặc truy cập cơ sở dữ liệu để trả lời các câu hỏi yêu cầu kiến ​​thức cập nhật.
  • Truy xuất: Để dựa vào dữ liệu thực tế để đưa phản hồi của mô hình, LangChain hỗ trợ Tạo lập tăng cường bằng truy xuất (RAG) . Điều này bao gồm việc lấy các tài liệu liên quan từ cơ sở dữ liệu vector dựa trên các truy vấn của người dùng và đưa chúng vào cửa sổ ngữ cảnh của mô hình.
  • Bộ nhớ: Các mô hình ngôn ngữ lập trình cấp thấp (LLM) tiêu chuẩn không có trạng thái, nghĩa là chúng quên các tương tác trước đó. LangChain cung cấp các thành phần bộ nhớ cho phép chatbot duy trì ngữ cảnh xuyên suốt cuộc hội thoại, mô phỏng sự liên tục của một cuộc đối thoại giữa người với người.

Các Ứng dụng Thực tế

LangChain đóng vai trò quan trọng trong việc đưa trí tuệ nhân tạo tạo sinh từ các sổ tay thử nghiệm sang môi trường sản xuất trong nhiều ngành công nghiệp khác nhau.

  1. Trò chuyện với dữ liệu của bạn (RAG): Một trong những ứng dụng phổ biến nhất là tìm kiếm doanh nghiệp. Các doanh nghiệp sử dụng LangChain để nhập tài liệu nội bộ, PDF hoặc hướng dẫn kỹ thuật vào một chỉ mục có thể tìm kiếm. Khi một nhân viên đặt câu hỏi, hệ thống sẽ truy xuất đoạn văn liên quan và đưa nó vào LLM, đảm bảo câu trả lời chính xác và dựa trên dữ liệu của công ty chứ không phải là suy diễn. Điều này cải thiện đáng kể khả năng chắt lọc kiến ​​thức trong các tổ chức.
  2. Phân tích đa phương thức: LangChain có thể điều phối các quy trình làm việc kết hợp văn bản với các phương thức khác, chẳng hạn như Thị giác máy tính (CV) . Ví dụ, một hệ thống an ninh có thể sử dụng tính năng phát hiện đối tượng để xác định những người không được phép truy cập và sau đó kích hoạt tác nhân LangChain để soạn thảo báo cáo sự cố và gửi email cho người giám sát.

Tích hợp với Thị giác máy tính

Sự kết hợp giữa dữ liệu hình ảnh có cấu trúc và suy luận ngôn ngữ là một lĩnh vực phát triển đầy tiềm năng. Các nhà phát triển có thể sử dụng các mô hình hiệu suất cao như Ultralytics YOLO26 để trích xuất thông tin chi tiết từ hình ảnh—chẳng hạn như số lượng đối tượng, lớp hoặc vị trí—và chuyển dữ liệu có cấu trúc này vào quy trình làm việc LangChain để phân tích sâu hơn hoặc mô tả bằng ngôn ngữ tự nhiên.

Đoạn mã Python sau đây minh họa cách trích xuất tên lớp được phát hiện bằng cách sử dụng một Ultralytics mô hình này tạo ra ngữ cảnh dựa trên văn bản có thể được đưa vào chuỗi xử lý ngôn ngữ tiếp theo.

from ultralytics import YOLO

# Load the YOLO26 model to generate structured data for a chain
model = YOLO("yolo26n.pt")

# Run inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detection class names to feed into a LangChain prompt
detections = [model.names[int(c)] for c in results[0].boxes.cls]

# Format the output as a context string for an LLM
chain_input = f"The image contains the following objects: {', '.join(detections)}."
print(chain_input)

Phân biệt các thuật ngữ chính

Điều quan trọng là phải phân biệt LangChain với các công nghệ mà nó điều phối:

  • LangChain so với LLM : LLM (ví dụ: GPT-4 của OpenAI hoặc...) Anthropic Claude (của 's) là "bộ não" xử lý và tạo ra văn bản. LangChain là "khung sườn" hay cơ sở hạ tầng kết nối bộ não đó với các đường dẫn tiền xử lý dữ liệu , API và giao diện người dùng.
  • LangChain so với Kỹ thuật tạo lời nhắc : Kỹ thuật tạo lời nhắc tập trung vào việc tạo ra văn bản đầu vào tối ưu để có được kết quả tốt nhất từ ​​mô hình. LangChain tự động hóa việc quản lý các lời nhắc này, cho phép tạo ra các mẫu lời nhắc động được điền dữ liệu theo chương trình trước khi gửi đến mô hình.

Đối với các nhà phát triển muốn xây dựng các hệ thống AI mạnh mẽ, việc nghiên cứu tài liệu chính thức của LangChain cung cấp những hiểu biết chuyên sâu về kỹ thuật, trong khi tài liệu Ultralytics cung cấp các công cụ cần thiết để tích hợp các khả năng xử lý hình ảnh tiên tiến vào các quy trình làm việc thông minh này. Ngoài ra, người dùng có thể tận dụng Nền tảng Ultralytics để quản lý các tập dữ liệu và quy trình huấn luyện cung cấp dữ liệu cho các hệ thống đa phương thức tiên tiến này.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay