Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Chuỗi Prompt (Prompt Chaining)

Khám phá prompt chaining: một kỹ thuật AI từng bước giúp tăng cường độ chính xác, khả năng kiểm soát và độ chuẩn xác cho các tác vụ phức tạp với Mô hình Ngôn ngữ Lớn (Large Language Models).

Chuỗi prompt là một kỹ thuật mạnh mẽ được sử dụng để quản lý các tác vụ phức tạp bằng cách chia chúng thành một loạt các prompt nhỏ hơn, được kết nối với nhau cho một mô hình Trí tuệ nhân tạo (AI). Thay vì dựa vào một prompt lớn duy nhất để giải quyết một vấn đề nhiều bước, một chuỗi được tạo ra, trong đó đầu ra từ một prompt trở thành đầu vào cho prompt tiếp theo. Cách tiếp cận theo mô-đun này cải thiện độ tin cậy, tính minh bạch và hiệu suất tổng thể của các hệ thống AI, đặc biệt là Mô hình ngôn ngữ lớn (LLM). Nó cho phép xây dựng các quy trình làm việc phức tạp có thể liên quan đến logic, các công cụ bên ngoài và thậm chí nhiều mô hình AI khác nhau.

Cách Chuỗi Prompt Hoạt Động

Về cốt lõi, prompt chaining điều phối một chuỗi các lệnh gọi đến một hoặc nhiều mô hình AI. Quá trình tuân theo một luồng logic: một lời nhắc ban đầu được gửi đến mô hình, phản hồi của nó được xử lý và thông tin chính từ phản hồi đó được trích xuất và sử dụng để xây dựng lời nhắc tiếp theo trong chuỗi. Chu kỳ này tiếp tục cho đến khi đạt được mục tiêu cuối cùng. Phương pháp này rất cần thiết để xây dựng AI agent có thể suy luận và hành động.

Phương pháp này cho phép phân tách tác vụ, trong đó mỗi bước trong chuỗi được tối ưu hóa cho một nhiệm vụ con cụ thể. Ví dụ: một prompt có thể được thiết kế để trích xuất thông tin, prompt tiếp theo để tóm tắt dữ liệu và prompt cuối cùng để tạo văn bản sáng tạo. Các framework như LangChain được thiết kế đặc biệt để đơn giản hóa việc phát triển các chuỗi này bằng cách quản lý trạng thái, prompt và tích hợp các công cụ bên ngoài.

Các Ứng dụng Thực tế

Chuỗi prompt rất linh hoạt và có nhiều ứng dụng thực tế trong học máy (ML)tự động hóa quy trình làm việc.

  1. Tổng đài viên hỗ trợ khách hàng tự động: Người dùng gửi một phiếu yêu cầu hỗ trợ phức tạp.

    • Lời nhắc 1 (Phân loại): LLM phân tích tin nhắn của người dùng để phân loại vấn đề (ví dụ: "thanh toán", "kỹ thuật", "truy cập tài khoản").
    • Lời nhắc 2 (Truy xuất Dữ liệu): Dựa trên phân loại "kỹ thuật", hệ thống thực hiện bước Tạo Tăng cường Truy xuất (RAG). Một lời nhắc mới yêu cầu AI tìm kiếm cơ sở kiến thức kỹ thuật để tìm các tài liệu liên quan.
    • Lời nhắc 3 (Tạo Câu trả lời): Các tài liệu được truy xuất được đưa vào một lời nhắc cuối cùng hướng dẫn LLM tổng hợp thông tin và tạo ra một giải pháp rõ ràng, từng bước cho người dùng. Tìm hiểu thêm về cơ chế của hệ thống RAG.
  2. Sáng tạo nội dung đa phương thức: Một nhà tiếp thị muốn tạo một chiến dịch truyền thông xã hội cho một sản phẩm mới.

    • Lời nhắc 1 (Tạo Văn bản): Nhà tiếp thị cung cấp chi tiết sản phẩm và một lời nhắc yêu cầu LLM tạo ra năm khẩu hiệu tiếp thị hấp dẫn.
    • Lời nhắc 2 (Tạo Hình ảnh): Khẩu hiệu đã chọn sau đó được sử dụng làm seed cho một lời nhắc mới направленный vào một mô hình chuyển văn bản thành hình ảnh như Stable Diffusion để tạo ra một hình ảnh trực quan tương ứng.
    • Lời nhắc 3 (Phân tích Hình ảnh): Một mô hình thị giác máy tính, chẳng hạn như mô hình Ultralytics YOLO được huấn luyện tùy chỉnh, sau đó có thể được sử dụng trong một bước tiếp theo để đảm bảo hình ảnh được tạo đáp ứng các nguyên tắc về thương hiệu (ví dụ: xác nhận logo chính xác có mặt). Các mô hình như vậy có thể được quản lý và triển khai thông qua các nền tảng như Ultralytics HUB.

So sánh Xâu chuỗi Prompt với các khái niệm liên quan

Việc phân biệt chuỗi prompt với các kỹ thuật tương tự sẽ rất hữu ích:

  • Kỹ thuật Prompt (Prompt Engineering): Đây là thực hành rộng rãi về việc thiết kế các prompt hiệu quả. Chuỗi prompt là một kỹ thuật cụ thể trong kỹ thuật prompt, tập trung vào việc cấu trúc nhiều prompt một cách tuần tự.

  • Chain-of-Thought (CoT) Prompting: CoT nhằm mục đích cải thiện khả năng suy luận của LLM trong một prompt duy nhất bằng cách yêu cầu nó "suy nghĩ từng bước". Ngược lại, prompt chaining chia nhỏ tác vụ thành nhiều bước prompt riêng biệt, có thể liên quan đến các mô hình khác nhau hoặc các công cụ ở mỗi bước.

  • Retrieval-Augmented Generation (RAG): RAG là một kỹ thuật trong đó AI truy xuất thông tin từ một nguồn bên ngoài trước khi tạo ra phản hồi. RAG thường được sử dụng như một bước cụ thể trong một chuỗi prompt lớn hơn, chứ không phải là chính cơ chế chuỗi.

  • Làm phong phú Prompt (Prompt Enrichment): Điều này bao gồm việc tự động thêm ngữ cảnh vào prompt ban đầu của người dùng trước khi nó được gửi đến AI. Nó tăng cường một prompt duy nhất thay vì điều phối quá trình xử lý tuần tự của nhiều prompt được kết nối với nhau.

  • Tinh chỉnh Prompt (Prompt Tuning): Một phương pháp tinh chỉnh hiệu quả tham số (PEFT) học các "prompt mềm" (embedding) trong quá trình huấn luyện mô hình. Nó là một kỹ thuật tùy chỉnh mô hình, khác biệt với cấu trúc thực thi thời gian chạy của chuỗi prompt.

Chuỗi prompt là một phương pháp mạnh mẽ để cấu trúc các tương tác với các mô hình AI tiên tiến như LLM và thậm chí tích hợp chúng với các hệ thống AI khác, bao gồm cả những hệ thống được sử dụng để phân loại hình ảnh hoặc phân đoạn instance. Điều này làm cho các tác vụ phức tạp trở nên dễ quản lý hơn và cải thiện độ tin cậy của kết quả trong nhiều ứng dụng học máy, từ phân tích dữ liệu cơ bản đến các hệ thống AI đa phương thức phức tạp. Việc triển khai các mô hình chuyên dụng có thể tạo thành các thành phần của các chuỗi như vậy được tạo điều kiện thuận lợi bởi các nền tảng end-to-end. Bạn có thể khám phá nhiều tác vụ thị giác máy tính có thể được tích hợp vào các quy trình làm việc nâng cao này.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard