Bảng chú giải thuật ngữ

Chuỗi Prompt (Prompt Chaining)

Tìm hiểu cách chuỗi lệnh nhắc nhở chia nhỏ các tác vụ AI phức tạp thành các quy trình làm việc đáng tin cậy. Khám phá cách tích hợp Ultralytics Sử dụng YOLO26 với LLM để xây dựng các tác nhân AI tiên tiến.

Chuỗi lệnh (Prompt chaining) là một mô hình kiến trúc tiên tiến trong phát triển Trí tuệ Nhân tạo (AI), trong đó một nhiệm vụ phức tạp được phân rã thành một chuỗi các nhiệm vụ phụ nhỏ hơn, dễ quản lý hơn. Trong quy trình làm việc này, đầu ra của một bước—thường được tạo ra bởi Mô hình Ngôn ngữ Lớn (LLM) hoặc hệ thống thị giác máy tính—đóng vai trò là đầu vào cho bước tiếp theo. Không giống như một lệnh duy nhất cố gắng giải quyết một vấn đề đa diện cùng một lúc, chuỗi lệnh cho phép các nhà phát triển xây dựng các ứng dụng đáng tin cậy hơn, dễ kiểm thử hơn và có khả năng hơn. Cách tiếp cận theo mô-đun này rất cần thiết để tạo ra các Tác nhân AI tinh vi có thể suy luận, duyệt web hoặc tương tác với môi trường vật lý.

Cơ chế của việc xâu chuỗi

Về bản chất, chuỗi lời nhắc giải quyết những hạn chế của cửa sổ ngữ cảnh và khả năng suy luận trong các Mô hình Nền tảng . Khi một mô hình được yêu cầu thực hiện quá nhiều thao tác riêng biệt trong một yêu cầu duy nhất (ví dụ: "Phân tích hình ảnh này, trích xuất văn bản, dịch sang tiếng Tây Ban Nha và định dạng thành hóa đơn JSON"), xác suất xảy ra lỗi sẽ tăng lên. Bằng cách chia nhỏ điều này thành một quy trình, các nhà phát triển có thể xác minh tính chính xác của từng giai đoạn.

Các chuỗi xử lý hiệu quả thường sử dụng "mã kết nối" được viết bằng Python hoặc được quản lý bởi các thư viện điều phối như LangChain để xử lý việc chuyển đổi dữ liệu giữa các bước. Điều này cho phép tích hợp các công nghệ khác nhau, chẳng hạn như kết hợp khả năng nhận diện hình ảnh của Phát hiện đối tượng với khả năng diễn đạt trôi chảy của các mô hình tạo văn bản.

Các Ứng dụng Thực tế

Chuỗi phản hồi đặc biệt hiệu quả khi kết nối các phương thức dữ liệu khác nhau, cho phép các mô hình đa phương thức hoạt động trong môi trường công nghiệp và thương mại năng động.

Báo cáo trực quan tự động: Trong sản xuất thông minh , hệ thống kiểm soát chất lượng có thể kết hợp mô hình thị giác với mô hình ngôn ngữ (LLM). Đầu tiên, một mô hình tốc độ cao như Ultralytics YOLO26 quét các linh kiện trên dây chuyền lắp ráp. Kết quả đầu ra có cấu trúc (ví dụ: "Lớp: Lon bị móp, Độ tin cậy: 0,92") được chuyển đổi thành chuỗi văn bản. Văn bản này sau đó được chuyển đến mô hình ngôn ngữ với lời nhắc như "Soạn thảo yêu cầu bảo trì dựa trên lỗi này", tạo ra email dễ đọc cho người quản lý dây chuyền sản xuất.
Hỗ trợ khách hàng theo ngữ cảnh: Chatbot thông minh thường sử dụng chuỗi liên kết để xử lý các truy vấn phức tạp của người dùng. Liên kết đầu tiên trong chuỗi có thể sử dụng Xử lý ngôn ngữ tự nhiên (NLP) để classify Ý định của người dùng. Nếu ý định mang tính kỹ thuật, hệ thống sẽ kích hoạt quy trình Tạo tăng cường truy xuất (RAG) : nó tạo ra các embedding cho truy vấn, tìm kiếm tài liệu trong cơ sở dữ liệu vector và cuối cùng yêu cầu LLM tổng hợp các khối thông tin đã truy xuất thành một câu trả lời hữu ích.

Ví dụ về mã chuyển đổi hình ảnh thành ngôn ngữ

Ví dụ sau đây minh họa "mắt xích" đầu tiên trong một chuỗi: sử dụng Thị giác máy tính (CV) để tạo ra dữ liệu có cấu trúc đóng vai trò là ngữ cảnh cho một lời nhắc tiếp theo.

from ultralytics import YOLO

# Load the YOLO26 model (natively end-to-end and highly efficient)
model = YOLO("yolo26n.pt")

# Step 1: Run inference to 'see' the environment
results = model("https://ultralytics.com/images/bus.jpg")

# Step 2: Format visual detections into a natural language string
det_names = [model.names[int(c)] for c in results[0].boxes.cls]
prompt_context = f"The scene contains: {', '.join(det_names)}. Please describe the likely activity."

# The 'prompt_context' variable is now ready to be sent to an LLM API
print(prompt_context)

Phân biệt các khái niệm liên quan

Để triển khai các kiến trúc Học máy (ML) hiệu quả, việc phân biệt chuỗi lời nhắc với các thuật ngữ tương tự trong lĩnh vực Trí tuệ nhân tạo là rất hữu ích:

So với Phương pháp gợi ý theo chuỗi suy nghĩ : Phương pháp gợi ý theo chuỗi suy nghĩ (CoT) là một kỹ thuật được sử dụng trong một câu hỏi duy nhất để khuyến khích mô hình "trình bày cách làm" (ví dụ: "Hãy suy nghĩ từng bước"). Chuỗi câu hỏi bao gồm nhiều lệnh gọi API riêng biệt, trong đó đầu vào của bước B phụ thuộc vào đầu ra của bước A.
So với Kỹ thuật xử lý yêu cầu (Prompt Engineering ): Kỹ thuật xử lý yêu cầu là một lĩnh vực rộng hơn, tập trung vào việc tối ưu hóa đầu vào văn bản để mang lại hiệu suất mô hình tốt hơn. Chuỗi lệnh (Chaining) là một mô hình kỹ thuật cụ thể, tập trung vào luồng hoạt động tuần tự và kiểm soát logic.
So với Điều chỉnh tham số bằng gợi ý (Prompt Tuning ): Điều chỉnh tham số bằng gợi ý là một phương pháp Tối ưu hóa mô hình cập nhật các tham số có thể học được (gợi ý mềm) trong giai đoạn huấn luyện. Chuỗi gợi ý diễn ra hoàn toàn trong quá trình Suy luận thời gian thực và không làm thay đổi Trọng số mô hình.

Bằng cách tận dụng chuỗi lời nhắc, các nhóm có thể xây dựng các ứng dụng mạnh mẽ tích hợp logic, truy xuất dữ liệu và nhận dạng hành động . Để quản lý các tập dữ liệu và huấn luyện các mô hình thị giác hỗ trợ các chuỗi này, Nền tảng Ultralytics cung cấp một giải pháp tập trung cho việc chú thích, huấn luyện và triển khai.

Chuỗi Prompt (Prompt Chaining)

Xe lửa Ultralytics YOLO các mô hình để hợp lý hóa quy trình làm việc trên khắp các ngành công nghiệp

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Cơ chế của việc xâu chuỗi

Các Ứng dụng Thực tế

Ví dụ về mã chuyển đổi hình ảnh thành ngôn ngữ

Phân biệt các khái niệm liên quan

Đọc thêm trong danh mục này

12 trường hợp sử dụng ảnh chụp từ trên không được hỗ trợ bởi thị giác máy tính

Ước lượng độ sâu đơn ảnh là gì? Tổng quan

Một cái nhìn về việc sử dụng Ultralytics YOLO các mô hình để phát hiện mối đe dọa AI

Tham gia Ultralytics cộng đồng