Tìm hiểu cách chuỗi lệnh nhắc nhở chia nhỏ các tác vụ AI phức tạp thành các quy trình làm việc đáng tin cậy. Khám phá cách tích hợp Ultralytics Sử dụng YOLO26 với LLM để xây dựng các tác nhân AI tiên tiến.
Chuỗi lệnh (Prompt chaining) là một mô hình kiến trúc tiên tiến trong phát triển Trí tuệ Nhân tạo (AI), trong đó một nhiệm vụ phức tạp được phân rã thành một chuỗi các nhiệm vụ phụ nhỏ hơn, dễ quản lý hơn. Trong quy trình làm việc này, đầu ra của một bước—thường được tạo ra bởi Mô hình Ngôn ngữ Lớn (LLM) hoặc hệ thống thị giác máy tính—đóng vai trò là đầu vào cho bước tiếp theo. Không giống như một lệnh duy nhất cố gắng giải quyết một vấn đề đa diện cùng một lúc, chuỗi lệnh cho phép các nhà phát triển xây dựng các ứng dụng đáng tin cậy hơn, dễ kiểm thử hơn và có khả năng hơn. Cách tiếp cận theo mô-đun này rất cần thiết để tạo ra các Tác nhân AI tinh vi có thể suy luận, duyệt web hoặc tương tác với môi trường vật lý.
Về bản chất, chuỗi lời nhắc giải quyết những hạn chế của cửa sổ ngữ cảnh và khả năng suy luận trong các Mô hình Nền tảng . Khi một mô hình được yêu cầu thực hiện quá nhiều thao tác riêng biệt trong một yêu cầu duy nhất (ví dụ: "Phân tích hình ảnh này, trích xuất văn bản, dịch sang tiếng Tây Ban Nha và định dạng thành hóa đơn JSON"), xác suất xảy ra lỗi sẽ tăng lên. Bằng cách chia nhỏ điều này thành một quy trình, các nhà phát triển có thể xác minh tính chính xác của từng giai đoạn.
Các chuỗi xử lý hiệu quả thường sử dụng "mã kết nối" được viết bằng Python hoặc được quản lý bởi các thư viện điều phối như LangChain để xử lý việc chuyển đổi dữ liệu giữa các bước. Điều này cho phép tích hợp các công nghệ khác nhau, chẳng hạn như kết hợp khả năng nhận diện hình ảnh của Phát hiện đối tượng với khả năng diễn đạt trôi chảy của các mô hình tạo văn bản.
Chuỗi phản hồi đặc biệt hiệu quả khi kết nối các phương thức dữ liệu khác nhau, cho phép các mô hình đa phương thức hoạt động trong môi trường công nghiệp và thương mại năng động.
Ví dụ sau đây minh họa "mắt xích" đầu tiên trong một chuỗi: sử dụng Thị giác máy tính (CV) để tạo ra dữ liệu có cấu trúc đóng vai trò là ngữ cảnh cho một lời nhắc tiếp theo.
from ultralytics import YOLO
# Load the YOLO26 model (natively end-to-end and highly efficient)
model = YOLO("yolo26n.pt")
# Step 1: Run inference to 'see' the environment
results = model("https://ultralytics.com/images/bus.jpg")
# Step 2: Format visual detections into a natural language string
det_names = [model.names[int(c)] for c in results[0].boxes.cls]
prompt_context = f"The scene contains: {', '.join(det_names)}. Please describe the likely activity."
# The 'prompt_context' variable is now ready to be sent to an LLM API
print(prompt_context)
Để triển khai các kiến trúc Học máy (ML) hiệu quả, việc phân biệt chuỗi lời nhắc với các thuật ngữ tương tự trong lĩnh vực Trí tuệ nhân tạo là rất hữu ích:
Bằng cách tận dụng chuỗi lời nhắc, các nhóm có thể xây dựng các ứng dụng mạnh mẽ tích hợp logic, truy xuất dữ liệu và nhận dạng hành động . Để quản lý các tập dữ liệu và huấn luyện các mô hình thị giác hỗ trợ các chuỗi này, Nền tảng Ultralytics cung cấp một giải pháp tập trung cho việc chú thích, huấn luyện và triển khai.