Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Gợi ý theo chuỗi suy luận (Chain-of-Thought Prompting)

Tăng cường khả năng suy luận AI bằng cách sử dụng chain-of-thought prompting! Nâng cao độ chính xác, tính minh bạch và khả năng lưu giữ ngữ cảnh cho các tác vụ phức tạp, đa bước.

Gợi ý Chuỗi Suy nghĩ (CoT) là một kỹ thuật tinh vi trong kỹ thuật gợi ý, được thiết kế để nâng cao khả năng lập luận của các Mô hình Ngôn ngữ Lớn (LLM) . Thay vì yêu cầu mô hình AI đưa ra câu trả lời ngay lập tức cho một truy vấn phức tạp, gợi ý CoT hướng dẫn mô hình chia nhỏ vấn đề thành một loạt các bước trung gian, logic. Phương pháp này mô phỏng các quy trình giải quyết vấn đề của con người, cho phép mô hình "suy nghĩ thành tiếng" trước khi đi đến kết luận cuối cùng. Bằng cách tạo ra một chuỗi các bước lập luận, mô hình có thể cải thiện đáng kể hiệu suất của mình đối với các tác vụ đòi hỏi số học, lập luận theo lẽ thường và logic biểu tượng. Phương pháp này đã được phổ biến bởi các nhà nghiên cứu tại Google Brain , chứng minh rằng các quy trình suy nghĩ có cấu trúc dẫn đến kết quả đầu ra của Trí tuệ Nhân tạo (AI) đáng tin cậy và chính xác hơn.

Cơ chế của Chuỗi suy nghĩ

Hiệu quả của CoT nằm ở khả năng phân tích các tác vụ phức tạp thành các thành phần dễ quản lý. Điều này không chỉ giúp mô hình duy trì tính mạch lạc mà còn minh bạch về cách thức câu trả lời được rút ra, một yếu tố then chốt trong AI có thể giải thích (XAI) . Có hai cách chính để triển khai chiến lược này:

  • Zero-Shot CoT : Phương pháp này bao gồm việc thêm một cụm từ kích hoạt như "Hãy suy nghĩ từng bước một" vào cuối lời nhắc. Như đã mô tả trong nghiên cứu về Zero-Shot Reasoners , hướng dẫn đơn giản này kích hoạt khả năng suy luận của mô hình mà không cần ví dụ cụ thể, tận dụng phương pháp học tập zero-shot để xử lý các nhiệm vụ mới.
  • Few-Shot CoT : Trong trường hợp này, lời nhắc bao gồm một vài ví dụ về các câu hỏi kèm theo giải pháp từng bước. Phương pháp này sử dụng kỹ thuật học few-shot , trong đó mô hình học được mô hình lập luận từ ngữ cảnh được cung cấp và áp dụng vào dữ liệu đầu vào mới.

Các Ứng dụng Thực tế

Phương pháp gợi ý chuỗi suy nghĩ đang chuyển đổi cách các nhà phát triển xây dựng ứng dụng trên nhiều lĩnh vực khác nhau, đặc biệt là khi độ chính xác và logic là tối quan trọng.

  1. Phân tích Dữ liệu Phức tạp : Trong các lĩnh vực như tài chính hoặc phân tích dữ liệu , CoT được sử dụng để hướng dẫn các mô hình thực hiện các phép tính nhiều giai đoạn. Ví dụ, một nhà phân tích có thể yêu cầu AI "Đầu tiên, trích xuất số liệu doanh thu của Quý 1, sau đó điều chỉnh theo lạm phát bằng chỉ số CPI, và cuối cùng so sánh tốc độ tăng trưởng với năm tài chính trước". Cách tiếp cận có cấu trúc này giúp giảm thiểu các lỗi tính toán thường gặp trong các câu hỏi trả lời trực tiếp.
  2. Tạo mã và gỡ lỗi: Các nhà phát triển sử dụng CoT để tạo mã mạnh mẽ cho tầm nhìn máy tính (CV) Nhiệm vụ. Thay vì chỉ yêu cầu một tập lệnh, người dùng có thể yêu cầu mô hình phác thảo logic để tải tập dữ liệu, cấu hình kiến trúc mô hình và thực hiện vòng lặp huấn luyện. Điều này đảm bảo rằng các tập lệnh được tạo cho các thư viện như ultralytics có cơ sở logic và cú pháp chính xác.

Ví dụ mã

Mặc dù CoT là một kỹ thuật dựa trên văn bản, nhưng nó thường được sử dụng để tạo ra chính xác Python Mã cho quy trình làm việc học máy. Ví dụ sau đây minh họa cách cấu trúc chuỗi nhắc nhở trong Python để đưa ra giải pháp từng bước cho việc sử dụng YOLO11 để detect các vật thể.

# Example of a Chain-of-Thought prompt structure for generating YOLO11 code
prompt = """
Task: Write a Python script to detect objects in a video stream using YOLO11.

Chain of Thought:
1. Import the YOLO class from the ultralytics package.
2. Load the pre-trained 'yolo11n.pt' model weights.
3. Define the source as '0' for the webcam or a video file path.
4. Run the predict() method with show=True to visualize results in real-time.

Now, generate the Python code based on these steps.
"""

print(f"Sending the following prompt to LLM:\n{prompt}")

So sánh với các khái niệm liên quan

Điều quan trọng là phải phân biệt lời nhắc Chuỗi suy nghĩ với các kỹ thuật Học máy (ML) khác:

  • Chuỗi nhắc nhở : Trong khi CoT diễn ra trong một chu kỳ nhắc nhở-phản hồi duy nhất, chuỗi nhắc nhở liên quan đến việc chia nhỏ một tác vụ thành một chuỗi các lệnh gọi API riêng biệt, trong đó đầu ra của một lệnh nhắc nhở trở thành đầu vào cho lệnh tiếp theo. CoT tập trung vào suy luận nội bộ, trong khi chuỗi tập trung vào việc điều phối quy trình làm việc.
  • Retrieval-Augmented Generation (RAG) : RAG liên quan đến việc lấy dữ liệu bên ngoài để củng cố kiến thức của mô hình trước khi tạo ra câu trả lời. CoT có thể được kết hợp với RAG (ví dụ: "Đầu tiên, lấy tài liệu, sau đó suy luận về nội dung của nó"), nhưng CoT đề cập cụ thể đến cấu trúc suy luận, chứ không phải cơ chế truy xuất dữ liệu.
  • Điều chỉnh nhắc nhở : Đây là phương pháp điều chỉnh hiệu quả tham số (PEFT) giúp tối ưu hóa các nhắc nhở mềm (vector) liên tục trong quá trình huấn luyện. Ngược lại, CoT là chiến lược nhắc nhở ngôn ngữ tự nhiên, rời rạc được áp dụng tại thời điểm suy luận mà không thay đổi trọng số mô hình.

Bằng cách tích hợp tính năng gợi ý Chuỗi Tư duy, các nhà phát triển có thể khai thác toàn bộ tiềm năng của AI tạo sinh , đảm bảo rằng các mô hình không chỉ cung cấp câu trả lời mà còn chứng minh được tính hợp lý logic của các giải pháp. Điều này rất cần thiết để triển khai các tác nhân AI đáng tin cậy trong các môi trường quan trọng.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay