Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Gợi ý theo chuỗi suy luận (Chain-of-Thought Prompting)

Khám phá phương pháp gợi ý Chuỗi suy nghĩ (Chain-of-Thought - CoT) để tăng cường khả năng suy luận của AI. Tìm hiểu cách chia nhỏ nhiệm vụ thành các bước logic giúp cải thiện việc tạo mã. Ultralytics YOLO26.

Phương pháp gợi ý Chuỗi suy nghĩ (Chain-of-Thought - CoT) là một kỹ thuật tiên tiến trong kỹ thuật tạo lời nhắc, cho phép các mô hình ngôn ngữ lớn (LLM) giải quyết các nhiệm vụ suy luận phức tạp bằng cách chia nhỏ chúng thành các bước logic trung gian. Thay vì yêu cầu mô hình cung cấp câu trả lời cuối cùng ngay lập tức, CoT khuyến khích hệ thống tạo ra một "chuỗi suy nghĩ" mô phỏng quá trình giải quyết vấn đề của con người. Quá trình suy luận từng bước này cải thiện đáng kể hiệu suất trong các nhiệm vụ liên quan đến số học, logic ký hiệu và suy luận thông thường, làm thay đổi cách chúng ta tương tác với các hệ thống Trí tuệ nhân tạo (AI) .

Cơ chế suy luận

Các mô hình ngôn ngữ tiêu chuẩn thường gặp khó khăn với các bài toán nhiều bước vì chúng cố gắng ánh xạ trực tiếp đầu vào đến đầu ra chỉ trong một lần xử lý. Cách tiếp cận "hộp đen" này có thể dẫn đến lỗi, đặc biệt khi bước nhảy logic quá lớn. Phương pháp gợi ý theo chuỗi suy luận giải quyết vấn đề này bằng cách chèn các bước suy luận giữa câu hỏi đầu vào và đầu ra cuối cùng.

Quá trình này thường diễn ra theo hai cách:

  • CoT không cần dữ liệu huấn luyện (Zero-Shot CoT): Người dùng thêm một cụm từ kích hoạt đơn giản như "Hãy suy nghĩ từng bước một" vào lời nhắc. Điều này kích hoạt khả năng suy luận tiềm ẩn của mô hình mà không cần các ví dụ cụ thể.
  • CoT với số lượng mẫu ít: Đề bài bao gồm một vài ví dụ (mẫu) về các câu hỏi được ghép nối với các bước giải chi tiết. Điều này tận dụng học tập với số lượng mẫu ít để cho mô hình biết chính xác cách cấu trúc logic của nó trước khi giải quyết một vấn đề mới.

Bằng cách tạo ra các lập luận trung gian một cách rõ ràng, mô hình có nhiều cơ hội hơn để tự sửa lỗi và cung cấp sự minh bạch về cách nó đi đến kết luận. Điều này rất quan trọng để giảm thiểu ảo giác trong các mô hình học tập tuyến tính (LLM) , nơi mà nếu không có điều này, các mô hình có thể tự tin đưa ra những thông tin không chính xác.

Các Ứng dụng Thực tế

Mặc dù ban đầu được phát triển cho logic dựa trên văn bản, phương pháp gợi ý bằng chuỗi suy nghĩ (Chain-of-Thought prompting) có những ứng dụng mạnh mẽ khi kết hợp với các lĩnh vực trí tuệ nhân tạo khác, chẳng hạn như thị giác máy tính và tạo mã.

1. Nâng cao khả năng tạo mã cho thị giác máy tính

Các nhà phát triển sử dụng CoT để hướng dẫn các LLM viết các kịch bản phần mềm phức tạp cho các tác vụ như phát hiện đối tượng. Thay vì một yêu cầu mơ hồ như "viết mã để tìm ô tô", một lời nhắc CoT có thể cấu trúc yêu cầu như sau: "Đầu tiên, nhập các thư viện cần thiết. Thứ hai, tải mô hình đã được huấn luyện trước. Thứ ba, xác định nguồn hình ảnh. Cuối cùng, chạy vòng lặp dự đoán." Cách tiếp cận có cấu trúc này đảm bảo mã được tạo ra cho các mô hình như YOLO26 là chính xác về mặt cú pháp và logic.

2. Quyết định tự chủ

Trong lĩnh vực xe tự hành , các hệ thống phải xử lý dữ liệu hình ảnh và đưa ra các quyết định quan trọng về an toàn. Phương pháp Chuỗi tư duy cho phép hệ thống diễn đạt logic của nó: "Tôi detect Một người đi bộ gần vạch kẻ đường. Người đi bộ đang quay mặt về phía đường. Đèn giao thông đang xanh đối với tôi, nhưng người đi bộ có thể bước ra bất cứ lúc nào. Do đó, tôi sẽ giảm tốc độ và chuẩn bị dừng lại." Điều này giúp các quyết định của AI có thể giải thích được và phù hợp với các nguyên tắc Trí tuệ nhân tạo có thể giải thích (XAI) .

Chuỗi suy luận trong thực tiễn

Mặc dù CoT chủ yếu là một kỹ thuật xử lý ngôn ngữ tự nhiên, nhưng nó có thể được triển khai bằng lập trình để đảm bảo tương tác nhất quán với các mô hình thị giác. Tiếp theo là... Python Ví dụ này minh họa cách một nhà phát triển có thể cấu trúc một lời nhắc để hướng dẫn một LLM (được mô phỏng ở đây) tạo ra mã suy luận hợp lệ cho Nền tảng Ultralytics .

# Example of structuring a Chain-of-Thought prompt for an LLM
# This prompt guides the model to write a valid YOLO26 inference script

cot_prompt = """
Task: Write a Python script to detect objects using YOLO26.

Chain of Thought:
1. Import the YOLO class from the 'ultralytics' library.
2. Load the 'yolo26n.pt' model weights (the latest nano model).
3. Load a sample image using a URL or local path.
4. Run the predict() function and save the results.

Based on these steps, generate the Python code below:
"""

# In a real application, you would send 'cot_prompt' to an LLM API
print(f"Structured Prompt for LLM:\n{cot_prompt}")

Phân biệt các khái niệm liên quan

Điều quan trọng là phải phân biệt phương pháp gợi ý bằng chuỗi suy nghĩ (Chain-of-Thought prompting) với các thuật ngữ tương tự trong lĩnh vực Học máy (Machine Learning - ML) :

  • Chuỗi lời nhắc (Prompt Chaining ): Phương pháp này liên quan đến việc kết nối nhiều lệnh gọi mô hình riêng biệt, trong đó đầu ra của bước này trở thành đầu vào của bước tiếp theo. CoT (Cognitive To Think - Suy luận nội tại) diễn ra trong một lời nhắc duy nhất để khơi gợi suy luận nội bộ, trong khi chuỗi lời nhắc điều phối quy trình làm việc trải rộng trên nhiều tương tác.
  • Mô hình tạo sinh tăng cường bằng truy xuất (RAG) : RAG tập trung vào việc thu thập dữ liệu bên ngoài (như tài liệu hoặc cơ sở dữ liệu) để xây dựng kiến ​​thức cho mô hình. CoT tập trung vào chính quá trình suy luận . Thông thường, hai mô hình này được kết hợp – sử dụng RAG để thu thập dữ liệu và CoT để suy luận về chúng.
  • Điều chỉnh gợi ý (Prompt Tuning ): Đây là phương pháp tinh chỉnh hiệu quả về tham số, tối ưu hóa các gợi ý mềm liên tục (vectơ) trong quá trình huấn luyện. CoT là một chiến lược ngôn ngữ tự nhiên rời rạc được áp dụng trong quá trình suy luận thời gian thực mà không làm thay đổi trọng số của mô hình .

Triển vọng tương lai

Khi các mô hình nền tảng tiếp tục phát triển, việc sử dụng phương pháp gợi ý chuỗi suy nghĩ (Chain-of-Thought prompting) đang trở thành một phương pháp thực hành tốt nhất để khai thác tối đa tiềm năng của chúng. Nghiên cứu từ các nhóm như Google DeepMind cho thấy rằng khi mô hình tăng kích thước, khả năng thực hiện suy luận chuỗi suy nghĩ của chúng được cải thiện đáng kể. Sự phát triển này đang mở đường cho các tác nhân tự động đáng tin cậy hơn, có khả năng xử lý các quy trình công việc phức tạp trong các ngành công nghiệp từ chăm sóc sức khỏe đến sản xuất thông minh .

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay